ความน่าจะเป็นและสถิติต่างกันอย่างไรและทำไมพวกเขาถึงศึกษาร่วมกัน
ความน่าจะเป็นและสถิติต่างกันอย่างไรและทำไมพวกเขาถึงศึกษาร่วมกัน
คำตอบ:
คำตอบสั้น ๆ นี้ที่ฉันได้ยินจาก Persi Diaconis มีดังต่อไปนี้ปัญหาที่พิจารณาโดยความน่าจะเป็นและสถิตินั้นตรงกันข้ามกัน ในทฤษฎีความน่าจะเป็นเราพิจารณากระบวนการพื้นฐานบางอย่างซึ่งมีการสุ่มหรือความไม่แน่นอนที่จำลองโดยตัวแปรสุ่มและเราหาว่าเกิดอะไรขึ้น ในสถิติเราสังเกตสิ่งที่เกิดขึ้นและพยายามหาว่ากระบวนการพื้นฐานใดที่จะอธิบายการสังเกตเหล่านั้น
ฉันชอบตัวอย่างของขวดถั่วเยลลี่สีแดงและสีเขียว
probabilist เริ่มต้นด้วยการรู้สัดส่วนของแต่ละคนและถามถึงความน่าจะเป็นในการวาดถั่วเยลลี่สีแดง นักสถิติ infers สัดส่วนของถั่วเยลลี่สีแดงโดยการสุ่มตัวอย่างจากขวด
มันทำให้เข้าใจผิดว่าเพียงแค่พูดว่าสถิติเป็นเพียงการผกผันของความน่าจะเป็น ใช่คำถามเชิงสถิติเป็นคำถามเกี่ยวกับความน่าจะเป็นกลับด้าน แต่เป็นปัญหาผกผันที่ไม่ดีและสิ่งนี้สร้างความแตกต่างอย่างมากในแง่ของวิธีการแก้ไขปัญหา
ความน่าจะเป็นสาขาของคณิตศาสตร์บริสุทธิ์ - คำถามความน่าจะเป็นสามารถถูกวางและแก้ไขโดยใช้การให้เหตุผลเชิงเหตุผลและดังนั้นจึงมีหนึ่งคำตอบที่ถูกต้องสำหรับคำถามความน่าจะเป็นใด ๆ
คำถามเชิงสถิติสามารถแปลงเป็นคำถามความน่าจะเป็นได้โดยใช้แบบจำลองความน่าจะเป็น เมื่อเราตั้งสมมติฐานบางอย่างเกี่ยวกับกลไกการสร้างข้อมูลเราสามารถตอบคำถามเชิงสถิติโดยใช้ทฤษฎีความน่าจะเป็น อย่างไรก็ตามการกำหนดและการตรวจสอบแบบจำลองความน่าจะเป็นที่เหมาะสมเหล่านี้มีความสำคัญหรือสำคัญกว่าการวิเคราะห์ปัญหาในภายหลังโดยใช้แบบจำลองเหล่านี้
อาจกล่าวได้ว่าสถิติประกอบด้วยสองส่วน ส่วนแรกคือคำถามว่าจะกำหนดและประเมินแบบจำลองความน่าจะเป็นสำหรับปัญหาได้อย่างไร ความพยายามนี้อยู่ในโดเมนของ "ปรัชญาวิทยาศาสตร์" ส่วนที่สองเป็นคำถามของการได้รับคำตอบหลังจากมีการสันนิษฐานแบบจำลอง ส่วนหนึ่งของสถิตินี้เป็นเรื่องของทฤษฎีความน่าจะเป็นที่ประยุกต์ใช้และในทางปฏิบัติมีข้อตกลงที่เป็นธรรมของการวิเคราะห์เชิงตัวเลขเช่นกัน
ฉันชอบสิ่งนี้จากการเดิมพันที่คำนวณได้ของ Steve Skienna (ดูลิงก์สำหรับการสนทนาที่สมบูรณ์):
โดยสรุปทฤษฎีความน่าจะเป็นทำให้เราสามารถค้นหาผลที่ตามมาของโลกอุดมคติในขณะที่ทฤษฎีทางสถิติช่วยให้เราสามารถวัดขอบเขตที่โลกของเราเป็นอุดมคติ
ความน่าจะเป็นวิทยาศาสตร์บริสุทธิ์ (คณิตศาสตร์) สถิติเป็นข้อมูลเกี่ยวกับ พวกมันเชื่อมโยงกันเนื่องจากความน่าจะเป็นเป็นพื้นฐานบางอย่างสำหรับสถิติซึ่งเป็นแนวคิดพื้นฐาน
ตารางที่ 3.1 ชีวสถิติแบบหยั่งรู้ตอบคำถามนี้ด้วยแผนภาพที่แสดงด้านล่าง โปรดทราบว่าลูกศรทั้งหมดชี้ไปทางขวาสำหรับความน่าจะเป็นและชี้ไปทางซ้ายเพื่อดูสถิติ
ความน่าจะเป็น
ทั่วไป ---> เจาะจง
ประชากร ---> ตัวอย่าง
รุ่น ---> ข้อมูล
สถิติ
ทั่วไป <--- เฉพาะ
ประชากร <--- ตัวอย่าง
โมเดล <--- ข้อมูล
น่าจะเป็นคำตอบสำหรับคำถามเกี่ยวกับสิ่งที่จะเกิดขึ้นสถิติคำถามคำตอบเกี่ยวกับสิ่งที่ไม่เกิดขึ้น
ความน่าจะเป็นเกี่ยวกับการวัดความไม่แน่นอนในขณะที่สถิติกำลังอธิบายการเปลี่ยนแปลงในการวัดความสนใจบางอย่าง (เช่นทำไมระดับรายได้แตกต่างกันไป) ที่เราสังเกตในโลกแห่งความจริง
เราอธิบายการเปลี่ยนแปลงโดยใช้ปัจจัยที่สามารถสังเกตได้ (เช่นเพศระดับการศึกษาอายุเป็นต้นสำหรับรายได้) อย่างไรก็ตามเนื่องจากเราไม่สามารถคำนึงถึงปัจจัยที่เป็นไปได้ทั้งหมดที่มีผลกระทบต่อรายได้เราจึงทิ้งการเปลี่ยนแปลงที่ไม่สามารถอธิบายไว้เป็นข้อผิดพลาดแบบสุ่ม (ซึ่งเป็นที่มาของความไม่แน่นอนเชิงปริมาณ)
เนื่องจากเราระบุว่า "Variation = Effect ของปัจจัยที่สังเกตได้ + ผลของข้อผิดพลาดแบบสุ่ม" เราต้องการเครื่องมือที่มีให้โดยน่าจะเป็นสาเหตุของผลของข้อผิดพลาดแบบสุ่มในรูปแบบที่เราสังเกตเห็น
ตัวอย่างบางส่วนมีดังนี้:
ความไม่แน่นอนเชิงปริมาณ
ตัวอย่างที่ 1: คุณหมุนแม่พิมพ์แบบ 6 ด้าน ความน่าจะเป็นที่จะได้รับ 1 เป็นเท่าไหร่?
ตัวอย่างที่ 2 ความน่าจะเป็นที่รายได้ต่อปีของบุคคลที่เป็นผู้ใหญ่ที่เลือกโดยการสุ่มจากสหรัฐอเมริกาน้อยกว่า $ 40,000 คืออะไร
การอธิบายการเปลี่ยนแปลง
ตัวอย่างที่ 1: เราสังเกตว่ารายได้ต่อปีของบุคคลนั้นแตกต่างกันไป ปัจจัยใดที่อธิบายการเปลี่ยนแปลงของรายได้ของบุคคล?
เห็นได้ชัดว่าเราไม่สามารถบัญชีสำหรับปัจจัยทั้งหมด ดังนั้นเราจึงให้รายได้ของบุคคลกับปัจจัยที่สังเกตได้ (เช่นระดับการศึกษาเพศอายุ ฯลฯ ) และปล่อยให้การเปลี่ยนแปลงที่เหลืออยู่กับความไม่แน่นอน (หรือในภาษาของสถิติ: ข้อผิดพลาดแบบสุ่ม)
ตัวอย่างที่ 2: เราสังเกตว่าผู้บริโภคบางคนเลือกใช้ Tide เป็นส่วนใหญ่เวลาที่พวกเขาซื้อผงซักฟอกในขณะที่ผู้บริโภครายอื่นเลือกใช้ยี่ห้อ xyz ผงซักฟอก อะไรอธิบายถึงความแตกต่างในการเลือก? เราให้ความสำคัญกับการเปลี่ยนแปลงในตัวเลือกกับปัจจัยที่สังเกตได้เช่นราคาชื่อแบรนด์ ฯลฯ และปล่อยให้การเปลี่ยนแปลงที่ไม่สามารถอธิบายได้เกิดจากข้อผิดพลาดแบบสุ่ม (หรือความไม่แน่นอน)
เช่นเดียวกับสิ่งที่ Mark พูดไว้สถิติในอดีตเรียกว่าInverse Probabilityเนื่องจากสถิติพยายามอนุมานสาเหตุของเหตุการณ์ที่เกิดจากการสังเกตในขณะที่ความน่าจะเป็นน่าจะเป็นวิธีอื่น
ความน่าจะเป็นของเหตุการณ์เป็นระยะยาวความถี่ญาติ ดังนั้นโดยพื้นฐานแล้วมันจะบอกคุณถึงโอกาสที่จะได้รับ 'หัว' ในการโยนเหรียญครั้งต่อไปหรือได้รับ '3' ในการหมุนรอบถัดไปของการตาย
สถิติเป็นตัวชี้วัดเชิงตัวเลขใด ๆ คำนวณจากกลุ่มตัวอย่างประชากร ตัวอย่างเช่นค่าเฉลี่ยตัวอย่าง เราใช้สิ่งนี้เป็นสถิติซึ่งประมาณค่าเฉลี่ยของประชากรซึ่งเป็นพารามิเตอร์ โดยพื้นฐานแล้วมันให้ตัวอย่างสรุปกับคุณ
การศึกษาความน่าจะเป็นเหตุการณ์ที่น่าจะเป็น คุณรู้โดยสัญชาตญาณว่าความน่าจะเป็นคืออะไร
สถิติคือการศึกษาข้อมูล: แสดง (ใช้เครื่องมือเช่นแผนภูมิ) สรุป (ใช้วิธีการและส่วนเบี่ยงเบนมาตรฐาน ฯลฯ ) สรุปข้อสรุปเกี่ยวกับโลกที่ข้อมูลนั้นถูกดึง (เส้นที่พอดีกับข้อมูล ฯลฯ ) และ - นี่คือกุญแจ - การหาปริมาณว่าเรามั่นใจได้อย่างไรเกี่ยวกับข้อสรุปของเรา
เพื่อให้ทราบว่าเราสามารถสรุปได้อย่างไรเราต้องใช้ความน่าจะเป็น สมมติว่าคุณมีข้อมูลปีที่แล้วเกี่ยวกับปริมาณน้ำฝนในภูมิภาคที่คุณอาศัยและที่ฉันอาศัยอยู่ ปีที่แล้วฝนตกเฉลี่ย 1/4 นิ้วต่อสัปดาห์ที่คุณอยู่และ 3/8 นิ้วที่ฉันอาศัยอยู่ ดังนั้นเราสามารถพูดได้ว่าปริมาณน้ำฝนในภูมิภาคของฉันมีค่าเฉลี่ยมากกว่าที่คุณอาศัยอยู่ 50% ใช่ไหม? ไม่เร็วมาก Sparky มันอาจเป็นเรื่องบังเอิญ: บางทีมันก็เกิดขึ้นเมื่อปีที่แล้วที่ฉันอาศัยอยู่ เราสามารถใช้ความน่าจะเป็นในการประเมินว่าเรามั่นใจได้อย่างไรในบทสรุปของเราว่าบ้านของฉันน่ากลัวกว่า 50%
โดยพื้นฐานแล้วคุณสามารถพูดได้ว่าความน่าจะเป็นรากฐานทางคณิตศาสตร์สำหรับทฤษฎีสถิติ
ในทฤษฎีความน่าจะเป็นเราได้รับตัวแปรสุ่ม X1, X2, ... ในทางใดทางหนึ่งแล้วเราศึกษาคุณสมบัติของพวกเขาเช่นการคำนวณความน่าจะเป็น P {X1 \ in B1}, ศึกษาการลู่เข้าของ X1, X2, ... ฯลฯ .
ในสถิติทางคณิตศาสตร์เราได้รับ n การรับรู้ของตัวแปรสุ่มบางตัว X และชุดการแจกแจง D; ปัญหาคือการหาท่ามกลางการกระจายจาก D หนึ่งซึ่งมีแนวโน้มมากที่สุดในการสร้างข้อมูลที่เราสังเกต
ในความน่าจะเป็นการแจกแจงเป็นที่รู้จักและรู้ล่วงหน้า - คุณเริ่มต้นด้วยฟังก์ชันการแจกแจงความน่าจะเป็นที่รู้จัก (หรือคล้ายกัน) และตัวอย่างจากมัน
ในสถิติการกระจายไม่เป็นที่รู้จักล่วงหน้า มันอาจจะไม่รู้ด้วยซ้ำ สมมติฐานจะถูกตั้งสมมติฐานเกี่ยวกับการกระจายความน่าจะเป็นที่อยู่เบื้องหลังข้อมูลที่สังเกตได้เพื่อที่จะสามารถใช้ทฤษฎีความน่าจะเป็นกับข้อมูลนั้นเพื่อที่จะทราบว่าสมมติฐานว่างเปล่าเกี่ยวกับข้อมูลนั้นสามารถถูกปฏิเสธได้หรือไม่
มีการถกเถียงทางปรัชญาเกี่ยวกับว่ามีสิ่งที่น่าจะเป็นในโลกแห่งความเป็นจริงหรือไม่หรือว่ามันเป็นความคิดในอุดมคติของจินตนาการทางคณิตศาสตร์ของเราและการสังเกตทั้งหมดของเราจะเป็นเชิงสถิติเท่านั้น
สถิติคือการแสวงหาความจริงเมื่อเผชิญกับความไม่แน่นอน ความน่าจะเป็นเป็นเครื่องมือที่ช่วยให้เราสามารถวัดปริมาณความไม่แน่นอน
(ฉันได้เตรียมคำตอบให้อีกนานกว่านั้นแล้วซึ่งสันนิษฐานว่าสิ่งที่ถูกถามนั้นเป็นอะไรบางอย่างตามแนว "คุณจะอธิบายให้คุณยายของคุณฟังอย่างไร")
คำเตือน: ข้างต้นเป็นคำตอบทางคณิตศาสตร์ ในความเป็นจริงสถิติส่วนใหญ่ยังเกี่ยวกับการออกแบบ / ค้นหาแบบจำลองที่เหมาะสมการถามแบบจำลองที่มีอยู่การออกแบบการทดลองการจัดการกับข้อมูลที่ไม่สมบูรณ์ ฯลฯ "แบบจำลองทั้งหมดผิดพลาด"
ความน่าจะเป็น : รับพารามิเตอร์ที่รู้จักค้นหาความน่าจะเป็นในการสังเกตชุดข้อมูลเฉพาะ
สถิติ : กำหนดชุดข้อมูลที่สังเกตได้เป็นพิเศษทำการอนุมานเกี่ยวกับพารามิเตอร์ที่อาจเป็น
สถิติคือ "อัตนัย" และ "ศิลปะมากกว่าวิทยาศาสตร์" (เทียบกับความน่าจะเป็น)
นักสถิติที่แตกต่างกันจะให้คำตอบที่ต่างกันและยืดยาว
ความแตกต่างระหว่างความน่าจะเป็นและสถิติคือความน่าจะเป็นไม่มีข้อผิดพลาด เรามั่นใจในความน่าจะเป็นเพราะเรารู้แน่ชัดว่ามีกี่ด้านที่มีเหรียญหรือจำนวนของคาราเมลสีฟ้าในแจกัน แต่ในสถิติเราตรวจสอบประชากรจำนวนหนึ่งจากสิ่งที่เราตรวจสอบและจากนี้เราพยายามที่จะเห็นความจริง แต่มักจะมีข้อสรุปที่ผิดร้อยละ สิ่งเดียวในสถิติที่เป็นจริงคือนี่เป็นความผิดพลาด% ซึ่งจริงๆแล้วคือความน่าจะเป็น
ข้อความของ Savage Foundations of Statistics ได้ถูกอ้างถึงใน Google Scholar มากกว่า 12,000 ครั้ง [3] มันบอกต่อไปนี้
เป็นที่ตกลงกันอย่างเป็นเอกฉันท์ว่าสถิติขึ้นอยู่กับความน่าจะเป็น แต่สำหรับความน่าจะเป็นและความเชื่อมโยงกับสถิตินั้นไม่ค่อยมีความเห็นที่ขัดแย้งกันและความล้มเหลวของการสื่อสารตั้งแต่หอคอยแห่งบาเบล ไม่ต้องสงสัยเลยว่าความขัดแย้งส่วนใหญ่เป็นเพียงศัพท์และจะหายไปภายใต้การวิเคราะห์ที่คมชัดเพียงพอ
https://en.wikipedia.org/wiki/Foundations_of_statistics
ดังนั้นประเด็นที่น่าจะเป็นทฤษฎีเป็นรากฐานของสถิติแทบจะไม่แน่นอน ทุกอย่างเป็นเกมที่ยุติธรรม
แต่ในการพยายามที่จะเป็นประโยชน์มากขึ้นในทางปฏิบัติด้วยคำตอบ ...
อย่างไรก็ตามทฤษฎีความน่าจะเป็นมีหลายสิ่งที่น่าสนใจทางคณิตศาสตร์เป็นส่วนใหญ่และไม่เกี่ยวข้องโดยตรงกับสถิติ ยิ่งกว่านั้นหัวข้อในสถิติมากมายไม่เกี่ยวข้องกับทฤษฎีความน่าจะเป็น
https://en.wikipedia.org/wiki/Probability_and_statistics
ข้างต้นไม่ได้ละเอียดถี่ถ้วนหรือมีอำนาจ แต่อย่างใด แต่ฉันเชื่อว่ามันมีประโยชน์
โดยทั่วไปแล้วมันช่วยให้ฉันเห็นสิ่งต่าง ๆ เช่น ...
คณิตศาสตร์แบบต่อเนื่อง>>ทฤษฎีความน่าจะเป็น>>สถิติ
โดยเฉลี่ยแล้วแต่ละฐานจะถูกใช้อย่างหนักในฐานรากของรุ่นถัดไป นั่นคือจุดตัดขนาดใหญ่ในวิธีที่เราศึกษารากฐานของถัดไป
PS มีสถิติเชิงอุปนัยและนิรนัยนั่นไม่ใช่ความแตกต่าง
หลายคนและนักคณิตศาสตร์กล่าวว่า 'สถิติเป็นสิ่งที่ตรงกันข้ามกับความน่าจะเป็น' แต่มันไม่ถูกต้องนัก วิธีการของใกล้หรือวิธีการในการแก้ปัญหาเหล่านี้ 2 จะแตกต่างกันอย่างสิ้นเชิง แต่พวกเขาจะเชื่อมต่อกัน
ฉันจะหมายถึงเพื่อนของฉัน John D Cook .....
"ฉันชอบตัวอย่างของถั่วเยลลี่สีแดงและสีเขียว
probabilist เริ่มต้นด้วยการรู้สัดส่วนของแต่ละคนและบอกว่าพบความน่าจะเป็นของการวาดถั่วเยลลี่สีแดง นักสถิติทำให้สัดส่วนของถั่วเยลลี่สีแดงโดยสุ่มตัวอย่างจากขวด "
ตอนนี้สัดส่วนของถั่วเยลลี่สีแดงที่ได้จากการสุ่มตัวอย่างจากโถจะถูกใช้โดย probabilist เพื่อค้นหาความน่าจะเป็นในการวาดถั่วแดงจากโถ
ลองพิจารณาตัวอย่างนี้ ---- >>>
ในการสอบ 30% ของนักเรียนล้มเหลวในวิชาฟิสิกส์ 25% ล้มเหลวในวิชาคณิตศาสตร์ 12% ล้มเหลวทั้งในวิชาฟิสิกส์และคณิตศาสตร์ นักเรียนถูกสุ่มเลือกค้นหาความน่าจะเป็นที่นักเรียนล้มเหลวในวิชาฟิสิกส์ถ้าเป็นที่รู้กันว่าเขาล้มเหลวในวิชาคณิตศาสตร์
ผลรวมข้างต้นเป็นปัญหาของความน่าจะเป็น แต่ถ้าเราดูอย่างระมัดระวังเราจะพบว่าผลรวมนั้นมาพร้อมกับข้อมูลสถิติบางอย่าง
นักเรียน 30% ล้มเหลวในวิชาฟิสิกส์ 25% "" "maths '' 'นี่คือความถี่โดยทั่วไปถ้าคำนวณเปอร์เซ็นต์ดังนั้นเราจึงได้รับข้อมูลทางสถิติซึ่งจะช่วยให้เราค้นพบความน่าจะเป็น
ความน่าจะเป็นและสถิตินั้นมีความสัมพันธ์กันอย่างมากหรือเป็นผู้ปกครองเราสามารถบอกได้ว่าความน่าจะเป็นนั้นขึ้นอยู่กับสถิติเป็นอย่างมาก
คำว่า "สถิติ" นั้นถูกอธิบายอย่างสวยงามโดย JC Maxwell ในบทความโมเลกุล (ในNature 8, 1873, pp. 437–441) ให้ฉันอ้างอิงข้อความที่เกี่ยวข้อง:
เมื่อสมาชิกที่ทำงานในหมวด F ได้รับรายงานการสำรวจสำมะโนประชากรหรือเอกสารอื่น ๆ ที่มีข้อมูลตัวเลขทางเศรษฐศาสตร์และสังคมศาสตร์พวกเขาเริ่มต้นด้วยการกระจายประชากรทั้งหมดออกเป็นกลุ่มตามอายุรายได้ภาษีการศึกษา ความเชื่อทางศาสนาหรือความผิดทางอาญา จำนวนบุคคลนั้นยิ่งใหญ่เกินกว่าจะอนุญาตให้ติดตามประวัติของแต่ละคนแยกกันดังนั้นเพื่อลดการใช้แรงงานของพวกเขาภายในขอบเขตที่ จำกัด ของมนุษย์พวกเขาให้ความสนใจกับกลุ่มประดิษฐ์จำนวนน้อย จำนวนบุคคลที่แตกต่างกันในแต่ละกลุ่มและไม่ใช่สถานะที่แตกต่างกันของแต่ละบุคคลเป็นตัวเลขหลักที่พวกเขาทำงาน
แน่นอนว่านี่ไม่ใช่วิธีเดียวในการศึกษาธรรมชาติของมนุษย์ เราอาจสังเกตเห็นพฤติกรรมของผู้ชายแต่ละคนและเปรียบเทียบกับพฤติกรรมที่ตัวละครก่อนหน้าและสถานการณ์ปัจจุบันของพวกเขาตามทฤษฎีที่ดีที่สุดที่มีอยู่จะนำเราไปสู่ความคาดหวัง ผู้ที่ฝึกฝนวิธีนี้พยายามที่จะพัฒนาความรู้เกี่ยวกับองค์ประกอบของธรรมชาติมนุษย์ในแบบเดียวกับที่นักดาราศาสตร์ทำการแก้ไของค์ประกอบของดาวเคราะห์โดยการเปรียบเทียบตำแหน่งที่แท้จริงกับองค์ประกอบที่ได้รับจากการอนุมาน การศึกษาธรรมชาติของมนุษย์โดยพ่อแม่และครูโดยนักประวัติศาสตร์และรัฐบุรุษจึงมีความแตกต่างจากที่ดำเนินการโดย registrars และ tabulators และรัฐบุรุษผู้ศรัทธาในร่าง หนึ่งอาจถูกเรียกว่าประวัติศาสตร์และอื่น ๆ วิธีการทางสถิติ
สมการของพลวัตแสดงกฎของวิธีการทางประวัติศาสตร์ที่ใช้กับสสารอย่างสมบูรณ์ แต่การใช้สมการเหล่านี้แสดงถึงความรู้ที่สมบูรณ์แบบของข้อมูลทั้งหมด แต่ส่วนที่เล็กที่สุดของสสารที่เราสามารถทำการทดลองได้ประกอบด้วยโมเลกุลนับล้าน ๆ อันซึ่งไม่ได้เป็นสสารที่เราคุ้นเคย ดังนั้นเราจึงไม่สามารถยืนยันการเคลื่อนที่ที่แท้จริงของโมเลกุลใด ๆ เหล่านี้ดังนั้นเราจึงจำเป็นต้องละทิ้งวิธีการทางประวัติศาสตร์ที่เข้มงวดและใช้วิธีการทางสถิติในการจัดการกับกลุ่มโมเลกุลขนาดใหญ่
เขาให้คำอธิบายของวิธีการทางสถิติในงานอื่น ๆ ตัวอย่างเช่น "ในวิธีการทางสถิติของการตรวจสอบเราไม่ได้ติดตามระบบในระหว่างการเคลื่อนไหว แต่เราจะแก้ไขความสนใจของเราในช่วงใดช่วงหนึ่งและตรวจสอบว่าระบบอยู่ในช่วงนั้นหรือไม่และเมื่อมันเข้าสู่ระยะ และเมื่อมันจากไป "(Trans. Cambridge Philos. Soc. 12, 1879, pp. 547–570)
มีอีกหนึ่งข้อความที่สวยงามของ Maxwell เกี่ยวกับ "ความน่าจะเป็น" (จากจดหมายถึง Campbell, 1850, พิมพ์ซ้ำในThe Life of James Clerk Maxwell , p. 143):
วิทยาศาสตร์ของตรรกะที่แท้จริงในปัจจุบันเป็นสิ่งที่แน่นอนเท่านั้นไม่แน่ใจหรือสงสัยทั้งหมดไม่มีใคร (โชคดี) เราต้องให้เหตุผล ดังนั้นตรรกะที่แท้จริงสำหรับโลกนี้คือแคลคูลัสของความน่าจะเป็นซึ่งคำนึงถึงขนาดของความน่าจะเป็น (ซึ่งเป็นหรือที่ควรจะอยู่ในใจของคนที่สมเหตุสมผล)
ดังนั้นเราจึงสามารถพูดได้:
- ในสถิติเรากำลัง "ให้ความสนใจกับกลุ่มเทียมจำนวนน้อย" หรือปริมาณ เรากำลังจัดทำแคตตาล็อกหรือการสำรวจสำมะโนประชากร
- ในความเป็นไปได้เรากำลังคำนวณความไม่แน่นอนของเราเกี่ยวกับเหตุการณ์หรือปริมาณ
ทั้งสองมีความแตกต่างกันและเราสามารถทำได้โดยไม่มีอีก
ตัวอย่างเช่นหากเราทำการสำรวจสำมะโนประชากรของประชากรทั้งหมดของประเทศอย่างสมบูรณ์และนับจำนวนคนที่แน่นอนของกลุ่มเฉพาะเช่นอายุเพศและอื่น ๆ เรากำลังทำสถิติ ไม่มีความไม่แน่นอน - ความน่าจะเป็น - เกี่ยวข้องเนื่องจากตัวเลขที่เราค้นหานั้นแน่นอนและเป็นที่รู้จัก
ในทางกลับกันลองนึกภาพคนที่เดินผ่านหน้าเราไปตามถนนและเราสงสัยว่าอายุของพวกเขาเป็นอย่างไร ในกรณีนี้เราไม่แน่ใจและเราใช้ความน่าจะเป็น แต่ไม่มีสถิติที่เกี่ยวข้องเนื่องจากเราไม่ได้ทำการสำรวจสำมะโนประชากรหรือแคตตาล็อก
แต่ทั้งสองก็สามารถเกิดขึ้นพร้อมกันได้ หากเราไม่สามารถทำการสำรวจสำมะโนประชากรของประชากรได้อย่างสมบูรณ์เราต้องเดาว่ามีกี่คนในกลุ่มอายุเพศที่เฉพาะเจาะจง ดังนั้นเราจึงใช้ความน่าจะเป็นขณะทำสถิติ ในทางกลับกันเราสามารถพิจารณาข้อมูลสถิติที่แน่นอนเกี่ยวกับอายุของผู้คนและจากข้อมูลดังกล่าวพยายามที่จะคาดเดาได้ดีขึ้นเกี่ยวกับคนที่ผ่านหน้าเรา ดังนั้นเราจึงใช้สถิติขณะที่ตัดสินใจเลือกความน่าจะเป็น