ความน่าจะเป็นและสถิติแตกต่างกันอย่างไร


คำตอบ:


114

คำตอบสั้น ๆ นี้ที่ฉันได้ยินจาก Persi Diaconis มีดังต่อไปนี้ปัญหาที่พิจารณาโดยความน่าจะเป็นและสถิตินั้นตรงกันข้ามกัน ในทฤษฎีความน่าจะเป็นเราพิจารณากระบวนการพื้นฐานบางอย่างซึ่งมีการสุ่มหรือความไม่แน่นอนที่จำลองโดยตัวแปรสุ่มและเราหาว่าเกิดอะไรขึ้น ในสถิติเราสังเกตสิ่งที่เกิดขึ้นและพยายามหาว่ากระบวนการพื้นฐานใดที่จะอธิบายการสังเกตเหล่านั้น


2
ดังนั้นสถิติตั้งข้อสังเกตว่าเกิดอะไรขึ้นในโลกทางกายภาพตั้งทฤษฎีเกี่ยวกับกระบวนการพื้นฐานแล้วพบกระบวนการใช้มันในแง่ของความน่าจะเป็นในการทำนายว่าจะเกิดอะไรขึ้นต่อไป
hslc

ฉันไม่ใช่นักสถิติ แต่จากความเข้าใจของฉันฉันจะบอกว่าใช่เป็นส่วนหนึ่งของสถิติที่ทำ
Mark Meckes

16
การเหนี่ยวนำเทียบกับการหัก?
เปาโล

6
เช่นเดียวกับเปาโลกล่าวว่าทฤษฎีความน่าจะเป็นส่วนใหญ่เกี่ยวข้องกับส่วนที่หักทอนสถิติที่มีส่วนอุปนัยของกระบวนการสร้างแบบจำลองที่มีความไม่แน่นอน บางทีมันน่าสนใจที่จะพูดถึงว่าถ้าใครคิดว่าการให้เหตุผลเชิงอุปนัยมีเหตุผลน่าจะสอดคล้องกันจริง ๆ แล้วผลลัพธ์ที่ได้คือสถิติแบบเบย์และน่าสนใจกว่านี้อาจมาจากทฤษฎีความน่าจะเป็น ดังนั้นสถิติแบบเบย์จึงใช้ทฤษฎีความน่าจะเป็นโดยทั่วไป
Thies Heidecke

1
@Paolo การอนุมานทางสถิติถือเป็น "สถิติเชิงอุปนัย"
kervin

77

ฉันชอบตัวอย่างของขวดถั่วเยลลี่สีแดงและสีเขียว

probabilist เริ่มต้นด้วยการรู้สัดส่วนของแต่ละคนและถามถึงความน่าจะเป็นในการวาดถั่วเยลลี่สีแดง นักสถิติ infers สัดส่วนของถั่วเยลลี่สีแดงโดยการสุ่มตัวอย่างจากขวด


แต่นั่นไม่ใช่เพียงสูตรเท่านั้น นัก probabilist อาจถามว่า "ถ้าฉันวาดถั่วแดงสามอันแล้วความน่าจะเป็นที่สัดส่วนนั้นคือห้าสิบห้าสิบ"
โทมัส Ahle

2
@ThomasAhle: นั่นไม่ใช่คำถามความน่าจะเป็นที่กำหนดไว้อย่างดีเว้นแต่คุณจะสมมติว่าเป็นแบบจำลองความน่าจะเป็นพื้นฐานสำหรับการกระจายสีดั้งเดิม
Mark Meckes

55

มันทำให้เข้าใจผิดว่าเพียงแค่พูดว่าสถิติเป็นเพียงการผกผันของความน่าจะเป็น ใช่คำถามเชิงสถิติเป็นคำถามเกี่ยวกับความน่าจะเป็นกลับด้าน แต่เป็นปัญหาผกผันที่ไม่ดีและสิ่งนี้สร้างความแตกต่างอย่างมากในแง่ของวิธีการแก้ไขปัญหา

ความน่าจะเป็นสาขาของคณิตศาสตร์บริสุทธิ์ - คำถามความน่าจะเป็นสามารถถูกวางและแก้ไขโดยใช้การให้เหตุผลเชิงเหตุผลและดังนั้นจึงมีหนึ่งคำตอบที่ถูกต้องสำหรับคำถามความน่าจะเป็นใด ๆ

คำถามเชิงสถิติสามารถแปลงเป็นคำถามความน่าจะเป็นได้โดยใช้แบบจำลองความน่าจะเป็น เมื่อเราตั้งสมมติฐานบางอย่างเกี่ยวกับกลไกการสร้างข้อมูลเราสามารถตอบคำถามเชิงสถิติโดยใช้ทฤษฎีความน่าจะเป็น อย่างไรก็ตามการกำหนดและการตรวจสอบแบบจำลองความน่าจะเป็นที่เหมาะสมเหล่านี้มีความสำคัญหรือสำคัญกว่าการวิเคราะห์ปัญหาในภายหลังโดยใช้แบบจำลองเหล่านี้

อาจกล่าวได้ว่าสถิติประกอบด้วยสองส่วน ส่วนแรกคือคำถามว่าจะกำหนดและประเมินแบบจำลองความน่าจะเป็นสำหรับปัญหาได้อย่างไร ความพยายามนี้อยู่ในโดเมนของ "ปรัชญาวิทยาศาสตร์" ส่วนที่สองเป็นคำถามของการได้รับคำตอบหลังจากมีการสันนิษฐานแบบจำลอง ส่วนหนึ่งของสถิตินี้เป็นเรื่องของทฤษฎีความน่าจะเป็นที่ประยุกต์ใช้และในทางปฏิบัติมีข้อตกลงที่เป็นธรรมของการวิเคราะห์เชิงตัวเลขเช่นกัน

ดู: http://bactra.org/reviews/error/


2
ฉันรักคุณสำหรับคำตอบนี้
badatmath

16

ฉันชอบสิ่งนี้จากการเดิมพันที่คำนวณได้ของ Steve Skienna (ดูลิงก์สำหรับการสนทนาที่สมบูรณ์):

โดยสรุปทฤษฎีความน่าจะเป็นทำให้เราสามารถค้นหาผลที่ตามมาของโลกอุดมคติในขณะที่ทฤษฎีทางสถิติช่วยให้เราสามารถวัดขอบเขตที่โลกของเราเป็นอุดมคติ


13

ความน่าจะเป็นวิทยาศาสตร์บริสุทธิ์ (คณิตศาสตร์) สถิติเป็นข้อมูลเกี่ยวกับ พวกมันเชื่อมโยงกันเนื่องจากความน่าจะเป็นเป็นพื้นฐานบางอย่างสำหรับสถิติซึ่งเป็นแนวคิดพื้นฐาน


3
ความน่าจะเป็นคือคณิตศาสตร์บริสุทธิ์และสถิติใช้คณิตศาสตร์หรือไม่
hslc

4
สถิติอาจถูกนำไปใช้และอาจจะไม่; ยังคงแนวคิดของข้อมูลอยู่เสมอ

13

ตารางที่ 3.1 ชีวสถิติแบบหยั่งรู้ตอบคำถามนี้ด้วยแผนภาพที่แสดงด้านล่าง โปรดทราบว่าลูกศรทั้งหมดชี้ไปทางขวาสำหรับความน่าจะเป็นและชี้ไปทางซ้ายเพื่อดูสถิติ

ความน่าจะเป็น

ทั่วไป ---> เจาะจง

ประชากร ---> ตัวอย่าง

รุ่น ---> ข้อมูล

สถิติ

ทั่วไป <--- เฉพาะ

ประชากร <--- ตัวอย่าง

โมเดล <--- ข้อมูล


1
ดังนั้นสถิติมีความหมายเหมือนกันกับการวิเคราะห์ข้อมูล?
hslc

3
ฉันไม่เห็นความแตกต่างใด ๆ
Harvey Motulsky

3
การวิเคราะห์ข้อมูลบางอย่างไม่ได้อาศัยสถิติที่ใช้บ่อย
คุณพ่อ

11

น่าจะเป็นคำตอบสำหรับคำถามเกี่ยวกับสิ่งที่จะเกิดขึ้นสถิติคำถามคำตอบเกี่ยวกับสิ่งที่ไม่เกิดขึ้น


3
โดยคำจำกัดความนี้แม้ว่าช่วงเวลาการทำนายคือความน่าจะเป็นมากกว่าสถิติ
Glen_b

10

ความน่าจะเป็นเกี่ยวกับการวัดความไม่แน่นอนในขณะที่สถิติกำลังอธิบายการเปลี่ยนแปลงในการวัดความสนใจบางอย่าง (เช่นทำไมระดับรายได้แตกต่างกันไป) ที่เราสังเกตในโลกแห่งความจริง

เราอธิบายการเปลี่ยนแปลงโดยใช้ปัจจัยที่สามารถสังเกตได้ (เช่นเพศระดับการศึกษาอายุเป็นต้นสำหรับรายได้) อย่างไรก็ตามเนื่องจากเราไม่สามารถคำนึงถึงปัจจัยที่เป็นไปได้ทั้งหมดที่มีผลกระทบต่อรายได้เราจึงทิ้งการเปลี่ยนแปลงที่ไม่สามารถอธิบายไว้เป็นข้อผิดพลาดแบบสุ่ม (ซึ่งเป็นที่มาของความไม่แน่นอนเชิงปริมาณ)

เนื่องจากเราระบุว่า "Variation = Effect ของปัจจัยที่สังเกตได้ + ผลของข้อผิดพลาดแบบสุ่ม" เราต้องการเครื่องมือที่มีให้โดยน่าจะเป็นสาเหตุของผลของข้อผิดพลาดแบบสุ่มในรูปแบบที่เราสังเกตเห็น

ตัวอย่างบางส่วนมีดังนี้:

ความไม่แน่นอนเชิงปริมาณ

ตัวอย่างที่ 1: คุณหมุนแม่พิมพ์แบบ 6 ด้าน ความน่าจะเป็นที่จะได้รับ 1 เป็นเท่าไหร่?

ตัวอย่างที่ 2 ความน่าจะเป็นที่รายได้ต่อปีของบุคคลที่เป็นผู้ใหญ่ที่เลือกโดยการสุ่มจากสหรัฐอเมริกาน้อยกว่า $ 40,000 คืออะไร

การอธิบายการเปลี่ยนแปลง

ตัวอย่างที่ 1: เราสังเกตว่ารายได้ต่อปีของบุคคลนั้นแตกต่างกันไป ปัจจัยใดที่อธิบายการเปลี่ยนแปลงของรายได้ของบุคคล?

เห็นได้ชัดว่าเราไม่สามารถบัญชีสำหรับปัจจัยทั้งหมด ดังนั้นเราจึงให้รายได้ของบุคคลกับปัจจัยที่สังเกตได้ (เช่นระดับการศึกษาเพศอายุ ฯลฯ ) และปล่อยให้การเปลี่ยนแปลงที่เหลืออยู่กับความไม่แน่นอน (หรือในภาษาของสถิติ: ข้อผิดพลาดแบบสุ่ม)

ตัวอย่างที่ 2: เราสังเกตว่าผู้บริโภคบางคนเลือกใช้ Tide เป็นส่วนใหญ่เวลาที่พวกเขาซื้อผงซักฟอกในขณะที่ผู้บริโภครายอื่นเลือกใช้ยี่ห้อ xyz ผงซักฟอก อะไรอธิบายถึงความแตกต่างในการเลือก? เราให้ความสำคัญกับการเปลี่ยนแปลงในตัวเลือกกับปัจจัยที่สังเกตได้เช่นราคาชื่อแบรนด์ ฯลฯ และปล่อยให้การเปลี่ยนแปลงที่ไม่สามารถอธิบายได้เกิดจากข้อผิดพลาดแบบสุ่ม (หรือความไม่แน่นอน)


1
เกิดอะไรขึ้นถ้าข้อผิดพลาดแบบสุ่มมากกว่าปัจจัยที่สังเกตได้ตลอดเวลา
hslc

ในกรณีดังกล่าวคุณจะทำงานซ้ำโมเดลของคุณเนื่องจากไม่สอดคล้องกับความเป็นจริงอีกต่อไป

8

ความน่าจะเป็นคือการยอมรับความไม่แน่นอนในขณะที่สถิติเป็นสิ่งที่ประจักษ์และการแสวงหาความจริงอย่างมากมาย


ที่นี่ฉันกำลังคิดถึงความน่าจะเป็นประจำ / Bayesian ทั้งหมดและสถิติเชิงพรรณนา / เชิงสำรวจ / เชิงอนุมานทั้งหมด

7

เช่นเดียวกับสิ่งที่ Mark พูดไว้สถิติในอดีตเรียกว่าInverse Probabilityเนื่องจากสถิติพยายามอนุมานสาเหตุของเหตุการณ์ที่เกิดจากการสังเกตในขณะที่ความน่าจะเป็นน่าจะเป็นวิธีอื่น


6

ความน่าจะเป็นของเหตุการณ์เป็นระยะยาวความถี่ญาติ ดังนั้นโดยพื้นฐานแล้วมันจะบอกคุณถึงโอกาสที่จะได้รับ 'หัว' ในการโยนเหรียญครั้งต่อไปหรือได้รับ '3' ในการหมุนรอบถัดไปของการตาย

สถิติเป็นตัวชี้วัดเชิงตัวเลขใด ๆ คำนวณจากกลุ่มตัวอย่างประชากร ตัวอย่างเช่นค่าเฉลี่ยตัวอย่าง เราใช้สิ่งนี้เป็นสถิติซึ่งประมาณค่าเฉลี่ยของประชากรซึ่งเป็นพารามิเตอร์ โดยพื้นฐานแล้วมันให้ตัวอย่างสรุปกับคุณ

  • คุณสามารถรับสถิติได้จากตัวอย่างเท่านั้นมิฉะนั้นถ้าคุณคำนวณการวัดเชิงตัวเลขของประชากรมันจะเรียกว่าพารามิเตอร์ประชากร

6

การศึกษาความน่าจะเป็นเหตุการณ์ที่น่าจะเป็น คุณรู้โดยสัญชาตญาณว่าความน่าจะเป็นคืออะไร

สถิติคือการศึกษาข้อมูล: แสดง (ใช้เครื่องมือเช่นแผนภูมิ) สรุป (ใช้วิธีการและส่วนเบี่ยงเบนมาตรฐาน ฯลฯ ) สรุปข้อสรุปเกี่ยวกับโลกที่ข้อมูลนั้นถูกดึง (เส้นที่พอดีกับข้อมูล ฯลฯ ) และ - นี่คือกุญแจ - การหาปริมาณว่าเรามั่นใจได้อย่างไรเกี่ยวกับข้อสรุปของเรา

เพื่อให้ทราบว่าเราสามารถสรุปได้อย่างไรเราต้องใช้ความน่าจะเป็น สมมติว่าคุณมีข้อมูลปีที่แล้วเกี่ยวกับปริมาณน้ำฝนในภูมิภาคที่คุณอาศัยและที่ฉันอาศัยอยู่ ปีที่แล้วฝนตกเฉลี่ย 1/4 นิ้วต่อสัปดาห์ที่คุณอยู่และ 3/8 นิ้วที่ฉันอาศัยอยู่ ดังนั้นเราสามารถพูดได้ว่าปริมาณน้ำฝนในภูมิภาคของฉันมีค่าเฉลี่ยมากกว่าที่คุณอาศัยอยู่ 50% ใช่ไหม? ไม่เร็วมาก Sparky มันอาจเป็นเรื่องบังเอิญ: บางทีมันก็เกิดขึ้นเมื่อปีที่แล้วที่ฉันอาศัยอยู่ เราสามารถใช้ความน่าจะเป็นในการประเมินว่าเรามั่นใจได้อย่างไรในบทสรุปของเราว่าบ้านของฉันน่ากลัวกว่า 50%

โดยพื้นฐานแล้วคุณสามารถพูดได้ว่าความน่าจะเป็นรากฐานทางคณิตศาสตร์สำหรับทฤษฎีสถิติ


5

ในทฤษฎีความน่าจะเป็นเราได้รับตัวแปรสุ่ม X1, X2, ... ในทางใดทางหนึ่งแล้วเราศึกษาคุณสมบัติของพวกเขาเช่นการคำนวณความน่าจะเป็น P {X1 \ in B1}, ศึกษาการลู่เข้าของ X1, X2, ... ฯลฯ .

ในสถิติทางคณิตศาสตร์เราได้รับ n การรับรู้ของตัวแปรสุ่มบางตัว X และชุดการแจกแจง D; ปัญหาคือการหาท่ามกลางการกระจายจาก D หนึ่งซึ่งมีแนวโน้มมากที่สุดในการสร้างข้อมูลที่เราสังเกต


ดังนั้นเราสามารถหารูปแบบที่เรากำลังมองหาในตอนแรกเท่านั้น?
hslc

4

ในความน่าจะเป็นการแจกแจงเป็นที่รู้จักและรู้ล่วงหน้า - คุณเริ่มต้นด้วยฟังก์ชันการแจกแจงความน่าจะเป็นที่รู้จัก (หรือคล้ายกัน) และตัวอย่างจากมัน

ในสถิติการกระจายไม่เป็นที่รู้จักล่วงหน้า มันอาจจะไม่รู้ด้วยซ้ำ สมมติฐานจะถูกตั้งสมมติฐานเกี่ยวกับการกระจายความน่าจะเป็นที่อยู่เบื้องหลังข้อมูลที่สังเกตได้เพื่อที่จะสามารถใช้ทฤษฎีความน่าจะเป็นกับข้อมูลนั้นเพื่อที่จะทราบว่าสมมติฐานว่างเปล่าเกี่ยวกับข้อมูลนั้นสามารถถูกปฏิเสธได้หรือไม่

มีการถกเถียงทางปรัชญาเกี่ยวกับว่ามีสิ่งที่น่าจะเป็นในโลกแห่งความเป็นจริงหรือไม่หรือว่ามันเป็นความคิดในอุดมคติของจินตนาการทางคณิตศาสตร์ของเราและการสังเกตทั้งหมดของเราจะเป็นเชิงสถิติเท่านั้น


3

สถิติคือการแสวงหาความจริงเมื่อเผชิญกับความไม่แน่นอน ความน่าจะเป็นเป็นเครื่องมือที่ช่วยให้เราสามารถวัดปริมาณความไม่แน่นอน

(ฉันได้เตรียมคำตอบให้อีกนานกว่านั้นแล้วซึ่งสันนิษฐานว่าสิ่งที่ถูกถามนั้นเป็นอะไรบางอย่างตามแนว "คุณจะอธิบายให้คุณยายของคุณฟังอย่างไร")


3

(Ω,F,P)θ(Ω,F,Pθ)θ

θθ

คำเตือน: ข้างต้นเป็นคำตอบทางคณิตศาสตร์ ในความเป็นจริงสถิติส่วนใหญ่ยังเกี่ยวกับการออกแบบ / ค้นหาแบบจำลองที่เหมาะสมการถามแบบจำลองที่มีอยู่การออกแบบการทดลองการจัดการกับข้อมูลที่ไม่สมบูรณ์ ฯลฯ "แบบจำลองทั้งหมดผิดพลาด"


4
ถ้าถามว่า "เคมีคืออะไร" เราสามารถตอบว่ามันเป็นชุดของสมการเชิงอนุพันธ์ คำอธิบายของทฤษฎีทางคณิตศาสตร์สามารถทำให้เรามีความคิดเล็กน้อยเกี่ยวกับสิ่งที่เป็นเรื่องเกี่ยวกับ แต่มันไม่ได้เป็นเรื่องของตัวเอง
whuber

3

ความน่าจะเป็น : รับพารามิเตอร์ที่รู้จักค้นหาความน่าจะเป็นในการสังเกตชุดข้อมูลเฉพาะ

สถิติ : กำหนดชุดข้อมูลที่สังเกตได้เป็นพิเศษทำการอนุมานเกี่ยวกับพารามิเตอร์ที่อาจเป็น

สถิติคือ "อัตนัย" และ "ศิลปะมากกว่าวิทยาศาสตร์" (เทียบกับความน่าจะเป็น)

Example_

p

p=12HHH

18

HHHp

นักสถิติที่แตกต่างกันจะให้คำตอบที่ต่างกันและยืดยาว


3

ความแตกต่างระหว่างความน่าจะเป็นและสถิติคือความน่าจะเป็นไม่มีข้อผิดพลาด เรามั่นใจในความน่าจะเป็นเพราะเรารู้แน่ชัดว่ามีกี่ด้านที่มีเหรียญหรือจำนวนของคาราเมลสีฟ้าในแจกัน แต่ในสถิติเราตรวจสอบประชากรจำนวนหนึ่งจากสิ่งที่เราตรวจสอบและจากนี้เราพยายามที่จะเห็นความจริง แต่มักจะมีข้อสรุปที่ผิดร้อยละ สิ่งเดียวในสถิติที่เป็นจริงคือนี่เป็นความผิดพลาด% ซึ่งจริงๆแล้วคือความน่าจะเป็น


2

ข้อความของ Savage Foundations of Statistics ได้ถูกอ้างถึงใน Google Scholar มากกว่า 12,000 ครั้ง [3] มันบอกต่อไปนี้

เป็นที่ตกลงกันอย่างเป็นเอกฉันท์ว่าสถิติขึ้นอยู่กับความน่าจะเป็น แต่สำหรับความน่าจะเป็นและความเชื่อมโยงกับสถิตินั้นไม่ค่อยมีความเห็นที่ขัดแย้งกันและความล้มเหลวของการสื่อสารตั้งแต่หอคอยแห่งบาเบล ไม่ต้องสงสัยเลยว่าความขัดแย้งส่วนใหญ่เป็นเพียงศัพท์และจะหายไปภายใต้การวิเคราะห์ที่คมชัดเพียงพอ

https://en.wikipedia.org/wiki/Foundations_of_statistics

ดังนั้นประเด็นที่น่าจะเป็นทฤษฎีเป็นรากฐานของสถิติแทบจะไม่แน่นอน ทุกอย่างเป็นเกมที่ยุติธรรม

แต่ในการพยายามที่จะเป็นประโยชน์มากขึ้นในทางปฏิบัติด้วยคำตอบ ...

อย่างไรก็ตามทฤษฎีความน่าจะเป็นมีหลายสิ่งที่น่าสนใจทางคณิตศาสตร์เป็นส่วนใหญ่และไม่เกี่ยวข้องโดยตรงกับสถิติ ยิ่งกว่านั้นหัวข้อในสถิติมากมายไม่เกี่ยวข้องกับทฤษฎีความน่าจะเป็น

https://en.wikipedia.org/wiki/Probability_and_statistics

ข้างต้นไม่ได้ละเอียดถี่ถ้วนหรือมีอำนาจ แต่อย่างใด แต่ฉันเชื่อว่ามันมีประโยชน์

โดยทั่วไปแล้วมันช่วยให้ฉันเห็นสิ่งต่าง ๆ เช่น ...

คณิตศาสตร์แบบต่อเนื่อง>>ทฤษฎีความน่าจะเป็น>>สถิติ

โดยเฉลี่ยแล้วแต่ละฐานจะถูกใช้อย่างหนักในฐานรากของรุ่นถัดไป นั่นคือจุดตัดขนาดใหญ่ในวิธีที่เราศึกษารากฐานของถัดไป

PS มีสถิติเชิงอุปนัยและนิรนัยนั่นไม่ใช่ความแตกต่าง


0

หลายคนและนักคณิตศาสตร์กล่าวว่า 'สถิติเป็นสิ่งที่ตรงกันข้ามกับความน่าจะเป็น' แต่มันไม่ถูกต้องนัก วิธีการของใกล้หรือวิธีการในการแก้ปัญหาเหล่านี้ 2 จะแตกต่างกันอย่างสิ้นเชิง แต่พวกเขาจะเชื่อมต่อกัน

ฉันจะหมายถึงเพื่อนของฉัน John D Cook .....

"ฉันชอบตัวอย่างของถั่วเยลลี่สีแดงและสีเขียว

probabilist เริ่มต้นด้วยการรู้สัดส่วนของแต่ละคนและบอกว่าพบความน่าจะเป็นของการวาดถั่วเยลลี่สีแดง นักสถิติทำให้สัดส่วนของถั่วเยลลี่สีแดงโดยสุ่มตัวอย่างจากขวด "

ตอนนี้สัดส่วนของถั่วเยลลี่สีแดงที่ได้จากการสุ่มตัวอย่างจากโถจะถูกใช้โดย probabilist เพื่อค้นหาความน่าจะเป็นในการวาดถั่วแดงจากโถ

ลองพิจารณาตัวอย่างนี้ ---- >>>

ในการสอบ 30% ของนักเรียนล้มเหลวในวิชาฟิสิกส์ 25% ล้มเหลวในวิชาคณิตศาสตร์ 12% ล้มเหลวทั้งในวิชาฟิสิกส์และคณิตศาสตร์ นักเรียนถูกสุ่มเลือกค้นหาความน่าจะเป็นที่นักเรียนล้มเหลวในวิชาฟิสิกส์ถ้าเป็นที่รู้กันว่าเขาล้มเหลวในวิชาคณิตศาสตร์

ผลรวมข้างต้นเป็นปัญหาของความน่าจะเป็น แต่ถ้าเราดูอย่างระมัดระวังเราจะพบว่าผลรวมนั้นมาพร้อมกับข้อมูลสถิติบางอย่าง

นักเรียน 30% ล้มเหลวในวิชาฟิสิกส์ 25% "" "maths '' 'นี่คือความถี่โดยทั่วไปถ้าคำนวณเปอร์เซ็นต์ดังนั้นเราจึงได้รับข้อมูลทางสถิติซึ่งจะช่วยให้เราค้นพบความน่าจะเป็น

ความน่าจะเป็นและสถิตินั้นมีความสัมพันธ์กันอย่างมากหรือเป็นผู้ปกครองเราสามารถบอกได้ว่าความน่าจะเป็นนั้นขึ้นอยู่กับสถิติเป็นอย่างมาก


0

คำว่า "สถิติ" นั้นถูกอธิบายอย่างสวยงามโดย JC Maxwell ในบทความโมเลกุล (ในNature 8, 1873, pp. 437–441) ให้ฉันอ้างอิงข้อความที่เกี่ยวข้อง:

เมื่อสมาชิกที่ทำงานในหมวด F ได้รับรายงานการสำรวจสำมะโนประชากรหรือเอกสารอื่น ๆ ที่มีข้อมูลตัวเลขทางเศรษฐศาสตร์และสังคมศาสตร์พวกเขาเริ่มต้นด้วยการกระจายประชากรทั้งหมดออกเป็นกลุ่มตามอายุรายได้ภาษีการศึกษา ความเชื่อทางศาสนาหรือความผิดทางอาญา จำนวนบุคคลนั้นยิ่งใหญ่เกินกว่าจะอนุญาตให้ติดตามประวัติของแต่ละคนแยกกันดังนั้นเพื่อลดการใช้แรงงานของพวกเขาภายในขอบเขตที่ จำกัด ของมนุษย์พวกเขาให้ความสนใจกับกลุ่มประดิษฐ์จำนวนน้อย จำนวนบุคคลที่แตกต่างกันในแต่ละกลุ่มและไม่ใช่สถานะที่แตกต่างกันของแต่ละบุคคลเป็นตัวเลขหลักที่พวกเขาทำงาน

แน่นอนว่านี่ไม่ใช่วิธีเดียวในการศึกษาธรรมชาติของมนุษย์ เราอาจสังเกตเห็นพฤติกรรมของผู้ชายแต่ละคนและเปรียบเทียบกับพฤติกรรมที่ตัวละครก่อนหน้าและสถานการณ์ปัจจุบันของพวกเขาตามทฤษฎีที่ดีที่สุดที่มีอยู่จะนำเราไปสู่ความคาดหวัง ผู้ที่ฝึกฝนวิธีนี้พยายามที่จะพัฒนาความรู้เกี่ยวกับองค์ประกอบของธรรมชาติมนุษย์ในแบบเดียวกับที่นักดาราศาสตร์ทำการแก้ไของค์ประกอบของดาวเคราะห์โดยการเปรียบเทียบตำแหน่งที่แท้จริงกับองค์ประกอบที่ได้รับจากการอนุมาน การศึกษาธรรมชาติของมนุษย์โดยพ่อแม่และครูโดยนักประวัติศาสตร์และรัฐบุรุษจึงมีความแตกต่างจากที่ดำเนินการโดย registrars และ tabulators และรัฐบุรุษผู้ศรัทธาในร่าง หนึ่งอาจถูกเรียกว่าประวัติศาสตร์และอื่น ๆ วิธีการทางสถิติ

สมการของพลวัตแสดงกฎของวิธีการทางประวัติศาสตร์ที่ใช้กับสสารอย่างสมบูรณ์ แต่การใช้สมการเหล่านี้แสดงถึงความรู้ที่สมบูรณ์แบบของข้อมูลทั้งหมด แต่ส่วนที่เล็กที่สุดของสสารที่เราสามารถทำการทดลองได้ประกอบด้วยโมเลกุลนับล้าน ๆ อันซึ่งไม่ได้เป็นสสารที่เราคุ้นเคย ดังนั้นเราจึงไม่สามารถยืนยันการเคลื่อนที่ที่แท้จริงของโมเลกุลใด ๆ เหล่านี้ดังนั้นเราจึงจำเป็นต้องละทิ้งวิธีการทางประวัติศาสตร์ที่เข้มงวดและใช้วิธีการทางสถิติในการจัดการกับกลุ่มโมเลกุลขนาดใหญ่

เขาให้คำอธิบายของวิธีการทางสถิติในงานอื่น ๆ ตัวอย่างเช่น "ในวิธีการทางสถิติของการตรวจสอบเราไม่ได้ติดตามระบบในระหว่างการเคลื่อนไหว แต่เราจะแก้ไขความสนใจของเราในช่วงใดช่วงหนึ่งและตรวจสอบว่าระบบอยู่ในช่วงนั้นหรือไม่และเมื่อมันเข้าสู่ระยะ และเมื่อมันจากไป "(Trans. Cambridge Philos. Soc. 12, 1879, pp. 547–570)

มีอีกหนึ่งข้อความที่สวยงามของ Maxwell เกี่ยวกับ "ความน่าจะเป็น" (จากจดหมายถึง Campbell, 1850, พิมพ์ซ้ำในThe Life of James Clerk Maxwell , p. 143):

วิทยาศาสตร์ของตรรกะที่แท้จริงในปัจจุบันเป็นสิ่งที่แน่นอนเท่านั้นไม่แน่ใจหรือสงสัยทั้งหมดไม่มีใคร (โชคดี) เราต้องให้เหตุผล ดังนั้นตรรกะที่แท้จริงสำหรับโลกนี้คือแคลคูลัสของความน่าจะเป็นซึ่งคำนึงถึงขนาดของความน่าจะเป็น (ซึ่งเป็นหรือที่ควรจะอยู่ในใจของคนที่สมเหตุสมผล)

ดังนั้นเราจึงสามารถพูดได้:

- ในสถิติเรากำลัง "ให้ความสนใจกับกลุ่มเทียมจำนวนน้อย" หรือปริมาณ เรากำลังจัดทำแคตตาล็อกหรือการสำรวจสำมะโนประชากร

- ในความเป็นไปได้เรากำลังคำนวณความไม่แน่นอนของเราเกี่ยวกับเหตุการณ์หรือปริมาณ

ทั้งสองมีความแตกต่างกันและเราสามารถทำได้โดยไม่มีอีก

ตัวอย่างเช่นหากเราทำการสำรวจสำมะโนประชากรของประชากรทั้งหมดของประเทศอย่างสมบูรณ์และนับจำนวนคนที่แน่นอนของกลุ่มเฉพาะเช่นอายุเพศและอื่น ๆ เรากำลังทำสถิติ ไม่มีความไม่แน่นอน - ความน่าจะเป็น - เกี่ยวข้องเนื่องจากตัวเลขที่เราค้นหานั้นแน่นอนและเป็นที่รู้จัก

ในทางกลับกันลองนึกภาพคนที่เดินผ่านหน้าเราไปตามถนนและเราสงสัยว่าอายุของพวกเขาเป็นอย่างไร ในกรณีนี้เราไม่แน่ใจและเราใช้ความน่าจะเป็น แต่ไม่มีสถิติที่เกี่ยวข้องเนื่องจากเราไม่ได้ทำการสำรวจสำมะโนประชากรหรือแคตตาล็อก

แต่ทั้งสองก็สามารถเกิดขึ้นพร้อมกันได้ หากเราไม่สามารถทำการสำรวจสำมะโนประชากรของประชากรได้อย่างสมบูรณ์เราต้องเดาว่ามีกี่คนในกลุ่มอายุเพศที่เฉพาะเจาะจง ดังนั้นเราจึงใช้ความน่าจะเป็นขณะทำสถิติ ในทางกลับกันเราสามารถพิจารณาข้อมูลสถิติที่แน่นอนเกี่ยวกับอายุของผู้คนและจากข้อมูลดังกล่าวพยายามที่จะคาดเดาได้ดีขึ้นเกี่ยวกับคนที่ผ่านหน้าเรา ดังนั้นเราจึงใช้สถิติขณะที่ตัดสินใจเลือกความน่าจะเป็น


ขอขอบคุณสำหรับการสนับสนุนของคุณ. แม้ว่าที่น่าสนใจก็ไม่ได้ประพฤติกับสิ่งที่เชื่อว่าสถิติสถิติที่จะไม่กับสิ่งที่พวกเขาทำจริงตามที่แสดงstats.stackexchange.com/questions/140547/...
whuber

มันเป็นจุดที่สงสัย ฉันรู้ว่านักสถิติมืออาชีพที่ไม่เห็นด้วยกับคำจำกัดความของ ASA (ซึ่งคลุมเครือมาก) และเห็นด้วยกับ Maxwell
pglpm
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.