ในฐานะที่เป็น@amoebaสังเกตเห็นเรามีความหมาย frequentist ของความน่าจะเป็นและ frequentist สถิติ แหล่งที่มาทั้งหมดที่ฉันได้เห็นจนถึงขณะนี้บอกว่าการอนุมาน frequentist จะขึ้นอยู่กับคำนิยามของความน่าจะ frequentist คือการทำความเข้าใจว่ามันเป็นขีด จำกัด ในสัดส่วนที่กำหนดจำนวนอนันต์สุ่มดึง (เท่าที่สังเกตเห็นแล้วโดย@fcopและ@Aksakal quoting Kolmogorov)
P(A)=limn→∞nAn
โดยพื้นฐานแล้วมีความเห็นของประชากรบางคนที่เราสามารถสุ่มตัวอย่างซ้ำได้ แนวคิดเดียวกันนี้ใช้ในการอนุมานบ่อยๆ ฉันอ่านบทความคลาสสิกบางอย่างเช่นโดยJerzy Neymanเพื่อติดตามพื้นฐานทางทฤษฎีของสถิติที่ใช้บ่อย ในปี 1937 Neyman เขียน
( ia ) นักสถิติเกี่ยวข้องกับประชากรซึ่งด้วยเหตุผลบางอย่างหรืออย่างอื่นไม่สามารถศึกษาอย่างละเอียดถี่ถ้วน มันจะเป็นไปได้ที่จะดึงตัวอย่างจากประชากรกลุ่มนี้ซึ่งอาจจะศึกษาในรายละเอียดและใช้ในรูปแบบความเห็นเป็นไปค่าของค่าคงที่บางอย่างที่อธิบายคุณสมบัติของประชากร\ตัวอย่างเช่นอาจต้องการคำนวณค่าเฉลี่ยของตัวละครบางตัวที่มีบุคคลเป็นประชากร
เป็นต้น
( ibเธเธเธπππ
) อีกทางหนึ่งนักสถิติอาจเกี่ยวข้องกับการทดลองบางอย่างซึ่งหากทำซ้ำภายใต้เงื่อนไขที่เหมือนกันอย่างชัดเจนจะให้ผลลัพธ์ที่แตกต่างกัน การทดลองดังกล่าวเรียกว่าการทดลองแบบสุ่ม [... ]
ในทั้งสองกรณีที่อธิบายปัญหาที่นักสถิติกำลังเผชิญคือปัญหาของการประมาณ ปัญหานี้ประกอบด้วยในการกำหนดสิ่งที่ดำเนินงานเกี่ยวกับคณิตศาสตร์ควรจะดำเนินการกับข้อมูลเชิงในการสั่งซื้อที่จะได้รับผลที่จะเรียกว่าการประมาณการซึ่งคงจะไม่แตกต่างอย่างมากจากมูลค่าที่แท้จริงของตัวละครที่เป็นตัวเลขอย่างใดอย่างหนึ่งของประชากร
, ใน ( ia ), หรือการทดลองแบบสุ่ม, เหมือนใน ( ib ) [... ]
ใน ( iaπ
) เราพูดถึงนักสถิติที่วาดตัวอย่างจากประชากรที่ศึกษา
ในบทความอื่น (Neyman, 1977) เขาสังเกตเห็นว่าหลักฐานที่ให้ไว้ในข้อมูลจำเป็นต้องได้รับการตรวจสอบโดยการสังเกตลักษณะซ้ำ ๆ ของปรากฏการณ์ที่ศึกษา:
ตามปกติแล้ว 'การตรวจสอบ' หรือ 'การตรวจสอบความถูกต้อง' ของแบบจำลองที่เดาได้จะประกอบไปด้วยการอนุมานผลลัพธ์ที่เกิดขึ้นบ่อยครั้งในสถานการณ์ที่ไม่เคยศึกษามาก่อนแล้วและทำการทดลองที่เหมาะสมเพื่อดูว่าผลลัพธ์ของพวกมันสอดคล้อง โดยทั่วไปแล้วความพยายามครั้งแรกในการตรวจสอบคือลบ: ความถี่ที่สังเกตได้ของผลลัพธ์ต่างๆของการทดสอบไม่เห็นด้วยกับแบบจำลอง อย่างไรก็ตามในบางโอกาสที่โชคดีมีข้อตกลงที่สมเหตุสมผลและหนึ่งรู้สึกถึงความพึงพอใจของการ 'เข้าใจ' ปรากฏการณ์อย่างน้อยในวิธีทั่วไป ต่อมาในภายหลังการค้นพบเชิงประจักษ์ใหม่ก็ปรากฏขึ้นซึ่งบ่งบอกถึงความไม่เพียงพอของรูปแบบเดิมและเรียกร้องให้ถูกทอดทิ้งหรือดัดแปลง และนี่คือประวัติศาสตร์ของวิทยาศาสตร์!
และในอีกกระดาษหนึ่ง Neyman และ Pearson (1933) เขียนเกี่ยวกับตัวอย่างสุ่มมาจากประชากรคงที่
ในทางปฏิบัติทางสถิติทั่วไปเมื่อข้อเท็จจริงที่สังเกตถูกอธิบายว่าเป็น "ตัวอย่าง" และสมมติฐานที่เกี่ยวข้องกับ "ประชากร" ซึ่งตัวอย่างถูกวาดขึ้นมาตัวละครของตัวอย่างหรือตามที่เราจะเรียกพวกเขาเกณฑ์ซึ่งได้รับ ใช้สำหรับทดสอบสมมุติฐานมักปรากฏโดยสัญชาตญาณที่มีความสุข
สถิติบ่อยครั้งในบริบทนี้ทำให้เหตุผลทางวิทยาศาสตร์เป็นที่รวบรวมหลักฐานจากนั้นตัวอย่างใหม่จะถูกดึงออกมาเพื่อตรวจสอบการค้นพบครั้งแรกและในขณะที่เรารวบรวมหลักฐานมากขึ้นสถานะของความรู้ของเราตกผลึก อีกครั้งตามที่อธิบายโดย Neyman (1977) กระบวนการใช้ขั้นตอนต่อไปนี้
( i ) การสร้างประจักษ์พยานของความถี่สัมพัทธ์ที่เสถียรในระยะยาว (หรือ 'ความถี่' สำหรับช่วงสั้น ๆ ) ของเหตุการณ์ที่ตัดสินว่าน่าสนใจขณะที่พวกเขาพัฒนาขึ้นในธรรมชาติ
( ii ) การเดาแล้วตรวจสอบ 'กลไกโอกาส' ซึ่งเป็นการดำเนินการซ้ำ ๆ ซึ่งจะสร้างความถี่ที่สังเกตได้ นี่เป็นปัญหาของ 'ทฤษฎีความน่าจะเป็นประจำ' บางครั้งขั้นตอนนี้มีข้อความ 'การสร้างแบบจำลอง' ตามธรรมชาติแล้วกลไกโอกาสที่คาดเดาได้นั้นเป็นเพียงสมมติฐาน
( iii ) การใช้กลไกโอกาสที่เป็นสมมุติฐานของปรากฏการณ์ที่ศึกษาเพื่ออนุมานกฎของการปรับการกระทำของเรา (หรือ 'การตัดสินใจ') เพื่อการสังเกตการณ์เพื่อให้มั่นใจว่า 'การวัด' ของ 'ความสำเร็จ' สูงสุด [ ... ของ 'กฎการปรับการกระทำของเรา' เป็นปัญหาของคณิตศาสตร์โดยเฉพาะสถิติทางคณิตศาสตร์
ผู้วางแผนบ่อยครั้งทำการวิจัยของพวกเขาโดยคำนึงถึงธรรมชาติของข้อมูลและความคิดในการดึงซ้ำจากประชากรที่คงที่พวกเขาออกแบบวิธีการของพวกเขาตามนั้นและใช้มันเพื่อตรวจสอบผลลัพธ์ของพวกเขา (Neyman และ Pearson, 1933)
เราอาจค้นหากฎเพื่อควบคุมพฤติกรรมของเราโดยคำนึงถึงสมมติฐานแต่ละข้อที่แยกกันเป็นจริงหรือไม่จริงซึ่งเรามั่นใจว่าในประสบการณ์ระยะยาวเราจะไม่ผิดบ่อยเกินไป
นี่เกี่ยวข้องกับหลักการสุ่มตัวอย่างซ้ำ ๆ กัน (Cox and Hinkley, 1974):
(ii) หลักการสุ่มตัวอย่างที่แข็งแกร่ง
ตามหลักการสุ่มตัวอย่างที่แข็งแกร่งซ้ำขั้นตอนทางสถิติที่จะได้รับการประเมินโดยพฤติกรรมของพวกเขาในการทำซ้ำสมมุติภายใต้เงื่อนไขเดียวกัน มีสองแง่มุม มาตรการของความไม่แน่นอนจะถูกตีความเป็นความถี่สมมุติในการทำซ้ำในระยะยาว เกณฑ์ของการมองโลกในแง่ดีจะต้องกำหนดในแง่ของพฤติกรรมที่ละเอียดอ่อนในการทำซ้ำสมมุติฐาน
อาร์กิวเมนต์สำหรับสิ่งนี้คือมันช่วยให้มั่นใจว่ามีความหมายทางกายภาพสำหรับปริมาณที่เราคำนวณและทำให้มั่นใจว่ามีความสัมพันธ์ใกล้ชิดระหว่างการวิเคราะห์ที่เราทำและแบบจำลองพื้นฐานซึ่งถือได้ว่าเป็นตัวแทนของสถานะของ "กิจการ" ที่แท้จริง
(iii) หลักการสุ่มตัวอย่างที่อ่อนแอซ้ำไปซ้ำมา
รุ่นที่อ่อนแอของหลักการสุ่มตัวอย่างซ้ำต้องกำหนดว่าเราไม่ควรปฏิบัติตามขั้นตอนซึ่งค่าพารามิเตอร์ที่เป็นไปได้บางอย่างจะให้ในการทำซ้ำสมมุติฐานข้อสรุปที่ทำให้เข้าใจผิดส่วนใหญ่
ในทางตรงกันข้ามเมื่อใช้ความเป็นไปได้สูงสุดเรามีความกังวลกับตัวอย่างที่เรามีและในกรณีของเบย์เราทำการอนุมานตามตัวอย่างและนักบวชของเราและเมื่อข้อมูลใหม่ปรากฏขึ้นเราสามารถทำการอัปเดตแบบเบย์ได้ ในทั้งสองกรณีแนวคิดของการสุ่มตัวอย่างซ้ำไม่สำคัญ ผู้ใช้บ่อยอาศัยข้อมูลที่พวกเขามี (เท่าที่สังเกตจาก@WBT ) แต่โปรดจำไว้ว่ามันเป็นสิ่งที่สุ่มและเป็นความคิดที่เป็นส่วนหนึ่งของกระบวนการสุ่มตัวอย่างซ้ำ ๆ จากประชากร (เช่นระลึกถึงความมั่นใจ ช่วงเวลาที่กำหนดไว้)
ในกรณีที่บ่อยครั้งความคิดของการสุ่มตัวอย่างซ้ำ ๆ ทำให้เราสามารถวัดความไม่แน่นอน (ในสถิติ) และทำให้เราสามารถตีความเหตุการณ์ในชีวิตจริงในแง่ของความน่าจะเป็น
โปรดสังเกตว่าทั้ง Neyman (Lehmann, 1988) และ Pearson (Mayo, 1992) ไม่ได้เป็นผู้บริสุทธิ์บ่อยเท่าที่เราจะจินตนาการได้ ตัวอย่างเช่น Neyman (1977) เสนอให้ใช้ Empirical Bayesian และโอกาสสูงสุดสำหรับการประเมินจุด ในอีกทางหนึ่ง (Mayo, 1992)
ในการตอบสนองของ Pearson (1955) เพื่อ Fisher (และที่อื่น ๆ ในการทำงานของเขา) คือว่าสำหรับบริบททางวิทยาศาสตร์ Pearson ปฏิเสธทั้งความน่าจะเป็นข้อผิดพลาดระยะยาวต่ำน่าจะเป็นเหตุผล [... ]
ดังนั้นดูเหมือนว่าเป็นการยากที่จะหาผู้บริสุทธิ์บ่อยครั้งแม้ในหมู่บรรพบุรุษผู้ก่อตั้ง
Neyman, J และ Pearson, ES (1933) ปัญหาการทดสอบที่มีประสิทธิภาพมากที่สุดของสถิติเชิงสถิติ รายการเชิงปรัชญาของราชสมาคม A: คณิตศาสตร์วิทยาศาสตร์กายภาพและวิศวกรรมศาสตร์ 231 (694–706): 289–337
Neyman, J. (1937) โครงร่างของทฤษฎีการประมาณทางสถิติตามทฤษฎีคลาสสิกของความน่าจะเป็น ฟิล ทรานส์ ร. Lond A. 236: 333–380
Neyman, J. (1977) ความน่าจะเป็นและสถิติที่ใช้บ่อย ซินเธเซ, 36 (1), 97-131
Mayo, DG (1992) Pearson ปฏิเสธปรัชญาของ Neyman-Pearson หรือไม่? ซินธี, 90 (2), 233-262
Cox, DR และ Hinkley, DV (1974) สถิติเชิงทฤษฎี. แชปแมนและห้องโถง
Lehmann, E. (1988) Jerzy Neyman, 1894 - 1981.รายงานทางเทคนิคหมายเลข 155. ภาควิชาสถิติ, มหาวิทยาลัยแห่งแคลิฟอร์เนีย