การสุ่มตัวอย่างถูกต้องตามกฎหมายสำหรับการอนุมานหรือไม่?


15

Bayesians บางคนโจมตีการอนุมานบ่อยครั้งที่ระบุว่า "ไม่มีการกระจายตัวอย่างที่ไม่ซ้ำ" เพราะมันขึ้นอยู่กับความตั้งใจของนักวิจัย (Kruschke, Aguinis, & Joo, 2012, p. 733)

ตัวอย่างเช่นสมมติว่านักวิจัยเริ่มเก็บข้อมูล แต่เงินทุนของเขาลดลงอย่างไม่คาดคิดหลังจากมีผู้เข้าร่วม 40 คน การแจกแจงการสุ่มตัวอย่าง (และ CIs ที่ตามมาและค่า p) จะถูกกำหนดที่นี่ได้อย่างไร เราจะสมมติว่ากลุ่มตัวอย่างแต่ละชุดมี N = 40 หรือไม่ หรือมันจะประกอบไปด้วยตัวอย่างที่มี N ที่แตกต่างกันโดยแต่ละขนาดจะพิจารณาจากเวลาสุ่มอื่น ๆ ที่เงินทุนของเขาอาจถูกตัด?

t, F, chi-square (ฯลฯ ), การแจกแจงโมฆะที่พบในตำราเรียนทั้งหมดสันนิษฐานว่า N ได้รับการแก้ไขและคงที่สำหรับตัวอย่างที่เป็นส่วนประกอบทั้งหมด แต่สิ่งนี้อาจไม่เป็นจริงในทางปฏิบัติ ด้วยขั้นตอนการหยุดที่แตกต่างกันทุกครั้ง (เช่นหลังจากช่วงเวลาหนึ่งหรือจนกว่าผู้ช่วยของฉันจะเหนื่อย) ดูเหมือนจะมีการแจกแจงตัวอย่างที่แตกต่างกันและการใช้การแจกแจงคงที่ N แบบลองและจริงเหล่านี้ไม่เหมาะสม

การวิพากษ์วิจารณ์นี้สร้างความเสียหายต่อความถูกต้องตามกฎหมายของ CIs บ่อยและค่า p อย่างไร มีการโต้แย้งทางทฤษฎีหรือไม่? ดูเหมือนว่าด้วยการโจมตีแนวคิดของการกระจายตัวตัวอย่างสิ่งปลูกสร้างทั้งหมดของการอนุมานที่พบบ่อยคือความผอมบาง

การอ้างอิงทางวิชาการใด ๆ ที่ชื่นชมอย่างมาก


1
การอ้างอิงนี้ใช้สำหรับ: Kruschke, JK, Aguinis, H. , & Joo, H. (2012) ถึงเวลาแล้ว: วิธีการแบบเบย์สำหรับการวิเคราะห์ข้อมูลในวิทยาศาสตร์ขององค์กร แต่ Kruschke เคยใช้มาก่อนใน: (2010) การวิเคราะห์ข้อมูลแบบเบย์และ (2010) สิ่งที่ต้องเชื่อ: วิธีการแบบเบย์สำหรับการวิเคราะห์ข้อมูล
ATJ

คำตอบ:


21

n

n

xnx¯kμ=0μ0L(0)L(x¯)อี-k2/2kKadane (1996), "การหาเหตุผลเพื่อข้อสรุปมาก่อน", JASA , 91 , 435

การชี้ให้เห็นถึงการพึ่งพาของการอนุมานบ่อยๆเกี่ยวกับความตั้งใจของนักวิจัยคือการขุดหาคน (ถ้ายังมี) ที่อยู่บนหลังม้าสูงเกี่ยวกับ "ส่วนตัว" ของการอนุมานแบบเบย์ ส่วนตัวฉันสามารถอยู่กับมัน ประสิทธิภาพของกระบวนการในการทำซ้ำแบบยาว ๆ มักจะเป็นอะไรที่มากหรือน้อยซึ่งไม่เบี่ยงเบนจากการเป็นสิ่งที่มีประโยชน์ที่จะต้องพิจารณา ("การสอบเทียบความน่าจะเป็น" เป็นวิธีที่ Cox อธิบายค่า p ) จากวันที่อ้างอิงคุณอาจสังเกตเห็นว่าปัญหาเหล่านี้ไม่ใช่เรื่องใหม่ ความพยายามที่จะชำระพวกเขาโดยการถกเถียงกันอย่างเด่นชัดนั้นส่วนใหญ่เสียชีวิตลง (ยกเว้นทางอินเทอร์เน็ตตลอดเวลายกเว้นในเรื่องเล็กน้อย) &

PS: ความคิดที่จะเพิ่มเคาน์เตอร์สมดุลให้กับเบอร์เกอร์และ Wolpert ผมเกิดขึ้นเมื่อค็อกซ์และมายองเนส (2010), "ความเที่ยงธรรมและ conditionality ใน frequentist อนุมาน" ในข้อผิดพลาดและการอนุมาน มีความเป็นไปได้ค่อนข้างที่องค์ประกอบของการคิดอย่างปรารถนาในการยืนยันของฉันว่าการถกเถียงนั้นได้ตายไปแล้ว แต่มันก็เป็นเรื่องที่น่าทึ่งว่าจะมีการพูดคุยกันใหม่ในเรื่องนี้หลังจากครึ่งศตวรรษหรือมากกว่านั้น (เหมือนกันทั้งหมดนี้เป็นการป้องกันที่รัดกุมและมีคารมคมคายของแนวคิดที่ใช้บ่อย)


1
+1 (นานมาแล้ว) ฉันสงสัยว่าเหตุผลของอาร์มิเทจสามารถนำมาปรับใช้กับตัวอย่างที่รู้จักกันดีของการสุ่มตัวอย่างแบบทวินามและเนกาทีฟ - ทวินาม เช่นการสังเกตลำดับการโยนเหรียญ TTTTTHให้ผลตอบแทน p = 0.03 หรือ p = 0.1 ขึ้นอยู่กับกฎการหยุด ดังนั้นถ้าตอนนี้เราพิจารณาอีกกฎหยุดเช่น "Keep โยนจนกว่าพีทวินาม <0.05 และมีอย่างน้อยหนึ่ง H และอย่างน้อยหนึ่ง T" แล้วมันจะกลายเป็นค่อนข้างง่ายที่ใครควรจะค่อนข้างไม่สนใจนี้กฎการหยุดการอนุมาน (แม้จะละเมิดหลักการความน่าจะเป็น) มันสมเหตุสมผลหรือไม่
อะมีบาพูดว่า Reinstate Monica

4

คำตอบสั้น ๆ สำหรับคำถามของคุณคือ: ขึ้นอยู่กับคนที่คุณถาม ;-) เบย์ผู้ยากไร้จะประกาศชัยชนะเหนือหรืออย่างน้อยก็มีวิธีการที่ใช้บ่อย ผู้ที่เสียชีวิตบ่อยจะเริ่มต้นที่ "ไม่สามารถตอบได้" นักสถิติอีก 99% จะใช้วิธีการใดก็ตามที่แสดงให้เห็นว่าเชื่อถือได้ภายใต้การทดลองแบบย้อนกลับ

ฉันรู้ว่าความไวของการกระจายตัวตัวอย่างไปยังความตั้งใจของนักวิจัยนั้นอาจทำให้เกิดปัญหาและไม่มีทางออกที่ดีสำหรับปัญหานั้น ชาวเบย์และผู้ใช้บ่อยต้องใช้ความคิดและการตัดสินในการตัดสินใจว่าจะอนุมานอย่างไร แต่ผมคิดว่าคุณจะได้รับตัวอย่างจากพื้นที่ที่เป็นโดยทั่วไปความขัดแย้งและวางปัญหา แต่เพียงผู้เดียวที่เท้าของการอนุมาน frequentist การทดลองตามลำดับและ / หรือการหยุดเป็นตัวอย่างคลาสสิกของลักษณะเชิงอนุมานของการอนุมาน ... และการที่ไม่มีวัตถุประสงค์อย่างแท้จริงและตกลงกันตามคำตอบ

สิ่งที่เกี่ยวกับการอนุมานปกติที่คุณรวบรวมตัวอย่างที่คุณต้องการได้รับจริง ๆ ที่นี่ฉันคิดว่าผู้ใช้ความถี่มีความได้เปรียบเนื่องจาก CI และ p-values ​​ได้รับการปรับเทียบคุณสมบัติการสุ่มตัวอย่างซ้ำแล้วซ้ำอีกในขณะที่การอนุมานแบบเบย์ยังคงรักษาธรรมชาติและความเป็นส่วนตัวของตนเอาไว้

หากคุณต้องการคำอธิบายเพิ่มเติมเกี่ยวกับการตอบสนองแบบเบย์ฉันจะอ่านเกี่ยวกับ "การอนุมานตามเงื่อนไข" โดยนักวิจัยหลักคือNancy Reidและ Lehmann

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.