พลังของการทดลองชิมชาเลดี้


9

ในการทดสอบที่มีชื่อเสียงของฟิชเชอร์สิ่งที่สังเกตได้คือจำนวนถ้วยเดาที่ถูกต้องk มีถ้วยสองแบบ A และ B. โดยปกติแล้วมันเป็นเรื่องที่น่าสนใจในการคำนวณภูมิภาคที่สำคัญเพื่อปฏิเสธสมมติฐานว่าง (ผู้หญิงคาดเดาแบบสุ่ม) ตามขนาดของการทดสอบα. สิ่งนี้ทำได้อย่างง่ายดายโดยใช้การแจกแจงแบบไฮเพอร์เมตริกซ์ ในทำนองเดียวกันฉันสามารถคำนวณขนาดของการทดสอบที่กำหนดในพื้นที่วิกฤติ

คำถามที่แตกต่างคือ: วิธีการคำนวณพลังของการทดสอบให้ตั้งสมมติฐานทางเลือก? สมมติว่าผู้หญิงสามารถเดาได้อย่างถูกต้องด้วยความน่าจะเป็นในถ้วยเดียวp=90% (P(guessA|trueA)=P(guess B|true B)=0.9) พลังของการทดสอบคืออะไรสมมติว่าจำนวนถ้วยเท่ากับN=8 และจำนวนหนึ่งถ้วยทั้งหมด n=N/2=4? (น่าเสียดาย) ผู้หญิงรู้n.

กล่าวอีกนัยหนึ่ง: การกระจายตัวของคืออะไร k=(จำนวนถ้วยที่ถูกต้องภายใต้สมมติฐานทางเลือก) ถ้าผู้หญิงรู้ว่ามี n ถ้วยเดียวหรือไม่


คิดถึงโพสต์ของคุณ ... ถ้าฟิชเชอร์ตัดสินใจปฏิเสธโมฆะก็ต่อเมื่อเธอเดาได้ถูกต้อง (ฉันคิดว่าเป็นอย่างนั้น) และมีวิธีเดียวที่จะทำให้ถ้วยทั้งหมดถูกต้องไม่ควร ความน่าจะเป็นที่จะเกิดขึ้นนี้ 0.94=0.6561เป็นพลังที่แท้จริง?
Antoni Parellada

คุณไม่ปฏิเสธเมื่อเธอเดาถ้วยทั้งหมดโดยทั่วไป แต่มันเป็นเรื่องจริงด้วยN=8นั่นคือภูมิภาคที่สำคัญ คุณไม่ได้คำนึงถึงว่าผู้หญิงรู้ว่ามี 4 ถ้วยแต่ละประเภท โดยวิธีที่ฉันสนใจในการแก้ปัญหาทั่วไปN8
Ruggero Turra

1
นี่เป็นปัญหาที่น่าสนใจ แต่ก็ยาก ง่ายต่อการพิจารณาตารางที่จะนำไปสู่การปฏิเสธ Ho แต่จะต้องคิดเกี่ยวกับความน่าจะเป็นที่จะเห็นตารางเหล่านั้นภายใต้ Ha บทความต่อไปนี้คำนวณพลังงานสำหรับตารางที่ปรับเปลี่ยนเล็กน้อยซึ่งมีความไวและความเฉพาะเจาะจงที่กำหนด: "ลักษณะทั่วไปของขั้นตอนการทำชากับชาเพื่อเชื่อมโยงแนวทางเชิงคุณภาพและเชิงปริมาณในการวิจัยทางจิตเวช" โดย Falissard et al. ฉันไม่แน่ใจว่าการคำนวณนั้นถูกต้องหรือไม่ หากคุณมีปัญหาทวินามอย่างแท้จริงแล้วคุณสามารถใช้แพคเกจ Exact R ได้ แต่นี่เป็นปัญหาที่แตกต่างกันที่ถาม
Peter Calhoun

คำตอบ:


3

ภายใต้ทางเลือกผู้หญิงไม่ได้คาดเดาแบบสุ่ม แต่ "ไม่คาดเดาแบบสุ่ม" ครอบคลุมถึงอนันต์ของสถานการณ์ที่แตกต่างกัน เธออาจจะคาดเดาได้อย่างสมบูรณ์แบบเสมอหรือเธออาจทำได้ดีกว่าการคาดเดาแบบสุ่มเพียงเล็กน้อยเท่านั้นและในกรณีทั่วไปไม่มีแม้แต่ "สเกล" ตัวแปรเดียวที่ไม่สุ่มเพื่อทำงานพร้อม (ดังนั้นเราจึงไม่มีพลัง โค้งยกเว้นว่าเรา จำกัด ประเภทของการตอบแบบไม่สุ่มที่เธออาจให้)

ดังนั้นเพื่อคำนวณพลังงานเราจะต้องเจาะจงมากเกี่ยวกับวิธีการที่ไม่สุ่ม (และวิธีการที่ไม่สุ่มในแบบนั้น)

ตัวอย่างเช่นเราสามารถสมมติได้ว่าเธอได้รับความรู้สึกถึงรสชาติของนมแต่ละถ้วยที่เพิ่มเข้ามาเป็นอันดับแรก - ดัชนี "milk-firstiness" ซึ่งเป็นตัวแปรสุ่มของ (,) ที่มีค่าเฉลี่ย (สูงกว่า) ที่แตกต่างกันเมื่อเพิ่มนมก่อน - เช่นเราอาจสมมติว่ามันพูดปกติหรือมีโลโก้โดยมีค่าเฉลี่ย μ0 และความแปรปรวน σ2=1/ω2 (ω2 เป็นที่รู้จักกันในชื่อ "ความแม่นยำ") เมื่อมีการเติมนมครั้งสุดท้ายและค่าเฉลี่ย μ1 และความแปรปรวน σ2 เมื่อเพิ่มนมก่อน (จริง ๆ แล้วข้อสันนิษฐานที่เรียบง่าย แต่เข้มงวดกว่านั้นอาจจะกำหนดให้พูดว่า μ1=μ0=1เพื่อให้ตอนนี้ทุกอย่างเป็นฟังก์ชันของตัวแปรเดียวความแม่นยำ) ดังนั้นสำหรับค่าที่กำหนดใด ๆ ของพารามิเตอร์เหล่านั้นเราสามารถคำนวณความน่าจะเป็นที่เธอได้รับ 8 ถ้วยที่ถูกต้องทั้งหมด (นั่นคือค่าที่น้อยที่สุด "ค่านิยมจากนมครั้งแรก" สี่ประการที่เธอมีประสบการณ์เกี่ยวข้องกับสี่ถ้วยนมวินาที) หากการคำนวณที่แน่นอนนั้นยากเกินไปสำหรับเราเราสามารถจำลองความแม่นยำที่ต้องการได้ [ในกรณีที่สันนิษฐานว่าไม่ใช่การสุ่มตัวอย่างเป็นฟังก์ชั่นของตัวแปรเพียงตัวเดียวเราจะมี power-curve - ค่าสำหรับการใช้พลังงานสำหรับแต่ละค่าของพารามิเตอร์]

นั่นเป็นรูปแบบหนึ่งที่เฉพาะเจาะจงสำหรับวิธีที่เธออาจทำงาน "ดีกว่าการสุ่ม" ซึ่งเราอาจระบุพารามิเตอร์และรับค่ากำลังงาน

แน่นอนเราสามารถสมมติรูปแบบอื่น ๆ ของการไม่สุ่มได้มากกว่านี้


3

การกระจายของจำนวนที่ถูกต้องของการเดาภายใต้สมมติฐานทางเลือกดังต่อไปนี้การกระจาย hypergeometric ที่ไม่ได้อยู่ตรงกลางซึ่งเป็นพารามิเตอร์ในแง่ของอัตราส่วนอัตราต่อรองนั่นคืออัตราเดิมพันที่ผู้หญิงจะเดาว่า "ชาก่อน" สูงขึ้นเท่าใด ความเป็นจริงชาถูกเพิ่มเข้ามาก่อนเป็นอย่างมากเมื่อเทียบกับเมื่อในความเป็นจริงนมถูกเพิ่มก่อน (หรือวิธีอื่น ๆ ) หากอัตราส่วนอัตราต่อรองเป็น 1 เราจะได้การแจกแจงไฮเพอร์ยีเมตริกกลาง

มาดูกันว่ามันใช้งานได้ไหม ฉันจะใช้ R เพื่อจุดประสงค์ภาพประกอบโดยใช้MCMCpackแพคเกจซึ่งมีฟังก์ชั่นdnoncenhypergeom()สำหรับคำนวณความหนาแน่นของการแจกแจงไฮเพอร์เมตริก (ไม่ใช่กลาง) แต่ก็มีข้อโต้แย้งxสำหรับจำนวนที่ถูกต้องของการคาดเดา (ข้อควรระวัง: นี่คือหมายเลขที่ถูกต้องของการคาดเดาภายใต้หนึ่งของทั้งสองเงื่อนไขเช่นเมื่อชาถูกเพิ่มเข้ามาจริงๆแรก) ข้อโต้แย้งn1, n2และm1สามในสี่ของอัตรากำไรขั้นต้นและpsiสำหรับ อัตราส่วนอัตราต่อรองที่แท้จริง ลองคำนวณความหนาแน่นxเท่ากับ 0 ถึง 4 (ด้วยระยะขอบทั้งหมดเท่ากับ 4) เมื่ออัตราส่วนอัตราต่อรองที่แท้จริงคือ 1:

install.packages("MCMCpack")
library(MCMCpack)
sapply(0:4, function(x) dnoncenhypergeom(x, n1=4, n2=4, m1=4, psi=1))

อัตราผลตอบแทนนี้:

[1] 0.01428571 0.22857143 0.51428571 0.22857143 0.01428571

ดังนั้นจึงมีโอกาส 1.43% ที่ผู้หญิงจะทำการเดาได้ถูกต้อง 8 ครั้ง (นั่นคือเธอเดาได้ทั้งหมด 4 ถ้วยอย่างถูกต้องเมื่อเติมชาก่อนและด้วยเหตุนี้เธอจึงเดาได้ทั้งหมด 4 ถ้วยอย่างถูกต้องเมื่อใส่นมก่อน) ภายใต้สมมติฐานว่าง นี่คือจำนวนหลักฐานที่ฟิชเชอร์พิจารณาแล้วว่าเพียงพอที่จะปฏิเสธสมมติฐานว่าง

ความน่าจะเป็นที่ระบุในคำถามสามารถใช้คำนวณอัตราต่อรองได้คือ (.90/(1.90))/(.10/(1.10))=81 (เช่น odds(guessA|trueA)/odds(guessA|trueB)) ตอนนี้โอกาสที่ผู้หญิงจะเดาได้ทั้งหมด 8 ถ้วยอย่างถูกต้อง (เช่นเธอจะเดาได้ทั้งหมด 4 ถ้วยอย่างถูกต้องที่มีการเพิ่มชาก่อนและด้วยเหตุนี้ 4 ถ้วยอย่างถูกต้องที่มีการเพิ่มนมก่อน)

dnoncenhypergeom(4, n1=4, n2=4, m1=4, psi=81)

อัตราผลตอบแทนนี้:

[1] 0.8312221

ดังนั้นพลังงานจึงอยู่ที่ประมาณ 83%

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.