การวิเคราะห์พลังงานจำเป็นในสถิติแบบเบย์หรือไม่?


19

ฉันค้นคว้า Bayesian แล้วเมื่อไม่นานมานี้ หลังจากอ่านเกี่ยวกับปัจจัย Bayes ฉันถูกทิ้งสงสัยว่าการวิเคราะห์พลังงานเป็นสิ่งจำเป็นในมุมมองของสถิตินี้หรือไม่ เหตุผลหลักของฉันสำหรับการสงสัยว่านี่คือปัจจัยของเบย์จริง ๆ แล้วดูเหมือนจะเป็นอัตราส่วนความน่าจะเป็น เมื่อเป็นเช่น 25: 1 ดูเหมือนว่าฉันสามารถเรียกคืน

ฉันอยู่ไกลไหม การอ่านอื่นใดที่ฉันสามารถทำได้เพื่อเรียนรู้เพิ่มเติม กำลังอ่านหนังสือเล่มนี้: รู้เบื้องต้นเกี่ยวกับสถิติแบบเบย์โดย WM Bolstad (Wiley-Interscience; 2nd ed., 2007)



คำตอบ:


10

กำลังเป็นเรื่องเกี่ยวกับความน่าจะเป็นในระยะยาวของ p <0.05 (อัลฟา) ในการศึกษาในอนาคต ใน Bayes หลักฐานจากการศึกษา A ดึงข้อมูลเข้าสู่นักบวชเพื่อการศึกษา B ฯลฯ ตามลำดับ ดังนั้นอำนาจตามที่กำหนดไว้ในสถิติบ่อยครั้งจึงไม่มีอยู่จริง


12
การมองพลังที่ จำกัด น้อยกว่าจะมองว่าเป็นการแสดงออกของกราฟความเสี่ยงสำหรับฟังก์ชันการสูญเสีย 0-1 การวิเคราะห์แบบเบย์รวมความเสี่ยงนั้นกับความน่าจะเป็นก่อนหน้า อย่างไรก็ตามการวิเคราะห์แบบเบย์ที่ดีจะพิจารณาความไวของผลลัพธ์ของพวกเขาต่อการเลือกการกระจายก่อนหน้า ดูเหมือนว่าจะนำเรากลับไปสู่โดเมนของการวิเคราะห์พลังงาน แม้ว่ามันอาจจะไม่ได้ใช้ชื่อนั้นและจะถูกคำนวณต่างกัน แต่จุดประสงค์ก็จะเหมือนกัน: คือการกำหนดว่าจะให้กลุ่มตัวอย่างมีขนาดใหญ่เพียงใดเพื่อให้แน่ใจว่าบรรลุวัตถุประสงค์ของการศึกษา
whuber

2
นั่นเป็นจุดที่ดีมาก Whuber อย่างไรก็ตามนั่นไม่ใช่เหตุผลเดียวสำหรับการคำนวณพลังงานและชาว Bayesian หลายคนยืนยันว่าไม่จำเป็นเพราะคุณไม่จำเป็นต้องระบุ N ล่วงหน้า (ความผิดพลาด)
จอห์น

5
N

2
ฉันไม่ได้คิดมาก่อนมีบทความจำนวนหนึ่งที่ Bayesians โต้แย้งว่าคุณสามารถเพิ่มวิชาจนกว่าคุณจะมีหลักฐานเพียงพอที่จะตัดสินใจเมื่อเทียบกับการทดสอบบ่อยครั้งที่การทดสอบและเพิ่มขั้นตอนไม่ทำงาน ฉันสามารถค้นหาการอ้างอิงที่ฉันคิดว่า สิ่งที่น่าสังเกตมากที่สุดคือการเสนอวิธีการวิเคราะห์ข้อมูลในการทดลองทางคลินิก
จอห์น

8
ยังไม่มีข้อความ

14

คุณสามารถทำการทดสอบสมมติฐานด้วยสถิติแบบเบย์ ตัวอย่างเช่นคุณสามารถสรุปผลได้มากกว่าศูนย์ถ้ามากกว่า 95% ของความหนาแน่นหลังมากกว่าศูนย์ หรือทางเลือกอื่นคุณสามารถใช้การตัดสินใจแบบไบนารี่บางรูปแบบตามปัจจัยของเบย์

เมื่อคุณสร้างระบบการตัดสินใจเช่นนี้แล้วคุณจะสามารถประเมินกำลังทางสถิติโดยสมมติว่ากระบวนการสร้างข้อมูลและขนาดตัวอย่างที่กำหนด คุณสามารถประเมินสิ่งนี้ในบริบทที่กำหนดโดยใช้การจำลอง

ที่กล่าวว่าวิธีการแบบเบย์มักมุ่งเน้นไปที่ช่วงเวลาความน่าเชื่อถือมากกว่าการประมาณจุดและระดับความเชื่อมากกว่าการตัดสินใจแบบไบนารี ด้วยการใช้วิธีการอนุมานที่ต่อเนื่องมากกว่านี้คุณสามารถประเมินผลกระทบอื่น ๆ ที่มีต่อการอนุมานการออกแบบของคุณ โดยเฉพาะอย่างยิ่งคุณอาจต้องการประเมินขนาดที่คาดหวังของช่วงเวลาความน่าเชื่อถือของคุณสำหรับกระบวนการสร้างข้อมูลและขนาดตัวอย่างที่กำหนด


3

ปัญหานี้นำไปสู่ความเข้าใจผิดมากมายเนื่องจากผู้คนใช้สถิติแบบเบย์เพื่อถามคำถามที่พบบ่อย ตัวอย่างเช่นผู้คนต้องการพิจารณาว่าตัวแปร B ดีกว่าตัวแปร A พวกเขาสามารถตอบคำถามนี้ด้วยสถิติแบบเบย์โดยพิจารณาว่าช่วงความหนาแน่นสูงสุด 95% ของความแตกต่างระหว่างการแจกแจงหลังสองแบบ (BA) มากกว่า 0 หรือ ภูมิภาคที่มีความสำคัญในทางปฏิบัติประมาณ 0 หากคุณใช้สถิติแบบเบย์เพื่อตอบคำถามที่พบบ่อยอย่างไรก็ตามคุณยังสามารถสร้างข้อผิดพลาดได้บ่อยครั้ง: พิมพ์ I (ผลบวกปลอม opps - B ไม่ได้ดีกว่าจริง ๆ ) และพิมพ์ II (พลาด; นั่นขดีกว่าจริงๆ)

จุดของการวิเคราะห์พลังงานคือลดข้อผิดพลาด type II (เช่นมีโอกาสอย่างน้อย 80% ในการค้นหาเอฟเฟกต์ถ้ามี) ควรใช้การวิเคราะห์พลังงานเมื่อใช้สถิติแบบเบย์เพื่อถามคำถามที่พบบ่อยเช่นคำถามข้างต้น

หากคุณไม่ได้ใช้การวิเคราะห์พลังงานและจากนั้นให้คุณดูข้อมูลของคุณซ้ำ ๆ ในขณะที่เก็บรวบรวมข้อมูลแล้วหยุดเพียงครั้งเดียวเมื่อคุณพบความแตกต่างที่สำคัญคุณจะทำข้อผิดพลาดประเภท I (สัญญาณเตือนผิดพลาด) มากกว่าที่คุณคาดหวัง - เหมือนกับว่าคุณใช้สถิติบ่อยครั้ง

เช็คเอาท์:

https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html

http://varianceexplained.org/r/bayesian-ab-testing/

ของบันทึก - วิธีการแบบเบย์บางอย่างสามารถลด แต่ไม่กำจัดความน่าจะเป็นที่ทำให้เกิดข้อผิดพลาดประเภท I (เช่นข้อมูลที่เหมาะสมก่อน


0

ความจำเป็นในการวิเคราะห์พลังงานในการทดลองทางคลินิกคือเพื่อให้สามารถคำนวณ / ประเมินจำนวนผู้เข้าร่วมที่จะรับสมัครเพื่อให้มีโอกาสหาผลการรักษา (จากขนาดที่เล็กที่สุด) มันเป็นไปไม่ได้ที่จะรับสมัครผู้ป่วยจำนวนไม่ จำกัด ก่อนเนื่องจากข้อ จำกัด ด้านเวลาและข้อที่สองเนื่องจากข้อ จำกัด ด้านต้นทุน

ดังนั้นจินตนาการว่าเรากำลังใช้วิธีแบบเบย์เพื่อทำการทดลองทางคลินิกดังกล่าว ถึงแม้ว่านักปราชญ์แบนด์ในทางทฤษฎีจะเป็นไปได้ แต่ก็ควรมีการพิจารณาถึงความอ่อนไหวต่อสิ่งที่มีอยู่ก่อน แต่น่าเสียดายที่มีแฟลตมากกว่าหนึ่งอันไว้ก่อนหน้านี้ (ซึ่งแปลกที่ฉันกำลังคิดอยู่

ลองจินตนาการว่ายิ่งไปกว่านั้นเราทำการวิเคราะห์ความอ่อนไหว (แบบจำลองและไม่ใช่เฉพาะก่อนหน้านี้ก็จะอยู่ภายใต้การตรวจสอบที่นี่ด้วย) สิ่งนี้เกี่ยวข้องกับการจำลองจากแบบจำลองที่น่าเชื่อถือสำหรับ 'ความจริง' ในสถิติคลาสสิค / บ่อยมีสี่ผู้สมัครสำหรับ 'ความจริง' ที่นี่: H0, mu = 0; H1, mu! = 0 เมื่อใดก็ตามที่มีข้อผิดพลาด (เช่นในโลกแห่งความเป็นจริงของเรา) หรือไม่มีข้อผิดพลาด (เช่นในโลกแห่งความเป็นจริงที่ไม่สามารถสังเกตได้) ในสถิติแบบเบย์มีผู้สมัครสองคนสำหรับ 'ความจริง' ที่นี่: mu เป็นตัวแปรสุ่ม (เช่นในโลกแห่งความเป็นจริงที่ไม่สามารถเข้าถึงได้); mu เป็นตัวแปรสุ่ม (ในโลกแห่งความเป็นจริงที่สังเกตได้ของเราจากมุมมองของบุคคลที่ไม่แน่นอน)

ดังนั้นขึ้นอยู่กับว่าคุณกำลังพยายามโน้มน้าวให้ A) โดยการทดลองและ B) โดยการวิเคราะห์ความไว ถ้าไม่ใช่คนเดียวกันนั่นคงแปลกมาก

สิ่งที่เป็นจริงคือคำถามฉันทามติเกี่ยวกับสิ่งที่เป็นจริงและสิ่งที่พิสูจน์หลักฐานที่เป็นรูปธรรม พื้นที่ที่ใช้ร่วมกันคือการแจกแจงความน่าจะเป็นลายเซ็นเป็นสิ่งที่สังเกตได้ในโลกที่เราสังเกตเห็นได้ซึ่งมีความจริงทางคณิตศาสตร์บางอย่างที่เห็นได้ชัดว่าเกิดขึ้นโดยบังเอิญหรือโดยการออกแบบ ฉันจะหยุดตรงนั้นเพราะนี่ไม่ใช่หน้าศิลปะ แต่เป็นหน้าวิทยาศาสตร์หรือนั่นคือความเข้าใจของฉัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.