empirical Bayes ใช้ได้อย่างไร?


24

ดังนั้นฉันเพิ่งเสร็จสิ้นการอ่านหนังสือที่ดีรู้เบื้องต้นเกี่ยวกับเชิงประจักษ์เบส์ ฉันคิดว่าหนังสือเล่มนี้ยอดเยี่ยม แต่การสร้างนักบวชจากข้อมูลรู้สึกผิด ฉันได้รับการฝึกฝนว่าคุณเกิดแผนการวิเคราะห์จากนั้นรวบรวมข้อมูลจากนั้นคุณทดสอบสมมติฐานที่คุณได้กำหนดไว้ก่อนหน้านี้ในแผนการวิเคราะห์ของคุณ เมื่อคุณทำเช่นการวิเคราะห์ข้อมูลที่เก็บรวบรวมไว้แล้วทำให้คุณเข้าสู่การอนุมานโพสต์เลือกที่คุณจะต้องมีความเข้มงวดมากขึ้นในสิ่งที่คุณเรียกว่า "อย่างมีนัยสำคัญ" ดูที่นี่ ฉันคิดว่าการเรียนรู้ด้วยเครื่องมีบางสิ่งที่คล้ายคลึงกันซึ่งเรียกว่า "การเก็บเชอร์รี่" ซึ่งหมายถึงการเลือกตัวทำนายล่วงหน้าก่อนตั้งค่าชุดการทดสอบและการฝึกอบรม ( รู้เบื้องต้นเกี่ยวกับสถิติ )

จากสิ่งที่ฉันได้เรียนรู้มาก่อนหน้านี้ดูเหมือนว่าสำหรับฉันแล้วเบย์เชิงประจักษ์ตั้งอยู่บนรากฐานที่อ่อนแอ ผู้คนใช้งานในการตั้งค่าที่ข้อมูลถูกสร้างขึ้นเฉยๆหรือไม่? ถ้าเป็นเช่นนั้นอาจเป็นเหตุผล แต่ดูเหมือนจะไม่ถูกต้องที่จะใช้เมื่อทำการออกแบบการทดลองอย่างเข้มงวด แต่ฉันรู้ว่าแบรด Efron ใช้เบย์เชิงประจักษ์โดยเฉพาะสำหรับชีวสถิติโดยทั่วไปเป็นเขต NHST มาก

คำถามของฉันคือ:

  1. empirical Bayes ใช้ได้อย่างไร?
  2. ใช้ในสถานการณ์อะไร
  3. คุณควรหลีกเลี่ยงสถานการณ์ใดในการใช้วิธีทดลองเบย์และทำไม?
  4. ผู้คนใช้งานในสาขาอื่นนอกเหนือจากชีวสถิติและหากเป็นเช่นนั้นในสถานการณ์ใดที่พวกเขาใช้งานอยู่

1
"ใช้ได้" หมายถึงอะไร ต่อผู้มีชื่อเสียงผู้ล่วงลับไปแล้ว Bayesian, DV Lindley,“ ไม่มี Bayesian น้อยกว่า Bayesian เชิงประจักษ์”
Mark L. Stone

คำตอบ:


16

ฉันคิดว่ามันสำคัญที่ต้องจำไว้ว่าวิธีการต่าง ๆ นั้นดีสำหรับสิ่งที่แตกต่างกันและการทดสอบที่สำคัญไม่ได้มีอยู่ในโลกของสถิติเท่านั้น

1 และ 3) EB อาจไม่ใช่กระบวนการทดสอบสมมติฐานที่ถูกต้อง แต่ก็ไม่ได้หมายความว่าจะเป็นเช่นนั้น

ความถูกต้องอาจมีหลายสิ่ง แต่คุณกำลังพูดถึงการออกแบบการทดลองอย่างเข้มงวดดังนั้นเราอาจพูดคุยเกี่ยวกับการทดสอบสมมติฐานที่ควรจะช่วยให้คุณตัดสินใจได้อย่างถูกต้องด้วยความถี่ระยะยาว นี่เป็นระบอบการปกครองแบบแบ่งขั้วใช่ / ไม่ใช่แบบเคร่งครัดซึ่งส่วนใหญ่มีประโยชน์สำหรับผู้ที่ต้องทำการตัดสินใจแบบใช่ / ไม่ใช่ มีงานคลาสสิกมากมายในเรื่องนี้โดยคนที่ฉลาดมาก ๆ วิธีการเหล่านี้มีความถูกต้องตามทฤษฎีที่ดีในขีด จำกัด โดยสมมติว่าสมมติฐานทั้งหมดของคุณมีอยู่ & c อย่างไรก็ตาม EB ไม่ได้มีไว้สำหรับเรื่องนี้อย่างแน่นอน หากคุณต้องการเครื่องจักรของวิธีการดั้งเดิมของ NHST ให้ใช้วิธีดั้งเดิมของ NHST


2) EB นั้นจะใช้กับปัญหาที่คุณประมาณปริมาณตัวแปรที่คล้ายกันจำนวนมาก

Efron เปิดหนังสือของเขาที่ชื่อว่าInference ขนาดใหญ่ซึ่งระบุช่วงเวลาที่แตกต่างกันสามแห่งในประวัติศาสตร์ของสถิติชี้ให้เห็นว่าขณะนี้เราอยู่ใน

[ยุค] ยุคของการผลิตจำนวนมากทางวิทยาศาสตร์ซึ่งเทคโนโลยีใหม่ที่พิมพ์โดย microarray ช่วยให้ทีมนักวิทยาศาสตร์เพียงคนเดียวในการผลิตชุดข้อมูลขนาด Quetelet จะอิจฉา แต่ตอนนี้น้ำท่วมข้อมูลมาพร้อมกับคำถามมากมายบางทีอาจมีการประมาณการหรือการทดสอบสมมติฐานหลายพันครั้งที่นักสถิติตั้งข้อหาตอบคำถามด้วยกัน ไม่ใช่สิ่งที่อาจารย์คลาสสิกมีอยู่ในใจ

เขาไปที่:

ข้อโต้แย้งเชิงประจักษ์ของเบย์ได้รวมเอาองค์ประกอบของเบย์บ่อย ๆ เข้ากับการวิเคราะห์ปัญหาของโครงสร้างซ้ำ ๆ โครงสร้างที่ทำซ้ำเป็นสิ่งที่การผลิตจำนวนมากทางวิทยาศาสตร์มีความสามารถเช่นระดับการแสดงออกเมื่อเปรียบเทียบกับผู้ป่วยที่มีสุขภาพดีและมีสุขภาพดีสำหรับยีนนับพันในเวลาเดียวกันโดยใช้ไมโครเรย์

บางทีอาจจะประสบความสำเร็จในการประยุกต์ใช้ล่าสุด EB เป็นlimma, ที่มีอยู่บน Bioconductor นี่เป็น R-package พร้อมวิธีการประเมินการแสดงออกที่แตกต่าง (เช่น microarrays) ระหว่างกลุ่มศึกษาสองกลุ่มในยีนนับหมื่น Smyth แสดงให้เห็นว่าวิธีการ EB ของพวกเขาให้ผลสถิติแบบทีมีอิสระมากขึ้นกว่าที่คุณจะคำนวณสถิติของยีนที่ฉลาด การใช้ EB ที่นี่ "เทียบเท่ากับการลดลงของความแปรปรวนตัวอย่างโดยประมาณไปยังการประมาณกลุ่มซึ่งส่งผลให้การอนุมานมีเสถียรภาพมากขึ้นเมื่อจำนวนของอาร์เรย์มีขนาดเล็ก" ซึ่งมักเป็นกรณี

เนื่องจาก Efron ชี้ให้เห็นข้างต้นสิ่งนี้ไม่เหมือนสิ่งที่ NHST แบบดั้งเดิมพัฒนาขึ้นมาและการตั้งค่ามักจะมีการสำรวจมากกว่าการยืนยัน


4) โดยทั่วไปคุณจะเห็นว่า EB เป็นวิธีการหดตัวและจะมีประโยชน์ทุกที่ที่การหดตัวมีประโยชน์

limmaX1,...,Xkθ^ผมJS=(1-/S2)Xผม,S2=ΣJ=1kXJ,Xผม

X¯,

การหดตัว

ยิ่งปริมาณใกล้เคียงกันมากเท่าใดก็ยิ่งมีแนวโน้มว่าการหดตัวจะมีประโยชน์มากขึ้นเท่านั้น หนังสือที่คุณอ้างถึงใช้อัตราการตีในเบสบอล Morris (1983) ชี้ไปที่แอปพลิเคชั่นอื่น ๆ จำนวนหนึ่ง:

  • ส่วนแบ่งรายได้ --- สำนักสำรวจสำมะโนประชากร ประมาณการรายได้สำมะโนประชากรต่อหัวสำหรับหลายพื้นที่
  • การประกันคุณภาพ --- Bell Labs ประมาณจำนวนความล้มเหลวสำหรับช่วงเวลาที่ต่างกัน
  • ทำประกันอัตรา ประเมินความเสี่ยงต่อการเปิดเผยสำหรับกลุ่มผู้เอาประกันภัยหรือดินแดนที่แตกต่างกัน
  • การรับสมัครโรงเรียนกฎหมาย ประเมินน้ำหนักสำหรับคะแนน LSAT เทียบกับเกรดเฉลี่ยสำหรับโรงเรียนที่แตกต่างกัน
  • สัญญาณเตือนไฟไหม้ --- NYC ประมาณการอัตราการเตือนที่ผิดพลาดสำหรับตำแหน่งกล่องสัญญาณเตือนที่แตกต่างกัน

ทั้งหมดนี้คือปัญหาการประมาณแบบขนานและเท่าที่ฉันรู้ว่าพวกเขากำลังทำการทำนายที่ดีว่าอะไรคือปริมาณที่แน่นอน


อ้างอิงบางอย่าง

  • Efron, B. (2012) การอนุมานขนาดใหญ่: วิธีการเชิงประจักษ์ Bayes สำหรับการประมาณค่าการทดสอบและการทำนาย (บทที่ 1) สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ เมืองชิคาโก
  • Efron, B. , & Morris, C. (1973) กฎการประมาณราคาของสไตน์และคู่แข่ง - วิธีการเชิงประจักษ์ของเบย์ วารสารสมาคมสถิติอเมริกัน, 68 (341), 117-130 เมืองชิคาโก
  • James, W. , & Stein, C. (1961, มิถุนายน) การประมาณกับการสูญเสียกำลังสอง ในการประชุมทางวิชาการของเบิร์กลีย์ที่สี่เกี่ยวกับสถิติทางคณิตศาสตร์และความน่าจะเป็น (ฉบับที่ 1, ฉบับที่ 1961, หน้า 361-379) เมืองชิคาโก
  • มอร์ริส, CN (1983) การอนุมานเชิงพารามิเตอร์ของเบส์: ทฤษฎีและการประยุกต์ วารสารสมาคมสถิติอเมริกัน, 78 (381), 47-55
  • Smyth, GK (2004) ตัวแบบเชิงเส้นและวิธีเบย์เชิงประจักษ์สำหรับการประเมินการแสดงออกที่แตกต่างในการทดลอง microarray การประยุกต์ทางสถิติในพันธุศาสตร์และอณูชีววิทยาเล่มที่ 3 ฉบับที่ 1 ข้อ 3
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.