ฉันคิดว่ามันสำคัญที่ต้องจำไว้ว่าวิธีการต่าง ๆ นั้นดีสำหรับสิ่งที่แตกต่างกันและการทดสอบที่สำคัญไม่ได้มีอยู่ในโลกของสถิติเท่านั้น
1 และ 3) EB อาจไม่ใช่กระบวนการทดสอบสมมติฐานที่ถูกต้อง แต่ก็ไม่ได้หมายความว่าจะเป็นเช่นนั้น
ความถูกต้องอาจมีหลายสิ่ง แต่คุณกำลังพูดถึงการออกแบบการทดลองอย่างเข้มงวดดังนั้นเราอาจพูดคุยเกี่ยวกับการทดสอบสมมติฐานที่ควรจะช่วยให้คุณตัดสินใจได้อย่างถูกต้องด้วยความถี่ระยะยาว นี่เป็นระบอบการปกครองแบบแบ่งขั้วใช่ / ไม่ใช่แบบเคร่งครัดซึ่งส่วนใหญ่มีประโยชน์สำหรับผู้ที่ต้องทำการตัดสินใจแบบใช่ / ไม่ใช่ มีงานคลาสสิกมากมายในเรื่องนี้โดยคนที่ฉลาดมาก ๆ วิธีการเหล่านี้มีความถูกต้องตามทฤษฎีที่ดีในขีด จำกัด โดยสมมติว่าสมมติฐานทั้งหมดของคุณมีอยู่ & c อย่างไรก็ตาม EB ไม่ได้มีไว้สำหรับเรื่องนี้อย่างแน่นอน หากคุณต้องการเครื่องจักรของวิธีการดั้งเดิมของ NHST ให้ใช้วิธีดั้งเดิมของ NHST
2) EB นั้นจะใช้กับปัญหาที่คุณประมาณปริมาณตัวแปรที่คล้ายกันจำนวนมาก
Efron เปิดหนังสือของเขาที่ชื่อว่าInference ขนาดใหญ่ซึ่งระบุช่วงเวลาที่แตกต่างกันสามแห่งในประวัติศาสตร์ของสถิติชี้ให้เห็นว่าขณะนี้เราอยู่ใน
[ยุค] ยุคของการผลิตจำนวนมากทางวิทยาศาสตร์ซึ่งเทคโนโลยีใหม่ที่พิมพ์โดย microarray ช่วยให้ทีมนักวิทยาศาสตร์เพียงคนเดียวในการผลิตชุดข้อมูลขนาด Quetelet จะอิจฉา แต่ตอนนี้น้ำท่วมข้อมูลมาพร้อมกับคำถามมากมายบางทีอาจมีการประมาณการหรือการทดสอบสมมติฐานหลายพันครั้งที่นักสถิติตั้งข้อหาตอบคำถามด้วยกัน ไม่ใช่สิ่งที่อาจารย์คลาสสิกมีอยู่ในใจ
เขาไปที่:
ข้อโต้แย้งเชิงประจักษ์ของเบย์ได้รวมเอาองค์ประกอบของเบย์บ่อย ๆ เข้ากับการวิเคราะห์ปัญหาของโครงสร้างซ้ำ ๆ โครงสร้างที่ทำซ้ำเป็นสิ่งที่การผลิตจำนวนมากทางวิทยาศาสตร์มีความสามารถเช่นระดับการแสดงออกเมื่อเปรียบเทียบกับผู้ป่วยที่มีสุขภาพดีและมีสุขภาพดีสำหรับยีนนับพันในเวลาเดียวกันโดยใช้ไมโครเรย์
บางทีอาจจะประสบความสำเร็จในการประยุกต์ใช้ล่าสุด EB เป็นlimma
, ที่มีอยู่บน Bioconductor นี่เป็น R-package พร้อมวิธีการประเมินการแสดงออกที่แตกต่าง (เช่น microarrays) ระหว่างกลุ่มศึกษาสองกลุ่มในยีนนับหมื่น Smyth แสดงให้เห็นว่าวิธีการ EB ของพวกเขาให้ผลสถิติแบบทีมีอิสระมากขึ้นกว่าที่คุณจะคำนวณสถิติของยีนที่ฉลาด การใช้ EB ที่นี่ "เทียบเท่ากับการลดลงของความแปรปรวนตัวอย่างโดยประมาณไปยังการประมาณกลุ่มซึ่งส่งผลให้การอนุมานมีเสถียรภาพมากขึ้นเมื่อจำนวนของอาร์เรย์มีขนาดเล็ก" ซึ่งมักเป็นกรณี
เนื่องจาก Efron ชี้ให้เห็นข้างต้นสิ่งนี้ไม่เหมือนสิ่งที่ NHST แบบดั้งเดิมพัฒนาขึ้นมาและการตั้งค่ามักจะมีการสำรวจมากกว่าการยืนยัน
4) โดยทั่วไปคุณจะเห็นว่า EB เป็นวิธีการหดตัวและจะมีประโยชน์ทุกที่ที่การหดตัวมีประโยชน์
limma
X1, . . . , Xkθ^JSผม= ( 1 - c / S2) Xผม,S2= ∑kj = 1XJ,คXผม
X¯,
ยิ่งปริมาณใกล้เคียงกันมากเท่าใดก็ยิ่งมีแนวโน้มว่าการหดตัวจะมีประโยชน์มากขึ้นเท่านั้น หนังสือที่คุณอ้างถึงใช้อัตราการตีในเบสบอล Morris (1983) ชี้ไปที่แอปพลิเคชั่นอื่น ๆ จำนวนหนึ่ง:
- ส่วนแบ่งรายได้ --- สำนักสำรวจสำมะโนประชากร ประมาณการรายได้สำมะโนประชากรต่อหัวสำหรับหลายพื้นที่
- การประกันคุณภาพ --- Bell Labs ประมาณจำนวนความล้มเหลวสำหรับช่วงเวลาที่ต่างกัน
- ทำประกันอัตรา ประเมินความเสี่ยงต่อการเปิดเผยสำหรับกลุ่มผู้เอาประกันภัยหรือดินแดนที่แตกต่างกัน
- การรับสมัครโรงเรียนกฎหมาย ประเมินน้ำหนักสำหรับคะแนน LSAT เทียบกับเกรดเฉลี่ยสำหรับโรงเรียนที่แตกต่างกัน
- สัญญาณเตือนไฟไหม้ --- NYC ประมาณการอัตราการเตือนที่ผิดพลาดสำหรับตำแหน่งกล่องสัญญาณเตือนที่แตกต่างกัน
ทั้งหมดนี้คือปัญหาการประมาณแบบขนานและเท่าที่ฉันรู้ว่าพวกเขากำลังทำการทำนายที่ดีว่าอะไรคือปริมาณที่แน่นอน
อ้างอิงบางอย่าง
- Efron, B. (2012) การอนุมานขนาดใหญ่: วิธีการเชิงประจักษ์ Bayes สำหรับการประมาณค่าการทดสอบและการทำนาย (บทที่ 1) สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ เมืองชิคาโก
- Efron, B. , & Morris, C. (1973) กฎการประมาณราคาของสไตน์และคู่แข่ง - วิธีการเชิงประจักษ์ของเบย์ วารสารสมาคมสถิติอเมริกัน, 68 (341), 117-130 เมืองชิคาโก
- James, W. , & Stein, C. (1961, มิถุนายน) การประมาณกับการสูญเสียกำลังสอง ในการประชุมทางวิชาการของเบิร์กลีย์ที่สี่เกี่ยวกับสถิติทางคณิตศาสตร์และความน่าจะเป็น (ฉบับที่ 1, ฉบับที่ 1961, หน้า 361-379) เมืองชิคาโก
- มอร์ริส, CN (1983) การอนุมานเชิงพารามิเตอร์ของเบส์: ทฤษฎีและการประยุกต์ วารสารสมาคมสถิติอเมริกัน, 78 (381), 47-55
- Smyth, GK (2004) ตัวแบบเชิงเส้นและวิธีเบย์เชิงประจักษ์สำหรับการประเมินการแสดงออกที่แตกต่างในการทดลอง microarray การประยุกต์ทางสถิติในพันธุศาสตร์และอณูชีววิทยาเล่มที่ 3 ฉบับที่ 1 ข้อ 3