ในความเป็นจริง, p-ค่าอยู่ในขณะนี้ในที่สุด 'ออกจากแฟชั่น' เช่นกัน: http://www.nature.com/news/psychology-journal-bans-p-values-1.17001 การทดสอบสมมติฐาน Null สมมติฐานที่สำคัญ (NHST) ผลิตได้มากกว่าคำอธิบายขนาดตัวอย่างของคุณเพียงเล็กน้อย (*) การแทรกแซงการทดลองใด ๆ จะมีผลบางอย่างซึ่งกล่าวได้ว่าสมมุติฐานว่างของ 'ไม่มีผล' นั้นเป็นเท็จเสมอในความหมายที่เข้มงวด . ดังนั้นการทดสอบที่ไม่สำคัญหมายความว่าขนาดตัวอย่างของคุณไม่ใหญ่พอ การทดสอบ 'ที่สำคัญ' หมายความว่าคุณรวบรวมข้อมูลเพียงพอที่จะ 'ค้นหา' บางอย่าง
'ขนาดของเอฟเฟกต์' หมายถึงความพยายามในการแก้ไขปัญหานี้โดยแนะนำมาตรการในระดับธรรมชาติของปัญหา ในทางการแพทย์ซึ่งการรักษามักจะมีผลกระทบบางอย่าง (แม้ว่าจะเป็นผลของยาหลอก) ความคิดของ 'ผลทางคลินิกที่มีความหมาย' ถูกนำมาใช้เพื่อป้องกันความน่าจะเป็น 50% ก่อนหน้านี้ว่า 'การรักษา' จะพบว่ามี สถิติ) ผลกระทบเชิงบวกอย่างมีนัยสำคัญ '(แต่จิ๋ว) ในการศึกษาขนาดใหญ่โดยพลการ
ถ้าฉันเข้าใจธรรมชาติของงานของคุณ Clarinetist แล้วในตอนท้ายของวันเป้าหมายที่ถูกต้องตามกฎหมายของมันคือการแจ้งการกระทำ / การแทรกแซงที่ปรับปรุงการศึกษาในโรงเรียนภายใต้ขอบเขตของคุณ ดังนั้นการตั้งค่าของคุณเป็นหนึ่งในการตัดสินใจเชิงทฤษฎีและวิธีการแบบเบย์เป็นวิธีที่เหมาะสมที่สุด (และไม่ซ้ำกัน [1] ) วิธีการ
แน่นอนว่าวิธีที่ดีที่สุดที่จะเข้าใจวิธีการ frequentist เป็นใกล้เคียงกับวิธีการแบบเบย์ ขนาดผลกระทบโดยประมาณนั้นสามารถเข้าใจได้โดยมีเป้าหมายที่การวัดศูนย์กลางสำหรับการกระจายตัวหลังเบย์ในขณะที่ค่า p สามารถเข้าใจได้ว่ามีจุดมุ่งหมายที่จะวัดส่วนท้ายของด้านหลังนั้น ดังนั้นเมื่อรวมปริมาณสองอย่างนี้เข้าด้วยกันจะมีส่วนสำคัญของ Bayesian posterior ที่ประกอบขึ้นเป็นข้อมูลทางธรรมชาติสำหรับมุมมองการตัดสินใจเชิงทฤษฎีเกี่ยวกับปัญหาของคุณ (อีกทางหนึ่งคือช่วงความเชื่อมั่นที่เกิดขึ้นบ่อยครั้งกับขนาดของเอฟเฟกต์สามารถเข้าใจได้เช่นกันว่าเป็นช่วงเวลาที่เชื่อได้อย่างน่าทึ่ง)
ในสาขาจิตวิทยาและการศึกษาวิธีการแบบเบย์เป็นที่นิยมมาก เหตุผลหนึ่งสำหรับเรื่องนี้คือมันเป็นเรื่องง่ายที่จะติดตั้ง 'สร้าง' ลงในแบบจำลองเบย์เป็นตัวแปรแฝง คุณอาจต้องการดู 'หนังสือลูกสุนัข' โดยJohn K. Kruschkeนักจิตวิทยา ในการศึกษา (ที่คุณมีนักเรียนซ้อนในห้องเรียนซ้อนกันในโรงเรียนซ้อนกันในเขต, ... ), การสร้างแบบจำลองลำดับชั้นไม่สามารถหลีกเลี่ยงได้ และแบบจำลอง Bayesian นั้นยอดเยี่ยมสำหรับการสร้างแบบจำลองแบบลำดับชั้นด้วย ในบัญชีนี้คุณอาจต้องการตรวจสอบ Gelman & Hill [2]
[1]: Robert, Christian P. The Bayesian Choice: จากรากฐานการตัดสินใจไปสู่การดำเนินการเชิงคำนวณ ฉบับที่ 2 Springer ตำราในสถิติ นิวยอร์ก: สปริงเกอร์, 2007
[2]: Gelman, Andrew และ Jennifer Hill การวิเคราะห์ข้อมูลโดยใช้การถดถอยและตัวแบบหลายระดับ / ลำดับชั้น. วิธีการวิเคราะห์เพื่อการวิจัยทางสังคม. เคมบริดจ์; นิวยอร์ก: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์, 2550
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ 'การเชื่อมโยงกัน' จากมุมมองที่ไม่จำเป็นต้องเต้นคุณกับรูปปั้นอิฐแบบเบย์ดูที่ [3]
[3]: Robins, James และ Larry Wasserman “ การปรับสภาพความน่าจะเป็นและการเชื่อมโยง: การทบทวนแนวคิดพื้นฐานบางอย่าง” วารสารสมาคมสถิติอเมริกัน 95 ฉบับที่ 95 452 (1 ธันวาคม 2000): 1340–46 ดอย: 10.1080 / 01621459.2000.10474344
(*) ใน [4], Meehl ขัดจังหวะ NHST อย่างงดงามยิ่งขึ้น แต่ไม่ขัดน้อยกว่าที่ฉันทำ:
เนื่องจากสมมติฐานว่างเป็นเสมือนเท็จเสมอตารางสรุปการวิจัยในแง่ของรูปแบบของ“ ความแตกต่างที่สำคัญ” นั้นมีความซับซ้อนมากกว่าเล็กน้อยผลลัพธ์ที่ไม่สามารถตีความได้ของฟังก์ชันกำลังทางสถิติ
[4]: Meehl, Paul E. “ ความเสี่ยงเชิงทฤษฎีและเครื่องหมายดอกจันแบบตาราง: เซอร์คาร์ล, เซอร์โรนัลด์, และความก้าวหน้าของจิตวิทยาเบา ๆ ” วารสารการให้คำปรึกษาและจิตเวชคลินิก 46 (1978): 806-34 http://www3.nd.edu/~ghaeffel/Meehl(1978).pdf
และนี่คือคำพูดที่เกี่ยวข้องจาก Tukey: /stats//a/728/41404