ผมได้อ่านเจฟฟ์คัมมิงกระดาษ 2008 การจำลองแบบและช่วงเวลา:ค่าทำนายอนาคตเพียงราง ๆ แต่ช่วงความเชื่อมั่นทำได้ดีกว่า พีพี[~ 200 อ้างอิงใน Google Scholar] - และกำลังสับสนโดยหนึ่งของการเรียกร้องที่อยู่ใจกลางเมือง นี่คือหนึ่งในชุดเอกสารที่คัมมิงโต้แย้งกับ value และสนับสนุนช่วงความมั่นใจ คำถามของฉัน แต่เป็นไม่ได้เกี่ยวกับการอภิปรายครั้งนี้และมีเพียงการเรียกร้องความกังวลหนึ่งที่เฉพาะเจาะจงเกี่ยวกับ -values
ให้ฉันอ้างอิงจากนามธรรม:
บทความนี้แสดงให้เห็นว่าถ้าผลการทดสอบครั้งแรกในสองด้าน , มี โอกาสที่นกหนึ่ง -value จากการจำลองแบบจะตกอยู่ในช่วงเวลาเป็นโอกาสที่และอย่างเต็มที่โอกาสที่0.44 ช่วงเวลาที่เรียกว่าช่วงเวลามีความกว้างนี้ แต่ขนาดตัวอย่างใหญ่
คัมมิงอ้างว่า "ช่วง" และในความเป็นจริงการกระจายทั้ง -values ที่หนึ่งจะได้รับเมื่อจำลองการทดลองเดิม (แบบเดียวกับขนาดตัวอย่างคงที่) ขึ้นอยู่เฉพาะในต้นฉบับ -valueและไม่ขึ้นอยู่กับขนาดผลกระทบที่แท้จริงกำลังไฟขนาดตัวอย่างหรือสิ่งอื่นใด:p p o b t
[... ] การกระจายความน่าจะเป็นของสามารถได้มาโดยไม่ทราบหรือสมมติว่ามีค่าสำหรับ (หรือพลังงาน) [... ] เราไม่คิดว่าความรู้ก่อนหน้าเกี่ยวกับและเราใช้เฉพาะข้อมูล [ข้อสังเกตระหว่างความแตกต่างระหว่างกลุ่ม] ให้เกี่ยวกับเป็นพื้นฐานสำหรับการคำนวณสำหรับกำหนดของการกระจายตัวของ และช่วงเวลา
ฉันสับสนเพราะสิ่งนี้สำหรับฉันดูเหมือนว่าการกระจายของค่าขึ้นอยู่กับอำนาจอย่างมากในขณะที่ต้นฉบับของตัวเองไม่ได้ให้ข้อมูลใด ๆ เกี่ยวกับมัน อาจเป็นไปได้ว่าขนาดเอฟเฟกต์จริงคือจากนั้นการกระจายจะเป็นแบบเดียวกัน หรืออาจจะมีขนาดผลจริงเป็นอย่างมากและแล้วเราควรคาดหวังว่าส่วนใหญ่มีขนาดเล็กมาก -values แน่นอนว่าเราสามารถเริ่มต้นด้วยการสมมติขนาดของเอฟเฟกต์ที่เป็นไปได้ก่อนหน้านี้และรวมเข้าด้วยกัน แต่คัมมิงดูเหมือนจะอ้างว่านี่ไม่ใช่สิ่งที่เขาทำp o b t δ = 0 p
คำถาม:เกิดอะไรขึ้นที่นี่?
โปรดทราบว่าหัวข้อนี้เกี่ยวข้องกับคำถามนี้: ส่วนใดของการทดลองซ้ำจะมีขนาดผลภายในช่วงความมั่นใจ 95% ของการทดสอบครั้งแรก ด้วยคำตอบที่ยอดเยี่ยมโดย @whuber คัมมิงมีกระดาษในหัวข้อนี้ที่: คัมมิง & Maillardet, 2549, ช่วงความเชื่อมั่นและการจำลอง: ที่ไหนจะหมายถึงการล่มสลายต่อไป? - แต่สิ่งนั้นชัดเจนและไร้ประโยชน์
ฉันยังทราบด้วยว่าการเรียกร้องของคัมมิงซ้ำแล้วซ้ำอีกหลายครั้งในกระดาษวิธีธรรมชาติปี 2015 ค่าความไม่แน่นอนสร้างผลลัพธ์ที่ไม่อาจพิสูจน์ได้ซึ่งคุณบางคนอาจเจอ
[... ] จะมีการเปลี่ยนแปลงที่สำคัญในค่าของการทดสอบซ้ำ ในความเป็นจริงการทดลองซ้ำแล้วซ้ำอีก; เราไม่ทราบว่าต่อไปอาจแตกต่างกันอย่างไร แต่มีโอกาสที่มันจะแตกต่างกันมาก ตัวอย่างเช่นโดยไม่คำนึงถึงพลังทางสถิติของการทดสอบหากการทำซ้ำเดียวส่งคืนค่าจะมีโอกาสที่การทดสอบซ้ำจะส่งคืนค่าระหว่างถึง (และการเปลี่ยนแปลง [sic] ที่จะยิ่งใหญ่กว่า)P P 0.05 80 % P 0 0.44 20 % P
(หมายเหตุโดยวิธีอย่างไรโดยไม่คำนึงถึงว่าคำสั่งของคัมมิงถูกต้องหรือไม่กระดาษวิธีธรรมชาติราคามันไม่ถูกต้อง: ตามคัมมิงเป็นเพียงน่าจะเป็นสูงกว่าและใช่กระดาษพูดว่า "20% จังg e ". Pfff.)0.44