ถ้าเราล้มเหลวในการปฏิเสธสมมติฐานว่างในการศึกษาขนาดใหญ่มันไม่ได้เป็นหลักฐานสำหรับโมฆะ?


59

ข้อ จำกัด พื้นฐานของการทดสอบนัยสำคัญสมมุติฐานว่างคือมันไม่อนุญาตให้นักวิจัยรวบรวมหลักฐานเพื่อสนับสนุน null ( แหล่งที่มา )

ฉันเห็นการอ้างสิทธิ์นี้ซ้ำหลายครั้ง แต่ฉันไม่สามารถหาเหตุผลได้ หากเราทำการศึกษาขนาดใหญ่และเราไม่พบหลักฐานที่มีนัยสำคัญทางสถิติต่อสมมติฐานว่างเปล่านั่นไม่ใช่หลักฐานสำหรับสมมติฐานว่างหรือไม่


3
แต่เราเริ่มต้นการวิเคราะห์ของเราโดยสมมติว่าสมมติฐานว่างนั้นถูกต้อง ... สมมติฐานอาจผิด บางทีเราอาจมีพลังไม่เพียงพอ แต่นั่นไม่ได้หมายความว่าสมมติฐานนั้นถูกต้อง
SmallChess

13
หากคุณยังไม่ได้อ่านผมขอแนะนำให้จาค็อบโคเฮนโลกเป็นรอบ (p <0.05) เขาเน้นว่าด้วยขนาดตัวอย่างที่ใหญ่พอคุณสามารถปฏิเสธสมมติฐานว่าง ๆ ได้เลย นอกจากนี้เขายังพูดด้วยความกรุณาในการใช้ขนาดเอฟเฟกต์และช่วงความมั่นใจและเขานำเสนอวิธีการเบย์แบบประณีต นอกจากนี้ยังเป็นความสุขที่ได้อ่านอย่างแท้จริง!
Dominic Comtois

7
สมมติฐานที่เป็นค่าว่างอาจเป็นเพียงแค่ผิด ... ความล้มเหลวในการปฏิเสธโมฆะไม่ใช่หลักฐานทางเลือกที่ใกล้พอ
Glen_b

3
ดูstats.stackexchange.com/questions/85903 แต่โปรดดูstats.stackexchange.com/questions/125541เพิ่มเติม หากการดำเนินการ "การศึกษาขนาดใหญ่" หมายความว่า "ใหญ่พอที่จะมีพลังสูงในการตรวจหาผลกระทบที่น่าสนใจน้อยที่สุด" จากนั้นการตีความที่ล้มเหลวในการปฏิเสธสามารถตีความได้ว่าเป็นการยอมรับค่าว่าง
อะมีบาพูดว่า Reinstate Monica

7
พิจารณาการยืนยันที่ผิดธรรมดาของ Hempel ตรวจสอบอีกาและเห็นว่ามันเป็นสีดำคือการรองรับ "อีกาทั้งหมดเป็นสีดำ" แต่มีเหตุผลตรวจสอบวัตถุที่ไม่ใช่สีดำและเห็นว่ามันไม่ได้เป็นอีกาต้องสนับสนุนข้อเสนอเนื่องจากข้อความว่า "อีกาทั้งหมดเป็นสีดำ" และ "วัตถุที่ไม่ใช่สีดำทั้งหมดไม่ใช่อีกา" นั้นมีเหตุผลเทียบเท่า ... การแก้ไขคือจำนวนของวัตถุที่ไม่ใช่สีดำมีขนาดใหญ่กว่าจำนวนของกามากดังนั้นการสนับสนุนที่อีกาดำให้กับข้อเสนอนั้นมีขนาดใหญ่กว่าการสนับสนุนเล็ก ๆ ที่ไม่ใช่อีกาที่ไม่ใช่ดำให้
Ben

คำตอบ:


63

ความล้มเหลวในการปฏิเสธสมมติฐานว่างเป็นหลักฐานว่าสมมติฐานว่างเป็นจริง แต่อาจไม่ใช่หลักฐานที่ดีโดยเฉพาะและแน่นอนไม่ได้พิสูจน์สมมติฐานว่าง

งั้นลองอ้อมดู พิจารณาสักครู่ความคิดโบราณ:

การขาดหลักฐานไม่ใช่หลักฐานการขาด

แม้จะมีชื่อเสียง แต่คำนี้ก็ไร้สาระ หากคุณมองหาบางสิ่งบางอย่างและล้มเหลวในการค้นหาสิ่งนั้นก็เป็นหลักฐานว่าไม่มีอยู่จริง หลักฐานนั้นดีเพียงใดนั้นขึ้นอยู่กับว่าการค้นหาของคุณนั้นละเอียดมากเพียงใด ค้นหาคร่าวๆให้หลักฐานที่อ่อนแอ การค้นหาอย่างละเอียดให้หลักฐานที่ดี

ตอนนี้กลับไปที่การทดสอบสมมติฐาน เมื่อคุณทำการทดสอบสมมติฐานคุณกำลังมองหาหลักฐานว่าสมมติฐานว่างนั้นไม่เป็นความจริง หากคุณไม่พบมันก็เป็นหลักฐานว่าสมมติฐานว่างเป็นจริง แต่หลักฐานนั้นแข็งแกร่งแค่ไหน หากต้องการทราบว่าคุณต้องรู้ว่ามีโอกาสมากที่หลักฐานที่จะทำให้คุณปฏิเสธสมมติฐานว่างอาจทำให้การค้นหาของคุณหลุดออกไป นั่นคือความน่าจะเป็นที่จะเป็นลบในการทดสอบของคุณคืออะไร? สิ่งนี้เกี่ยวข้องกับพลังงานของการทดสอบ (โดยเฉพาะมันคือส่วนเสริม, 1- )บีตาββ

ตอนนี้พลังของการทดสอบและดังนั้นอัตราการลบที่ผิดพลาดขึ้นอยู่กับขนาดของเอฟเฟกต์ที่คุณต้องการ เอฟเฟกต์ขนาดใหญ่นั้นง่ายต่อการตรวจจับมากกว่าตัวเล็ก ดังนั้นจึงไม่มีเดียวสำหรับการทดสอบและดังนั้นจึงไม่มีคำตอบที่ชัดเจนสำหรับคำถามที่ว่าหลักฐานของสมมติฐานว่างเป็นอย่างไร อีกวิธีหนึ่งคือมีเอฟเฟกต์ขนาดเล็กพอที่จะไม่ตัดออกจากการทดสอบβ

จากที่นี่มีสองวิธีในการดำเนินการ บางครั้งคุณรู้ว่าคุณไม่สนใจขนาดผลเล็กกว่าขีด จำกัด บางอย่าง ในกรณีนี้คุณอาจควรทำการทดสอบใหม่ในกรณีที่สมมติฐานว่างคือผลกระทบนั้นสูงกว่าเกณฑ์ดังกล่าวจากนั้นทดสอบสมมติฐานทางเลือกว่าผลกระทบนั้นต่ำกว่าเกณฑ์ หรือคุณอาจใช้ผลลัพธ์เพื่อกำหนดขอบเขตตามขนาดที่น่าเชื่อของเอฟเฟกต์ ข้อสรุปของคุณอาจเป็นไปได้ว่าขนาดของเอฟเฟกต์จะอยู่ในช่วงเวลาหนึ่งด้วยความน่าจะเป็น วิธีการดังกล่าวเป็นเพียงไม่กี่ก้าวจากการรักษาแบบเบย์ซึ่งคุณอาจต้องการเรียนรู้เพิ่มเติมหากคุณพบว่าตัวเองอยู่ในสถานการณ์แบบนี้บ่อยครั้ง

มีคำตอบที่ดีสำหรับคำถามที่เกี่ยวข้องที่สัมผัสกับหลักฐานการขาดการทดสอบซึ่งคุณอาจพบว่ามีประโยชน์


9
ลองพิจารณาการทดสอบสมมติฐานด้วยพร้อมและค่า p ที่ไม่มีนัยสำคัญ ตามเหตุผลของคุณนี้เป็นหลักฐานบางอย่างสำหรับ2 ทดสอบสมมติฐานอีกด้วยกับและไม่ใช่อย่างมีนัยสำคัญ p-value แล้วจะให้มีหลักฐานบางอย่างสำหรับ4 หลักฐานนี้ขัดแย้งกันอย่างเห็นได้ชัด ˉ x = 3 μ 2 H 1 : μ < 4 ˉ x = 3 μ 4H1:μ>2x¯=3μ2H1:μ<4x¯=3μ4
Macond

4
ฉันไม่แน่ใจว่าฉันทำตามอาร์กิวเมนต์ของคุณ จากสิ่งที่ฉันสามารถบอกได้ว่าคุณกำลังอธิบายการทดลองสองครั้งแต่ละอันมีหลักฐาน (อาจค่อนข้างอ่อนแอ) สำหรับหนึ่งในสองสมมติฐานที่ไม่สอดคล้องกัน ทำไมเรื่องนี้ถึงน่าประหลาดใจ
ไม่มีใคร

8
อีกตัวอย่างหนึ่ง: ทั่วไป0 หากคุณไม่ปฎิเส ธ มันก็หมายความว่าคุณมีหลักฐานว่าในบรรดาค่าอื่น ๆ ทั้งหมดในบรรทัดค่าเฉลี่ยที่แท้จริงคือ 0 .. ? คำตอบนี้ทำให้เข้าใจผิด! H0:μ=0
ทิม

3
ฉันชอบบัญชีหลักฐานของคุณ- ดูเหมือนว่าจะนำไปสู่ปัจจัยเบย์อย่างรวดเร็วในขณะที่วัดปริมาณการสนับสนุนข้อมูลของรุ่นหนึ่งเทียบกับอีกรุ่นหนึ่ง ไม่ให้ปากคำหรือต่อต้านμ 2 ? มันขึ้นอยู่กับความหนาแน่นก่อนหน้าของคุณสำหรับμ : ถ้าคุณคิดว่าμไม่ว่าจะอยู่ที่ใดที่ต่ำกว่า 2 หรือสูงกว่า 3 มากข้อมูลก็จะเป็นหลักฐาน หากคุณคิดว่าμมีแนวโน้มที่จะอยู่ที่ใดก็ได้ระหว่าง -10 และ 10 ข้อมูลจะแสดงหลักฐาน แต่ในการวิเคราะห์บ่อยครั้งระดับความเชื่อของคุณไม่ได้ถูกนำเสนอด้วยตัวเลขดังนั้นแนวคิดเรื่องหลักฐานใดบ้างที่นำมาใช้x¯=3μ2μμμ
Scortchi - Reinstate Monica

6
มันทำให้ฉันนึกถึงสมมติฐานของรีมันน์ เราค้นหาและมองหาค่าศูนย์ที่ไม่สำคัญนอกเส้นส่วนจริง 1/2 แต่หาไม่เจอ และในขณะที่เราไม่ได้พิจารณาสมมติฐานของรีมันน์จริงเพราะเราไม่ได้พิสูจน์มันนักคณิตศาสตร์ส่วนใหญ่เชื่อว่ามันเป็นความจริงและมีผลลัพธ์จำนวนมากที่เป็นจริงตามเงื่อนไขในสมมติฐานของรีมันน์เป็นจริง :) ดังนั้นในกรณีนี้เราได้ตีความ การขาดหลักฐานเป็นหลักฐานการขาด
Ant

29

NHST อาศัยค่า p ซึ่งบอกกับเราว่า: เมื่อสมมติฐานว่างเป็นจริงความน่าจะเป็นที่เราสังเกตการณ์ข้อมูลของเรา (หรือข้อมูลมากขึ้น) คืออะไร

เราสมมติว่าสมมติฐานว่างเป็นจริง - มันถูกอบเข้าสู่ NHST ว่าสมมติฐานว่างนั้นถูกต้อง 100% ค่า p ขนาดเล็กบอกเราว่าหากสมมติฐานว่างเป็นจริงข้อมูลของเรา (หรือข้อมูลที่มากที่สุด) นั้นไม่น่าเป็นไปได้

แต่ค่า p ที่มีขนาดใหญ่บอกอะไรเรา มันบอกเราว่ามีแนวโน้มว่าข้อมูลของเรา (หรือข้อมูลที่มากที่สุด) จากสมมติฐานว่างเปล่า

โดยทั่วไปแล้วP (A | B) ≠ P (B | A)

ลองนึกภาพคุณต้องการที่จะใช้ค่า p ที่มีขนาดใหญ่เป็นหลักฐานสำหรับสมมติฐานว่าง คุณจะต้องใช้ตรรกะนี้:

  • หากค่า NULL เป็นจริงแสดงว่ามีค่า p สูง ( อัปเดต: ไม่จริงดูความคิดเห็นด้านล่าง )
  • พบค่า p สูง
  • ดังนั้นค่า null จึงเป็นจริง

สิ่งนี้เกิดขึ้นในรูปแบบทั่วไปที่มากขึ้น:

  • ถ้า B เป็นจริงแสดงว่ามีแนวโน้มว่า
  • เกิดขึ้น
  • ดังนั้น B จึงเป็นจริง

นี่เป็นความผิดพลาด แต่อย่างที่สามารถเห็นได้จากตัวอย่าง:

  • หากมีฝนตกข้างนอกพื้นดินก็จะเปียก
  • พื้นดินเปียก
  • ดังนั้นจึงมีฝนตกนอก

พื้นดินอาจเปียกเพราะฝนตก หรืออาจเป็นเพราะสปริงเกอร์, ใครบางคนกำลังทำความสะอาดร่องน้ำของพวกเขา, สายน้ำขาด, และอื่น ๆ อีกมากตัวอย่างสามารถพบได้ในลิงค์ด้านบน

มันเป็นแนวคิดที่ยากมากที่จะเข้าใจ ถ้าเราต้องการหลักฐานว่าเป็นโมฆะจำเป็นต้องมีการอนุมานแบบเบย์ สำหรับฉันคำอธิบายที่เข้าถึงได้ง่ายที่สุดของตรรกะนี้คือโดย Rouder และคณะ (2016) ในกระดาษมีอาหารกลางวันฟรีในการอนุมาน? ตีพิมพ์ในหัวข้อวิทยาศาสตร์พุทธิปัญญา, 8, pp. 520–547


3
ฉันไม่ชอบตัวอย่างทั้งหมดของคุณที่สรุปว่า "X is true" การมีหลักฐานบางอย่างไม่เหมือนกับการสรุปบางสิ่งด้วยความมั่นใจ 100% ถ้าฉันออกไปข้างนอกและพื้นดินเปียกชื้นนั่นเป็นหลักฐานว่า "ฝนตก" หลักฐานดังกล่าวทำให้มีโอกาสเกิดฝนมากขึ้น
Atte Juvonen

นั่นยุติธรรม เราเตอร์และอัล กระดาษที่ฉันเชื่อมโยงไปถึงตอนท้ายของคำตอบของฉันไม่มีตัวอย่างที่มีข้อสรุปที่แน่นอน
ทำเครื่องหมายสีขาว

6
@AtteJuvonen ใช่เรามีบางหลักฐานฝน แต่เราไม่ทราบว่ามีแนวโน้มที่จะเป็นเพื่อให้ข้อสรุปที่เดียวที่คุณสามารถทำก็คือว่า"มันอาจจะฝนตกหรือมันอาจจะเป็นอย่างอื่นที่ทำให้พื้นดินเปียก" ดังนั้นคุณมีหลักฐานสรุปไม่ได้ เฉพาะบนพื้นฐานของสถิติแบบเบย์คุณสามารถสร้างอาร์กิวเมนต์ที่ตรงกันข้ามได้
ทิม

3
ฉันไม่เห็นด้วยกับข้อสรุปของคุณ "หากเราต้องการหลักฐานสำหรับโมฆะจำเป็นต้องมีการอนุมานแบบเบย์"; การศึกษาที่คุณอ้างถึงนั้นมาจาก Wagenmakers ซึ่งเป็นแกนนำแกนแข็งของแกนนำแบบเบส์ในสถิติเบย์ดังนั้นพวกเขาจึงยืนยันว่า แต่ในความเป็นจริงเราสามารถมีหลักฐาน "เป็นโมฆะ" ได้ง่ายในกระบวนทัศน์ที่พบบ่อยเช่นโดยการดำเนินการ TOST (การทดสอบด้านเดียวสอง) เพื่อความเท่าเทียมกัน (cc @AtteJuvonen)
อะมีบาพูดว่า Reinstate Monica


14

หากต้องการเข้าใจสิ่งที่ผิดปกติกับข้อสมมติโปรดดูตัวอย่างต่อไปนี้:

ลองนึกภาพสิ่งที่แนบมาในสวนสัตว์ที่คุณไม่สามารถเห็นผู้อยู่อาศัย คุณต้องการทดสอบสมมติฐานที่ลิงอาศัยอยู่โดยใส่กล้วยเข้าไปในกรงแล้วตรวจสอบว่ามันหายไปในวันถัดไปหรือไม่ นี่คือการทำซ้ำครั้งเพื่อเพิ่มนัยสำคัญทางสถิติ

ตอนนี้คุณสามารถกำหนดสมมติฐานว่างได้: เนื่องจากมีลิงอยู่ในคอกจึงมีความเป็นไปได้มากที่พวกเขาจะค้นหาและกินกล้วยดังนั้นถ้ากล้วยไม่มีการแตะต้องในแต่ละวันมันไม่น่าเป็นไปได้มากที่มีลิงอยู่

แต่ตอนนี้คุณเห็นแล้วว่ากล้วยหายไป (เกือบ) ในแต่ละวัน นั่นบอกคุณหรือไม่ว่ามีลิงอยู่ข้างใน?

ไม่แน่นอนเพราะมีสัตว์อื่น ๆ ที่ชอบกล้วยเช่นกันหรืออาจจะเป็นผู้ดูแลสวนสัตว์ที่ตั้งใจเอากล้วยออกทุกเย็น

ดังนั้นความผิดพลาดที่เกิดขึ้นในตรรกะนี้คืออะไร? ประเด็นก็คือคุณไม่รู้อะไรเลยเกี่ยวกับความน่าจะเป็นที่กล้วยจะหายไปถ้าไม่มีลิงอยู่ข้างใน หากต้องการยืนยันสมมติฐานว่างความน่าจะเป็นของกล้วยที่หายไปจะต้องมีขนาดเล็กหากสมมติฐานว่างนั้นผิด แต่สิ่งนี้ไม่จำเป็นต้องเป็นไปได้ ในความเป็นจริงเหตุการณ์อาจเป็นไปได้อย่างเท่าเทียมกัน (หรือเป็นไปได้มากขึ้น) หากสมมติฐานว่างนั้นผิด

คุณไม่สามารถพูดอะไรได้อย่างแน่นอนเกี่ยวกับความถูกต้องของสมมติฐานว่าง หากผู้ดูแลสวนนำกล้วยทั้งหมดออกทุกเย็นการทดลองนั้นไม่มีค่าอย่างสมบูรณ์แม้ว่ามันจะดูเหมือนว่าคุณได้ยืนยันสมมติฐานว่างแล้วก็ตาม


นี่ควรเป็นคำตอบที่ยอมรับได้
Emily L.

2
@ amoeba ในกรณีนี้ hyp hyp จะเป็นลิงที่อยู่ในกรง Alt hyp คงเป็นไปได้ว่าไม่มีลิงอยู่ในกรง ตัวอย่างที่ฉันรวบรวมคือการสังเกต "กล้วยหายไป" และ "กล้วยยังอยู่ที่นั่น" ทุกเช้า ด้วยสมมติฐานหลายประการเกี่ยวกับลิงและความสามารถในการหากล้วยฉันสามารถคำนวณความน่าจะเป็นที่ฉันจะได้เห็นผลลัพธ์ที่แท้จริงกับลิงในกรง หากกล้วยยังคงอยู่ที่นั่นบ่อยครั้งฉันจะปฏิเสธค่า hyp เป็นศูนย์ หากกล้วยหายไปตลอดเวลาสิ่งนี้จะเข้ากับสภาวะไร้ค่า แต่มันไม่ได้พิสูจน์ว่าลิงอยู่ในกรง
Thern

1
@ amoeba ฉันไม่แน่ใจว่ามันเป็นไปได้ที่จะแปลตัวอย่างลิงโดยตรงกับสถานการณ์การทดสอบ t ของคุณหรือไม่ ตามความรู้ของฉันการทดสอบสมมติฐานว่างโดยทั่วไปหมายถึงสิ่งที่มาร์กไวท์เขียนไว้ในคำตอบของเขาว่า: "เนื่องจากสมมติฐานว่างเป็นจริงความน่าจะเป็นที่เราสังเกตการณ์ข้อมูลของเราคืออะไร สถานการณ์การทดสอบ t ของคุณเป็นกรณีเฉพาะของเรื่องนี้ แต่ตอนนี้ฉันไม่เห็นว่าภาพรวมนี้จะเป็นอย่างไร จากความรู้สึกของฉันฉันจะบอกว่าสถานการณ์ของคุณและตัวอย่างลิงเป็นวิธีการทดสอบสมมติฐานสองวิธีที่ไม่สามารถแมปเข้าหากันโดยตรง
Thern

1
ถ้าอย่างนั้น @ เนแบรสกาฉันก็สับสนอีกครั้งเกี่ยวกับความหมายของตัวอย่างลิงของคุณ การทดสอบทีน่าจะเป็นการทดสอบสมมติฐานที่พบบ่อยที่สุด ฉันพูดถึงมันในความคิดเห็นของฉันเพียงเพราะมันเป็นตัวอย่างทั่วไปของการทดสอบ หากตัวอย่างลิงของคุณใช้ไม่ได้ (ตามที่คุณพูด) นี่เป็นเรื่องปกติ! - สถานการณ์จากนั้นฉันก็สับสนกับความหมายของมัน ในความเป็นจริงถ้าคุณบอกว่าตัวอย่างการทดสอบ t และลิงเป็น "การทดสอบสมมุติฐานสองวิธี" คุณสามารถให้ตัวอย่างการทดสอบทางสถิติที่เป็นไปตามตัวอย่างลิงของคุณได้หรือไม่? ตัวอย่างลิงของคุณคืออะไรกันแน่?
อะมีบาพูดว่า Reinstate Monica

1
@ เนบราสก้าฉันยอมรับว่าเป็นคำถามทั่วไป แต่ถ้าคุณไม่สามารถให้ฉันคนเดียวตัวอย่างของการทดสอบทางสถิติจริงที่จะมีคุณสมบัติเช่นเดียวกับตัวอย่างเช่นลิงของคุณแล้วฉันขอโทษ แต่ฉันจะต้องพิจารณาเช่นลิงของคุณสวยมากไม่เกี่ยวข้องสำหรับหัวข้อนี้ ฉันไม่ได้บอกว่าตัวอย่างลิงต้องสอดคล้องกับการทดสอบแบบที แต่มันต้องสอดคล้องกับบางสิ่งบางอย่าง !!
อะมีบาพูดว่า Reinstate Monica

14

ในบทความที่มีชื่อเสียงของเขาเหตุใดผลการวิจัยที่ตีพิมพ์มากที่สุดเป็นเท็จ Ioannidis ใช้การใช้เหตุผลแบบเบย์และการผิดอัตราฐานเพื่อยืนยันว่าการค้นพบส่วนใหญ่เป็นผลบวกเท็จ ไม่นานความน่าจะเป็นหลังการศึกษาที่สมมติฐานการวิจัยเฉพาะนั้นขึ้นอยู่กับความน่าจะเป็นก่อนการศึกษาของสมมติฐานดังกล่าว (เช่นอัตราฐาน)

เป็นการตอบสนองMoonesinghe และคณะ (2007)ใช้กรอบงานเดียวกันเพื่อแสดงให้เห็นว่าการจำลองแบบช่วยเพิ่มความน่าจะเป็นหลังการศึกษาของสมมติฐานที่เป็นจริงอย่างมาก สิ่งนี้สมเหตุสมผล: หากการศึกษาหลาย ๆ ครั้งสามารถจำลองการค้นพบที่แน่นอนเรามั่นใจว่าสมมติฐานที่คาดเดานั้นเป็นจริง

αความน่าจะเป็นหลังเรียน

กราฟแสดงให้เห็นว่าหากการศึกษาอย่างน้อย 5 จาก 10 การศึกษาล้มเหลวที่จะให้ความสำคัญความน่าจะเป็นหลังการศึกษาของเราที่สมมติฐานเป็นจริงเกือบ 0 ความสัมพันธ์เดียวกันมีอยู่สำหรับการศึกษาเพิ่มเติม การค้นพบนี้ทำให้รู้สึกถึงสัญชาตญาณ: การล้มเหลวซ้ำ ๆ ในการค้นหาเอฟเฟกต์จะช่วยเพิ่มความเชื่อของเราว่า เหตุผลนี้สอดคล้องกับคำตอบที่ยอมรับโดย @RPL

ในกรณีที่สองสมมติว่าการศึกษามีพลังเพียง 50% (เท่ากันทั้งหมด)ความน่าจะเป็นหลังเรียน _pow50

ตอนนี้ความน่าจะเป็นหลังการศึกษาของเราลดลงช้ากว่าเพราะทุกการศึกษามีเพียงพลังงานต่ำในการค้นหาเอฟเฟกต์ถ้ามันมีอยู่จริง


โปรดทราบว่าคุณได้รับหลักฐานทั้งหมดเกี่ยวกับสมมติฐานว่างจากกรณีที่การทดสอบล้มเหลวสมมติฐานนี้ แต่สมมติฐานจาก OP คือการทดสอบยืนยันสมมติฐานว่าง ("ถ้าเราทำการศึกษาขนาดใหญ่และเราไม่พบหลักฐานสำคัญทางสถิติเทียบกับสมมติฐานว่างนั่นไม่ใช่หลักฐานสำหรับสมมติฐานว่างหรือไม่") สิ่งนี้สอดคล้องกับส่วนซ้ายสุดของไดอะแกรมของคุณและในกรณีที่ความน่าจะเป็นของเอฟเฟกต์ยังคง 50% (หรือโดยทั่วไปความน่าจะเป็นก่อนการศึกษา) ดังนั้นคุณจึงไม่ได้รับอะไรเลย
Thern

@ เนบราสก้าฉันไม่เข้าใจ หากเราทำการศึกษาขนาดใหญ่จำนวน 1 ครั้ง (กล่าวว่ากำลัง 95%) และเราล้มเหลวในการหาหลักฐานเทียบกับสมมติฐานว่าง (เช่นการทดสอบสมมติฐานทางสถิติไม่ได้มีนัยสำคัญในระดับ 5%) ความน่าจะเป็นหลังการศึกษาของเราจะ 0.05 ในกรอบดังกล่าว (มีความน่าจะเป็นก่อนการศึกษา 50%)
COOLSerdash

1
@ เนแบรสกาความคิดเห็นสุดท้ายของคุณไม่สมเหตุสมผล: หากผลลัพธ์ไม่สำคัญก็ไม่น่าจะเป็น "ความผิดพลาดเชิงบวก"
อะมีบาพูดว่า Reinstate Monica

1
@Nebr If you have a negative, you found evidence against the null- อะไรนะ? คำว่า "ลบ" มีความหมายตรงข้ามกันทุกประการ p-value ที่สำคัญเรียกว่าผลลัพธ์ "บวก" ที่ไม่สำคัญคือ "เชิงลบ"
อะมีบาพูดว่า Reinstate Monica

1
@ พลังงาน 100% ไม่ได้หมายความว่า "ถ้า H0 เป็นจริงเราสามารถมั่นใจได้ว่าเราจะเห็น H1" หมายความว่าถ้า H1 เป็นจริงเราจะเห็น H1 เสมอ ฉันจะไม่พยายามอ่านความคิดเห็นของคุณอีกต่อไปเพราะทุกประโยคสับสน
อะมีบาพูดว่า Reinstate Monica

12

คำอธิบายที่ดีที่สุดที่ฉันเคยเห็นสำหรับเรื่องนี้มาจากคนที่ฝึกวิชาคณิตศาสตร์

H0H1H1H0H1H1H0H0


4
บางทีคุณควรดูที่หัวข้อนี้: stats.stackexchange.com/questions/163957/…

10

หากคุณไม่ชอบผลลัพธ์ของการทดสอบสมมติฐาน แต่ไม่ได้เตรียมที่จะทำการกระโดดอย่างเต็มรูปแบบไปยังวิธีการแบบเบย์

4207820913[0.492,0.502]

1212


2
Bayesian เกี่ยวกับช่วงความมั่นใจคืออะไร
kjetil b halvorsen

3
@kjetilbhalvorsen: ช่วงความมั่นใจไม่ใช่ Bayesian (ช่วงเวลาที่น่าเชื่อถือ) แต่ช่วงความเชื่อมั่นจะให้ข้อมูลเพิ่มเติมเกี่ยวกับหลักฐานจากนั้นจึงมีการปฏิเสธสมมติฐาน / การปฏิเสธที่ไม่ซับซ้อน
Henry

9

มันอาจจะเป็นการดีกว่าถ้าจะบอกว่าการไม่ปฏิเสธสมมติฐานว่างนั้นไม่ได้เป็นหลักฐานสำหรับสมมติฐานว่าง เมื่อเราพิจารณาความเป็นไปได้ของข้อมูลอย่างเต็มที่แล้วซึ่งพิจารณาปริมาณของข้อมูลอย่างชัดเจนมากขึ้นข้อมูลที่รวบรวมอาจให้การสนับสนุนพารามิเตอร์ที่อยู่ในสมมติฐานว่าง

อย่างไรก็ตามเราควรคิดอย่างรอบคอบเกี่ยวกับสมมติฐานของเรา โดยเฉพาะอย่างยิ่งความล้มเหลวในการปฏิเสธสมมติฐานที่เป็นโมฆะจุดนั้นไม่ได้เป็นหลักฐานที่ดีมากว่าสมมติฐานของประเด็นนั้นเป็นความจริง ในความเป็นจริงมันรวบรวมหลักฐานที่แสดงว่ามูลค่าที่แท้จริงของพารามิเตอร์นั้นอยู่ไม่ไกลจากจุดที่สงสัย จุดสมมติฐานว่างอยู่ในระดับที่ค่อนข้างประดิษฐ์สร้างและส่วนใหญ่คุณมักจะไม่เชื่อจริง ๆ ว่าพวกเขาจะเป็นจริงอย่างแน่นอน

มันมีเหตุผลมากขึ้นที่จะพูดคุยเกี่ยวกับการไม่ปฏิเสธการสนับสนุนสมมติฐานว่างถ้าคุณสามารถย้อนกลับสมมติฐานว่างเปล่าและทางเลือกและถ้าทำเช่นนั้นคุณจะปฏิเสธสมมติฐานว่างใหม่ของคุณ เมื่อคุณพยายามทำเช่นนั้นด้วยสมมติฐานว่างจุดมาตรฐานคุณจะเห็นได้ทันทีว่าคุณจะไม่สามารถปฏิเสธส่วนเติมเต็มของมันได้เพราะจากนั้นสมมติฐานว่างกลับของคุณจะมีค่าอยู่ใกล้กับจุดที่พิจารณาโดยพลการ

H0:|μ|δHA:|μ|>δμμδ+δ1α[δ,+δ]


4
+1 IMHO นี้ควรเป็นคำตอบที่ยอมรับได้ ฉันไม่เข้าใจว่าทำไมมันมี upvotes น้อยมาก
อะมีบาพูดว่า Reinstate Monica

1
@amoeba เนื่องจากมีการโพสต์ล่าช้า แต่ฉันเห็นด้วยและ +1 แล้ว
ทิม

6

มันค่อนข้างขึ้นอยู่กับว่าคุณใช้ภาษาอย่างไร ภายใต้ทฤษฎีการตัดสินใจของเพียร์สันและเนย์แมนมันไม่ได้เป็นหลักฐานสำหรับโมฆะ แต่คุณต้องทำตัวเหมือนเป็นโมฆะ

ความยากลำบากมาจากวิธีการเก็บเงิน วิธีการแบบเบย์เป็นรูปแบบหนึ่งของการใช้เหตุผลเชิงอุปนัยและเป็นรูปแบบของการใช้เหตุผลที่ไม่สมบูรณ์ วิธีการตั้งสมมติฐานแบบ Null นั้นเป็นรูปแบบที่น่าจะเป็นของผู้ใช้โทมัสและเป็นส่วนหนึ่งของการใช้เหตุผลแบบนิรนัยดังนั้นจึงเป็นรูปแบบที่สมบูรณ์ของการใช้เหตุผล

Modus tollens มีรูปแบบ "ถ้า A เป็นจริงจากนั้น B เป็นจริงและ B ไม่เป็นความจริงดังนั้น A ไม่จริง" ในรูปแบบนี้ถ้าเป็นจริงแล้วข้อมูลจะปรากฏในลักษณะเฉพาะพวกเขาจะไม่ปรากฏในลักษณะนั้นดังนั้น (ในระดับความมั่นใจ) เป็นโมฆะไม่เป็นความจริง (หรืออย่างน้อยก็คือ "ปลอมแปลง" ."

ปัญหาคือคุณต้องการ "ถ้าเป็นแล้ว B และ B. " จากนี้คุณต้องการอนุมาน A แต่ไม่ถูกต้อง "ถ้าเป็น A แล้ว B" จะไม่รวม "ถ้าไม่ใช่ A B" ก็เป็นคำสั่งที่ถูกต้องเช่นกัน พิจารณาคำแถลงว่า "ถ้าเป็นหมีแล้วก็สามารถว่ายน้ำได้มันเป็นปลา (ไม่ใช่หมี)" คำกล่าวไม่ได้พูดถึงความสามารถของผู้ที่ไม่ใช่หมีว่ายน้ำ

ความน่าจะเป็นและสถิติเป็นสาขาหนึ่งของวาทศาสตร์และไม่ใช่สาขาวิชาคณิตศาสตร์ มันเป็นผู้ใช้ทางคณิตศาสตร์อย่างหนัก แต่ไม่ได้เป็นส่วนหนึ่งของคณิตศาสตร์ มันมีอยู่ด้วยหลายเหตุผลชักชวนการตัดสินใจหรือการอนุมาน มันขยายวาทศาสตร์ในการอภิปรายที่มีระเบียบวินัยของหลักฐาน


1
+1 สำหรับการกล่าวถึง Neyman และ Pearson (ดูstats.stackexchange.com/questions/125541 )
อะมีบาพูดว่า Reinstate Monica

5

ฉันจะพยายามแสดงตัวอย่างด้วยตัวอย่าง

μx¯H0:μ=μiμiμ0x¯μ

H1:μ=MH0:μ=μ0μμ0μ<μ0μ>μ0


"ตอนนี้เรามีหลักฐานμมูลค่าเท่าไหร่?" - เรามีหลักฐานที่แข็งแกร่งกว่าสำหรับค่าใกล้เคียงกับค่าเฉลี่ยตัวอย่างและหลักฐานที่อ่อนแอกว่าสำหรับค่าเพิ่มเติมจากค่าเฉลี่ยตัวอย่าง ความแข็งแรงหรือความอ่อนแอขึ้นอยู่กับขนาดตัวอย่างและความแปรปรวน มีสิ่งผิดปกติเกิดขึ้นกับการตีความนี้หรือไม่?
Atte Juvonen

ใช่นี่เป็นการตีความที่ผิด ค่า P ไม่ใช่ความน่าจะเป็นของสมมติฐานว่างเปล่าที่เป็นจริงหรือความแข็งแรงของหลักฐานที่สนับสนุนสมมติฐานว่าง ในทำนองเดียวกันคุณสามารถประเมินช่วงเวลาโดยมีค่าเฉลี่ยตัวอย่างในช่วงกลางของช่วงเวลา แต่นี่ไม่ได้หมายความว่ามีความน่าจะเป็นที่สูงขึ้นของค่าเฉลี่ยประชากรใกล้เคียงกับช่วงกลาง มีการอ้างอิงถึงคำอธิบายที่ดีเกี่ยวกับการตีความที่ผิดในความคิดเห็นโดย Dominic Comtois กับคำถามของคุณ
Macond

"นี่ไม่ได้หมายความว่ามีความเป็นไปได้สูงที่ประชากรจะอยู่ใกล้กับช่วงกลาง" - สิ่งนี้ไม่ถูกต้อง ฉันอ่านกระดาษ แต่ไม่สามารถหาอะไรมายืนยันได้
Atte Juvonen

μμP(A|B)P(B|A)

4

x¯0tH0:x¯=μμ=0.5p>0.05H0μ=0.5tpμ=0.5μ=0.5

สมมติฐานทางเลือกสองทาง

pH0pH0 H1μμμ

L(μ|X)=f(X|μ)

μ^μ^μ^f(μ|X)f(X|μ)f(μ|X)μ^. สิ่งนี้นำไปสู่ทฤษฎีบทของเบย์

f(μ|X)=f(X|μ)f(μ)f(X|μ)f(μ)dμ

μμ^μ

H1H0H0เป็นต้นถ้าคุณขอหมายเลขจากเธอเธอจะให้หมายเลขนั้นกับคุณ แต่ตัวเลขนั้นจะไม่สามารถเปรียบเทียบกันได้ ปัญหาคือว่าการทดสอบสมมติฐาน / oracle ทำงานในกรอบซึ่งเธอสามารถให้คำตอบที่สรุปสำหรับคำถามที่ถามว่าข้อมูลสอดคล้องกับสมมติฐานบางอย่างไม่ใช่วิธีอื่น ๆ เนื่องจากคุณไม่ได้พิจารณาสมมติฐานอื่น ๆ


2

ลองทำตามตัวอย่างง่ายๆ

สมมติฐานว่างของฉันคือข้อมูลของฉันเป็นไปตามการแจกแจงแบบปกติ สมมุติฐานทางเลือกคือการแจกแจงข้อมูลของฉันไม่ปกติ

ฉันวาดตัวอย่างสุ่มสองตัวอย่างจากการแจกแจงเครื่องแบบใน [0,1] ฉันทำอะไรไม่ได้มากกับตัวอย่างเพียงสองตัวอย่างดังนั้นฉันจะไม่สามารถปฏิเสธสมมติฐานว่างได้

นั่นหมายความว่าฉันสามารถสรุปข้อมูลของฉันตามการแจกแจงปกติได้หรือไม่ ไม่มันเป็นการกระจายตัวที่สม่ำเสมอ !!

ปัญหาคือฉันได้ตั้งสมมติฐานเชิงบรรทัดฐานในสมมติฐานว่าง ดังนั้นฉันไม่สามารถสรุปได้ว่าสมมติฐานของฉันถูกต้องเพราะฉันไม่สามารถปฏิเสธได้


3
ฉันไม่คิดว่าการศึกษาที่มี 2 ตัวอย่างจะถือว่าเป็น "การศึกษา" ทันทีที่เราวาดจุดข้อมูลในจำนวนที่เหมาะสมตัวอย่างนี้จะไม่ทำงาน ถ้าเราดึงจุดข้อมูล 1,000 จุดและพวกมันดูเหมือนการกระจายตัวแบบสม่ำเสมอเรามีหลักฐานที่ต่อต้านสมมติฐานว่างของเรา หากเราดึงจุดข้อมูล 1,000 จุดและพวกมันดูเหมือนการแจกแจงแบบปกติเรามีหลักฐานสำหรับสมมติฐานว่างของเรา
Atte Juvonen

1
@AtteJuvonen คำตอบของฉันไม่ได้เป็นความพยายามที่จะกำหนดสิ่งที่การศึกษาควรจะเป็น ฉันแค่พยายามยกตัวอย่างง่ายๆเพื่อแสดงให้เห็นถึงการขาดพลังทางสถิติสำหรับคำถาม เราทุกคนรู้ว่า 2 ตัวอย่างไม่ดี
SmallChess

4
ขวา. ฉันแค่บอกว่าตัวอย่างของคุณแสดงให้เห็นถึงปัญหาของการวาดข้อสรุปจาก 2 ตัวอย่าง มันไม่ได้แสดงปัญหาของการวาดหลักฐานสำหรับสมมติฐานว่าง
Atte Juvonen


0

ไม่มันไม่ใช่หลักฐานเว้นแต่คุณจะมีหลักฐานว่าเป็นหลักฐาน ฉันไม่ได้พยายามที่จะน่ารัก แต่เป็นตัวอักษร คุณมีโอกาสที่จะเห็นข้อมูลดังกล่าวเพียงอย่างเดียวเนื่องจากข้อสันนิษฐานของคุณนั้นเป็นจริง นั่นคือทั้งหมดที่คุณได้รับจากค่า p (ถ้าเป็นเช่นนั้นเนื่องจากค่า p ขึ้นอยู่กับสมมติฐานของตัวเอง)

คุณสามารถนำเสนอการศึกษาที่แสดงให้เห็นว่าสำหรับการศึกษาที่ "ล้มเหลว" เพื่อสนับสนุนสมมติฐานว่างเปล่า, สมมติฐานว่างส่วนใหญ่กลายเป็นจริงหรือไม่? หากคุณสามารถค้นหาการศึกษานั้นความล้มเหลวของคุณที่จะพิสูจน์สมมติฐานว่างอย่างน้อยสะท้อนให้เห็นถึงโอกาสที่ทั่วไปมากว่าเป็นโมฆะ ฉันพนันได้เลยว่าคุณไม่มีการศึกษา เนื่องจากคุณไม่มีหลักฐานที่เกี่ยวข้องกับสมมติฐานว่างเปล่าที่เป็นจริงโดยอิงตามค่า p คุณเพียงแค่เดินจากมือเปล่าไป

คุณเริ่มต้นด้วยการสมมติว่าค่า Null ของคุณเป็นจริงเพื่อให้ได้ค่า p ดังนั้นค่า p จึงไม่สามารถบอกอะไรคุณเกี่ยวกับค่า Null เพียงเกี่ยวกับข้อมูลเท่านั้น ลองคิดดู มันเป็นการอนุมานทิศทางเดียว - คาบ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.