เหตุใดเราจึงปฏิเสธสมมติฐานว่างที่ระดับ 0.05 และไม่ใช่ระดับ 0.5 (อย่างที่เราทำในการจำแนกประเภท)


11

การทดสอบสมมติฐานจะคล้ายกับปัญหาการจำแนกประเภท ดังนั้นเราจึงมี 2 ป้ายกำกับที่เป็นไปได้สำหรับการสังเกต (เรื่อง) - ความผิดเทียบกับการไม่ผิด ปล่อยให้ผู้ที่ไม่มีความผิดเป็นสมมุติฐานว่าง หากเราดูปัญหาจากมุมมองการจัดหมวดหมู่เราจะฝึกอบรมลักษณนามซึ่งจะทำนายความน่าจะเป็นของเรื่องที่อยู่ในแต่ละชั้นเรียนทั้งสองได้รับข้อมูล จากนั้นเราจะเลือกคลาสที่มีความน่าจะเป็นสูงสุด ในกรณีนั้นความน่าจะเป็น 0.5 จะเป็นเกณฑ์ปกติ เราอาจแตกต่างกันไปตามเกณฑ์ในกรณีที่เรากำหนดค่าใช้จ่ายที่แตกต่างให้กับข้อผิดพลาดที่เป็นเท็จบวกกับลบ แต่ไม่ค่อยเราจะไปสุดโต่งเช่นการตั้งค่าเกณฑ์ที่ 0.05 คือกำหนดเรื่องให้กับ Class "ผิด" เฉพาะในกรณีที่น่าจะเป็น 0.95 หรือสูงกว่า แต่ถ้าฉันเข้าใจดี นี่คือสิ่งที่เรากำลังทำอยู่เป็นแบบฝึกหัดมาตรฐานเมื่อเรามองปัญหาเดียวกันกับปัญหาของการทดสอบสมมติฐาน ในกรณีหลังนี้เราจะไม่กำหนดป้ายกำกับ "ไม่ใช่ผู้กระทำผิด" - เทียบเท่ากับกำหนดป้ายกำกับ "ผู้กระทำผิด" - เฉพาะในกรณีที่ความเป็นไปได้ที่จะเป็น "ผู้กระทำผิด" น้อยกว่า 5% และบางทีนี่อาจสมเหตุสมผลถ้าเราต้องการหลีกเลี่ยงการลงโทษผู้บริสุทธิ์ แต่ทำไมกฎนี้ควรเหนือกว่าในโดเมนทั้งหมดและทุกกรณี

การตัดสินใจว่าสมมติฐานใดที่จะนำมาใช้นั้นเทียบเท่ากับการกำหนดตัวประมาณความจริงที่ให้ไว้กับข้อมูล ในการประมาณค่าความน่าจะเป็นสูงสุดเรายอมรับสมมติฐานที่มีแนวโน้มที่จะได้รับข้อมูลมากขึ้น - ไม่จำเป็นว่าจะมีโอกาสมากกว่า ดูกราฟด้านล่าง:

ป้อนคำอธิบายรูปภาพที่นี่

การใช้วิธีความเป็นไปได้สูงสุดเราจะสนับสนุนสมมติฐานทางเลือกในตัวอย่างนี้หากค่าของ Predictor สูงกว่า 3 เช่น 4 แม้ว่าความน่าจะเป็นที่ค่านี้จะได้รับมาจากสมมติฐานของ Null จะมีขนาดใหญ่กว่า 0.05

และในขณะที่ตัวอย่างที่ฉันเริ่มโพสต์อาจมีค่าใช้จ่ายด้านอารมณ์ แต่เราสามารถนึกถึงกรณีอื่น ๆ เช่นการปรับปรุงทางเทคนิค ทำไมเราควรให้ความได้เปรียบกับสถานะที่เป็นอยู่เมื่อข้อมูลบอกเราว่าความน่าจะเป็นที่โซลูชั่นใหม่มีการปรับปรุงมากกว่าความน่าจะเป็นที่ไม่ใช่


1
โดยพื้นฐานแล้วมันขึ้นอยู่กับมุมมองของ RA Fisher เกี่ยวกับสถิติในฐานะเครื่องมือทางวิทยาศาสตร์ (เชื่อสมมติฐานหนึ่งครั้งจนกว่าคุณจะมีหลักฐานเพียงพอ) และประสบการณ์ของเขาที่ค่าเบี่ยงเบนมาตรฐานดูเหมือนจะให้สมดุลที่มีประโยชน์ระหว่างการปฏิเสธสมมติฐานว่างบ่อยเกินไป และไม่บ่อยพอ2
Henry

1
OP มีความถูกต้องว่าสถานที่มีข้อบกพร่องที่นี่ไม่มีอะไรในกระบวนการ NHST แบบดั้งเดิมที่ต้องการให้เราปฏิเสธ 5% นี่คือปรากฏการณ์ทางวัฒนธรรมของมูลค่าที่ถกเถียงกัน
Matthew Drury

1
@ Matthew Drury: "เลือกคนที่สูงสำหรับทีมบาสเก็ตบอล" ไม่ได้มีข้อบกพร่องเหมือนกลยุทธ์เพียงเพราะมันไม่ได้รวมความสูงเป็นกฎที่แม่นยำ แม้ว่าจะมีปัญหาอื่น ๆ อีกมากมายดังที่คุณทราบการให้ผู้ใช้เลือกตำแหน่งที่จะวาดเส้นนั้นเป็นคุณสมบัติของ NHST ความเกลียดชังต่อความเสี่ยงของฉันไม่ได้ออกกฎการเดินทางไปปารีสหรือลอนดอนเมื่อไม่นานมานี้ แต่จะแยกแยะการเยี่ยมชมไปยังหลาย ๆ ประเทศ: คนอื่นจะวาดเส้นที่แตกต่างกัน ฉันยอมรับว่ามีปรากฏการณ์ทางวัฒนธรรม [sic] ในขณะที่กลุ่มที่แตกต่างกันมีการประชุมที่แตกต่างกันเมื่อจะปฏิเสธสมมติฐาน
Nick Cox

ฉันไม่แน่ใจว่าคุณกำลังอ่านความคิดเห็นของฉันคืออะไร Nick ฉันคิดว่าฉันควรจะชัดเจนมากขึ้น ฉันแค่หวังว่าผู้คนจะคิดมากขึ้นเพื่อกำหนดเกณฑ์เฉพาะของปัญหา
Matthew Drury

ดูเหมือนว่าคุณ (เอ็ด) จะบอกว่า NHST มีข้อบกพร่องเพราะไม่ได้หมายความถึงระดับการปฏิเสธที่เฉพาะเจาะจง ฉันเห็นด้วยกับคุณเกี่ยวกับเกณฑ์เฉพาะปัญหา
Nick Cox

คำตอบ:


17

สมมติว่าคุณท้ายศาลและคุณไม่ได้ทำ คุณคิดว่ามันยุติธรรมหรือไม่ที่คุณยังมีโอกาสถูกตัดสินว่ามีความผิด 50%? มีโอกาส 50% ที่จะเป็นผู้บริสุทธิ์ "มีความผิดโดยปราศจากข้อสงสัยอันสมเหตุสมผล " หรือไม่? คุณจะคิดว่ามันยุติธรรมที่คุณมีโอกาส 5% ที่จะถูกตัดสินว่ามีความผิดแม้ว่าคุณจะไม่ได้ทำก็ตาม ถ้าฉันอยู่ในศาลฉันจะพิจารณา 5% ที่ไม่เข้มงวดพอ

คุณถูกต้องที่ 5% นั้นเป็นสิ่งที่ไม่แน่นอน เราสามารถเลือก 2% หรือ 1% หรือถ้าคุณเป็นคนโง่ % หรือ % มีคนที่เต็มใจที่จะยอมรับ 10% แต่ 50% จะไม่เป็นที่ยอมรับeπe


ในการตอบคำถามของคุณ:

ความคิดของคุณจะสมเหตุสมผลถ้าสร้างสมมติฐานทั้งหมดเท่ากัน อย่างไรก็ตามนั่นไม่ใช่กรณี เรามักจะดูแลเกี่ยวกับสมมติฐานทางเลือกเพื่อให้เราเสริมสร้างข้อโต้แย้งของเราถ้าเราเลือกที่ต่ำ\ในแง่นั้นตัวอย่างที่คุณเลือกเริ่มแรกแสดงให้เห็นถึงจุดนั้นได้ดีα


6
+1 "5% โดยพลการ" นักสถิติใน Academia: "เราสอนเพราะนั่นคือสิ่งที่พวกเขาใช้ในอุตสาหกรรม" สถิติในอุตสาหกรรม: "เราใช้เพราะนั่นคือสิ่งที่เราสอนในมหาวิทยาลัย" α = 0.05α=0.05α=0.05
knrumsey

8

มันก็เหมือนกับที่คุณพูด - มันขึ้นอยู่กับความผิดพลาดที่เป็นบวกและเท็จลบที่สำคัญ

ในตัวอย่างที่คุณใช้ตามที่ Maarten Buis ตอบแล้วถูกตัดสินว่ามีโอกาส 50% ที่คุณเป็นผู้บริสุทธิ์ที่ไม่ยุติธรรม

เมื่อนำไปใช้กับการวิจัยให้ดูที่วิธีนี้: ลองนึกภาพคุณต้องการทราบว่ายาใหม่บางชนิดช่วยต่อต้านโรคบางชนิดได้หรือไม่ สมมติว่าคุณพบความแตกต่างระหว่างกลุ่มการรักษาและกลุ่มควบคุมของคุณเพื่อประโยชน์ในการรักษา ที่ดี! ยาต้องทำงานใช่ไหม คุณสามารถปฏิเสธสมมติฐานว่างเปล่าที่ว่ายาไม่ทำงาน ค่าpของคุณคือ 0.49! มีโอกาสสูงกว่าที่เอฟเฟกต์ที่คุณพบจะมาจากความจริงมากกว่าโดยบังเอิญ!
พิจารณาสิ่งนี้: ยานี้มีผลร้าย คุณแค่อยากจะทำก็ต่อเมื่อคุณมั่นใจว่ามันใช้งานได้ แล้วคุณล่ะ ไม่เพราะยังมีโอกาส 51% ที่ความแตกต่างที่คุณพบระหว่างทั้งสองกลุ่มนั้นเป็นไปโดยบังเอิญ

ฉันสามารถจินตนาการได้ว่ามีโดเมนที่คุณพอใจเช่น 10% ฉันเคยเห็นบทความที่ยอมรับ 10% ฉันเคยเห็นบทความที่พวกเขาเลือก 2% ขึ้นอยู่กับว่าคุณคิดว่าสำคัญเพียงใดที่คุณเชื่อว่าการปฏิเสธสมมติฐานว่างจะขึ้นอยู่กับความจริงไม่ใช่โอกาส ฉันแทบจินตนาการไม่ถึงสถานการณ์ที่คุณพอใจกับโอกาส 50% ที่ความแตกต่างที่คุณพบนั้นขึ้นอยู่กับโชคที่บริสุทธิ์


5

คำตอบอื่น ๆ ได้ชี้ให้เห็นว่าทุกอย่างขึ้นอยู่กับว่าคุณจะค่อนข้างมีค่าความผิดพลาดที่เป็นไปได้ที่แตกต่างกันและในบริบททางวิทยาศาสตร์อาจค่อนข้างเหมาะสมยิ่งมากขึ้นตามเกณฑ์ที่เข้มงวดนอกจากนี้ยังอาจเกิดขึ้นค่อนข้างเหมาะสม แต่ที่ไม่น่าจะ มีเหตุผล นั่นเป็นความจริงทั้งหมด แต่ให้ฉันทำสิ่งนี้ในทิศทางที่แตกต่างและท้าทายสมมติฐานที่อยู่เบื้องหลังคำถาม .50.05.50


คุณใช้ "[h] การทดสอบ ypothesis [เป็น] คล้ายกับปัญหาการจำแนกประเภท" ความคล้ายคลึงกันที่ชัดเจนที่นี่เป็นเพียงผิวเผินเท่านั้น นั่นไม่จริงในความหมายที่แท้จริง

ในปัญหาการจำแนกเลขฐานสองมีแค่สองคลาสเท่านั้น ที่สามารถสร้างขึ้นได้อย่างแน่นอนและเป็นที่นิยม การทดสอบสมมติฐานไม่เป็นเช่นนั้น รูปภาพของคุณแสดงโมฆะและสมมติฐานทางเลือกเนื่องจากมักวาดเพื่อแสดงการวิเคราะห์พลังงานหรือตรรกะของการทดสอบสมมติฐานในคลาส Stats 101 รูปที่แสดงให้เห็นว่ามีความเป็นหนึ่งสมมติฐานและหนึ่งสมมติฐานทางเลือก ในขณะที่มัน (ปกติ) จริงที่มีเพียงหนึ่งเดียวที่เป็นทางเลือกไม่ได้รับการแก้ไขให้เป็นเพียงค่าจุดเดียวของ (พูด) หมายถึงความแตกต่าง เมื่อวางแผนการศึกษานักวิจัยมักจะเลือกค่าต่ำสุดที่พวกเขาต้องการที่จะตรวจจับ สมมุติว่าในการศึกษาบางอย่างมันเป็นการเปลี่ยนค่าเฉลี่ยของ.67 .67.67SDS ดังนั้นพวกเขาจึงออกแบบและเพิ่มพลังการศึกษาของพวกเขาตามนั้น ตอนนี้ลองนึกดูว่าผลลัพธ์มีความสำคัญ แต่ดูเหมือนจะไม่คุ้มค่า พวกเขาไม่เพียงแค่เดินไป! อย่างไรก็ตามนักวิจัยจะสรุปว่าการรักษามีความแตกต่าง แต่ปรับความเชื่อของพวกเขาเกี่ยวกับขนาดของผลตามการตีความผล หากมีการศึกษาหลายรายการการวิเคราะห์เมตาจะช่วยปรับปรุงผลที่แท้จริงตามที่สะสมข้อมูล กล่าวอีกนัยหนึ่งทางเลือกที่เสนอในระหว่างการวางแผนการศึกษา (และที่วาดในรูปของคุณ) ไม่ได้เป็นทางเลือกเอกพจน์จริงๆที่นักวิจัยจะต้องเลือกระหว่างมันและโมฆะเป็นตัวเลือกเท่านั้น .67

มาทำแบบนี้กันเถอะ คุณสามารถพูดได้ว่ามันค่อนข้างง่าย: สมมุติฐานว่างเป็นจริงหรือเป็นเท็จดังนั้นจึงมีความเป็นไปได้สองอย่างเท่านั้น อย่างไรก็ตามโดยทั่วไปแล้วค่า Null เป็นค่าพอยต์ (viz., ) และค่า Null เป็น false นั้นหมายถึงว่าค่าใด ๆ ที่ไม่ใช่คือค่าจริง หากเราจำได้ว่าจุดนั้นไม่มีความกว้างของจำนวนบรรทัดจะสอดคล้องกับทางเลือกที่เป็นจริง ดังนั้นหากผลลัพธ์ที่คุณสังเกตเห็นคือ (เช่นศูนย์ถึงทศนิยมทศนิยมไม่มีที่สิ้นสุด) ผลลัพธ์ของคุณจะใกล้เคียงกับค่าที่ไม่ใช่มากกว่าที่เป็น (เช่น0 100 % 0. ˉ 0 0 0 p < .500100%0.0¯00p<.5) ดังนั้นคุณจะสรุปได้ว่าสมมติฐานว่างเป็นเท็จเสมอ ในการทำให้ชัดเจนหลักฐานที่ผิดพลาดในคำถามของคุณคือมีเส้นสีน้ำเงินเส้นเดียวที่มีความหมาย (ดังที่ปรากฎในรูปของคุณ) ที่สามารถใช้ตามที่คุณแนะนำ

อย่างไรก็ตามไม่จำเป็นต้องเป็นกรณีดังกล่าวข้างต้น บางครั้งมันก็เกิดขึ้นว่ามีสองทฤษฎีที่ทำให้การคาดการณ์ที่แตกต่างกันเกี่ยวกับปรากฏการณ์ที่ทฤษฎีทางคณิตศาสตร์ดีพอที่จะให้การประมาณจุดที่แม่นยำและการแจกแจงการสุ่มตัวอย่าง จากนั้นการทดลองที่สำคัญสามารถออกแบบเพื่อแยกความแตกต่างระหว่างพวกเขา ในกรณีเช่นนี้ไม่จำเป็นต้องใช้ทฤษฏีใด ๆ ว่าเป็นโมฆะและอัตราส่วนความน่าจะเป็นเป็นน้ำหนักของหลักฐานที่สนับสนุนหนึ่งหรือทฤษฎีอื่น ๆ การใช้งานนั้นจะคล้ายกับการใช้เป็นอัลฟาของคุณ ไม่มีเหตุผลทางทฤษฎีสถานการณ์นี้ไม่สามารถเป็นที่พบบ่อยที่สุดในวิทยาศาสตร์มันเพิ่งเกิดขึ้นว่ามันเป็นเรื่องยากมากที่จะมีสองทฤษฎีดังกล่าวในสาขาส่วนใหญ่ในขณะนี้ .50


3

หากต้องการเพิ่มคำตอบก่อนหน้านี้ที่ดีมาก: ใช่ 5% นั้นเป็นเรื่องที่ไม่ชอบเลย แต่ไม่ว่าคุณจะเลือกเกณฑ์แบบใดก็ตามมันจะต้องมีขนาดเล็กพอสมควรไม่เช่นนั้นการทดสอบสมมติฐานจะไม่สมเหตุสมผล

คุณกำลังมองหาผลกระทบและต้องการให้แน่ใจว่าผลลัพธ์ของคุณไม่ได้เกิดจากความบังเอิญ ขอบเขตที่คุณสามารถกำหนดระดับนัยสำคัญที่กล่าวว่าโดยทั่วไป"ถ้ามีจริงไม่มีผล (สมมติฐานที่เป็นความจริง) นี้จะเป็นความน่าจะเป็นที่จะยังคงได้รับผลดังกล่าว (หรือมากขึ้น) โดยโอกาสบริสุทธิ์" การตั้งค่าที่สูงเกินไปนี้จะส่งผลให้เกิดผลบวกปลอมจำนวนมากและบ่อนทำลายความสามารถในการรับคำตอบที่มีความหมายสำหรับคำถามการวิจัยของคุณ

เช่นเคยมีการแลกเปลี่ยนที่เกี่ยวข้องดังนั้นชุมชนการวิจัยเกิดขึ้นกับแนวทาง 5% นี้ แต่มันแตกต่างกันในด้านต่าง ๆ ในฟิสิกส์ของอนุภาคมันเหมือนกับ 0.00001% หรืออะไรทำนองนั้น


0

การจำแนกและการทดสอบสมมติฐานที่แตกต่างกันและได้รับการใช้แตกต่างกัน ในกรณีส่วนใหญ่คนใช้

  • "การจำแนกประเภท" "เพื่อดำเนินงานของ" การจัดหมวดหมู่บางสิ่งตามคุณสมบัติหรือลักษณะที่ใช้ร่วมกัน "
  • และใช้ "การทดสอบสมมติฐาน" เพื่อตรวจสอบ "การค้นพบที่สำคัญ" บางอย่าง

โปรดทราบว่าในการทดสอบสมมติฐาน "null สมมติฐาน" คือ "สามัญสำนึก" แต่ถ้าเราสามารถปฏิเสธสมมติฐานว่างแล้วเรามีตัวแบ่ง

นี่คือเหตุผลที่เรามีเกณฑ์ที่เข้มงวดมากขึ้นในการทดสอบสมมติฐาน คิดว่าเป็นตัวอย่างของการพัฒนา drags ใหม่เราต้องการที่จะระมัดระวังอย่างมากที่จะบอกว่าสิ่งสำคัญและมีประสิทธิภาพ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.