จะระบุสมมติฐานว่างในการทดสอบสมมติฐานได้อย่างไร


15

อะไรคือกฎที่ดีสำหรับการเลือกคำถามสำหรับสมมติฐานว่าง ตัวอย่างเช่นถ้าฉันต้องการตรวจสอบว่าสมมติฐาน B เป็นจริงฉันควรใช้ B เป็นโมฆะ, B เป็นสมมติฐานทางเลือกหรือไม่เป็น B เปล่า? ฉันหวังว่าคำถามจะชัดเจน ฉันรู้ว่ามันมีบางอย่างเกี่ยวกับข้อผิดพลาดที่ฉันต้องการย่อเล็กสุด (Type I?) แต่ฉันก็ลืมไปว่ามันไปอย่างไรเพราะฉันไม่มีสัญชาตญาณที่ชัดเจนสำหรับมัน ขอบคุณ


พวก ... คำตอบที่ยอดเยี่ยม มีประโยชน์ทั้งหมด มันยังทำให้ฉันประหลาดใจเมื่อฉันได้รับความร่วมมือในระดับนี้บนเว็บเพียงเพราะผู้คนสนใจ ว้าวขอบคุณ !
เนสเตอร์

คำตอบ:


17

กฎง่ายๆจากที่ปรึกษาที่ดีของฉันคือตั้งค่า Null-Hypothesis ให้เป็นผลลัพธ์ที่คุณไม่ต้องการให้เป็นจริงเช่นผลลัพธ์ที่ตรงข้ามกับที่คุณต้องการแสดง

ตัวอย่างพื้นฐาน: สมมติว่าคุณได้พัฒนาวิธีการรักษาทางการแพทย์ใหม่และคุณต้องการแสดงให้เห็นว่าดีกว่ายาหลอก ดังนั้นคุณตั้งค่า Null-Hypothesis treament ใหม่เท่ากับหรือแย่กว่ายาหลอกและสมมติฐานทางเลือกH 1 : =การรักษาใหม่ดีกว่ายาหลอกH0:=H1:=

เพราะในระหว่างการทดสอบทางสถิติคุณอาจปฏิเสธ Null-Hypothesis (และสนับสนุนสมมติฐานทางเลือก) หรือคุณไม่สามารถปฏิเสธได้ เนื่องจาก "เป้าหมาย" ของคุณคือการปฏิเสธ Null-Hypothesis คุณตั้งเป็นผลลัพธ์ที่คุณไม่ต้องการให้เป็นจริง

หมายเหตุด้านข้าง: ฉันทราบดีว่าไม่ควรตั้งค่าการทดสอบทางสถิติเพื่อทดสอบการบิดและทำลายจนกว่าการปฏิเสธของ Null-Hypothesis จะเป็นภาษาที่ไม่เป็นทางการใช้เพื่อทำให้กฎนี้ง่ายต่อการจดจำ

สิ่งนี้อาจเป็นประโยชน์: ความหมายของค่า p และค่า t ในการทดสอบทางสถิติคืออะไร? และ / หรืออะไรคือการแนะนำที่ดีในการทดสอบสมมติฐานทางสถิติสำหรับนักวิทยาศาสตร์คอมพิวเตอร์?


6

หากสมมติฐาน B เป็นสมมติฐานที่น่าสนใจที่คุณสามารถใช้ไม่-B เป็นสมมติฐานและการควบคุมภายใต้โมฆะน่าจะเป็นของความผิดพลาดประเภทสำหรับการผิดปฏิเสธไม่-B ที่ระดับαการปฏิเสธไม่ใช่ -B นั้นถูกตีความว่าเป็นหลักฐานสนับสนุน B เพราะเราควบคุมข้อผิดพลาดประเภทที่ 1 ดังนั้นจึงไม่น่าเป็นไปได้ที่จะไม่ใช้ B สับสน ... α

ยกตัวอย่างของการรักษาเทียบกับไม่ได้รับการรักษาในสองกลุ่มจากประชากร สมมติฐานที่น่าสนใจคือการรักษามีผลนั่นคือมีความแตกต่างระหว่างกลุ่มที่ได้รับการรักษาและกลุ่มที่ไม่ได้รับการรักษาเนื่องจากการรักษา สมมุติฐานว่างคือว่าไม่มีความแตกต่างและเราควบคุมความน่าจะเป็นในการปฏิเสธสมมติฐานนี้อย่างไม่ถูกต้อง ดังนั้นเราจึงควบคุมความน่าจะเป็นของการสรุปอย่างผิด ๆ ว่ามีผลการรักษาเมื่อไม่มีผลการรักษา ข้อผิดพลาด type II คือความน่าจะเป็นที่จะยอมรับค่า null ไม่ถูกต้องเมื่อมีผลการรักษา

การกำหนดข้างต้นขึ้นอยู่กับกรอบการทำงานของ Neyman-Pearson สำหรับการทดสอบทางสถิติซึ่งการทดสอบทางสถิติถูกมองว่าเป็นปัญหาการตัดสินใจระหว่างกรณี, ค่าว่างและทางเลือก ระดับเป็นเศษส่วนของเวลาที่เราทำข้อผิดพลาดประเภทที่ 1 หากเราทำการทดสอบซ้ำ ในกรอบนี้ไม่มีความแตกต่างอย่างเป็นทางการระหว่างโมฆะกับทางเลือก หากเราแลกเปลี่ยนโมฆะและทางเลือกเราจะแลกเปลี่ยนความน่าจะเป็นของข้อผิดพลาดประเภท I และ Type II อย่างไรก็ตามเราไม่ได้ควบคุมความน่าจะเป็นข้อผิดพลาดประเภท II ด้านบน (ขึ้นอยู่กับผลการรักษาขนาดใหญ่) และเนื่องจากความไม่สมดุลนี้เราอาจต้องการบอกว่าเราไม่สามารถปฏิเสธได้αสมมติฐานว่าง (แทนที่จะเป็นเรายอมรับสมมติฐานว่าง) ดังนั้นเราควรระมัดระวังเกี่ยวกับการสรุปว่าสมมติฐานว่างเป็นจริงเพียงเพราะเราไม่สามารถปฏิเสธได้

ในกรอบการทดสอบนัยสำคัญของชาวประมงมีเพียงสมมติฐานว่างเปล่าและการคำนวณหนึ่งอันภายใต้ null ซึ่งเป็นสำหรับข้อมูลที่สังเกตได้ ค่าp ที่น้อยกว่าจะถูกตีความว่าเป็นหลักฐานที่แข็งแกร่งต่อโมฆะ ที่นี่สมมติฐานว่างไม่แน่นอน -B (ไม่มีผลของการรักษา) และp-ค่าถูกตีความว่าเป็นจำนวนหลักฐานกับโมฆะ ที่มีขนาดเล็กพี -value เรามั่นใจสามารถปฏิเสธโมฆะว่ามีผลการรักษาไม่และสรุปได้ว่ามีผลการรักษา ในกรอบนี้เราสามารถปฏิเสธหรือไม่ปฏิเสธ (ไม่ยอมรับ) โมฆะและทั้งหมดเกี่ยวกับการปลอมแปลงโมฆะ โปรดทราบว่าหน้าppppp- ค่าไม่จำเป็นต้องได้รับการพิสูจน์จากจำนวนการตัดสินใจซ้ำซ้อน

ทั้งกรอบไม่มีปัญหาและคำศัพท์มักผสมกัน ฉันสามารถแนะนำหนังสือหลักฐานทางสถิติ: กรอบความน่าจะเป็นโดย Richard M. Royall สำหรับการรักษาแนวคิดที่แตกต่างกันอย่างชัดเจน


5

การตอบสนอง "บ่อยครั้ง" คือการสร้างสมมติฐานว่างของรูปแบบ "ไม่ B" แล้วโต้แย้งกับ "ไม่ B" ในการตอบสนองของ Steffen นี่คือตรรกะเทียบเท่าในการโต้แย้ง "คุณผิดดังนั้นฉันต้องถูก" นี่คือประเภทของการใช้เหตุผลของนักการเมือง (เช่นอีกฝ่ายไม่ดีดังนั้นเราจึงดี) มันค่อนข้างยากที่จะจัดการกับทางเลือกมากกว่า 1 รายการภายใต้เหตุผลแบบนี้ นี่เป็นเพราะว่า "คุณคิดผิดดังนั้นฉันพูดถูก" ทำให้เข้าใจได้ก็ต่อเมื่อมันเป็นไปไม่ได้ที่ทั้งคู่จะผิดซึ่งสามารถเกิดขึ้นได้อย่างแน่นอนเมื่อมีสมมติฐานทางเลือกมากกว่าหนึ่งข้อ

การตอบสนอง "Bayesian" คือการคำนวณความน่าจะเป็นของสมมติฐานที่คุณสนใจในการทดสอบโดยมีเงื่อนไขตามหลักฐานที่คุณมี สิ่งนี้จะมีข้อมูลก่อนหน้าเสมอซึ่งเป็นเพียงสมมติฐานที่คุณทำเพื่อทำให้ปัญหาของคุณถูกโพสต์ไว้อย่างดี (กระบวนการทางสถิติทั้งหมดพึ่งพาข้อมูลก่อนหน้า มันมักจะประกอบด้วยข้อมูลบางส่วนและเรามีทฤษฎีบทเบย์

P(H0|DI)=P(H0|I)P(D|H0I)kP(Hk|I)P(D|HkI)

H0H0คือ "ทางเลือก" มันเป็นเพียงความหมายที่นัยโดยนัยของคำว่า "โมฆะ" และ "ทางเลือก" ซึ่งทำให้มันดูแตกต่าง คุณสามารถแสดงความเท่าเทียมกันในกรณีของ "เนย์แมนเพียร์สันเลมม่า" เมื่อมีสมมติฐานสองข้อสำหรับสิ่งนี้เป็นเพียงอัตราส่วนความน่าจะเป็นซึ่งได้รับในทันทีโดยการต่อรองของทฤษฎีบทเบย์เหนือ:

P(H0|DI)P(H1|DI)=P(H0|I)P(H1|I)×P(D|H0I)P(D|H1I)=P(H0|I)P(H1|I)×Λ

ดังนั้นปัญหาการตัดสินใจก็เหมือนกัน: ยอมรับเมื่อΛ > ˜H0Λ>Λ~Λ~H1L2L1L1L2

กล่าวโดยย่อหากคุณใช้อัตราส่วนโอกาสในการทดสอบสมมติฐานของคุณไม่สำคัญว่าคุณจะเรียกสมมุติฐานว่าง การเปลี่ยนค่า null เป็นทางเลือกเพียงเปลี่ยนการตัดสินใจเป็นΛ1<Λ~1ซึ่งทางคณิตศาสตร์เป็นสิ่งเดียวกัน (คุณจะทำการตัดสินใจเดียวกัน - แต่ขึ้นอยู่กับการตัดไคสแควร์ผกผันแทนไคสแควร์สำหรับคุณ p-value) การเล่นเกมคำศัพท์ที่มี "ความล้มเหลวในการปฏิเสธโมฆะ" นั้นไม่ได้ใช้กับการทดสอบสมมติฐานเพราะเป็นการตัดสินใจดังนั้นหากมีเพียงสองตัวเลือกดังนั้น "การปฏิเสธโมฆะ" หมายถึงสิ่งเดียวกันกับ "การยอมรับ โมฆะ "


3
ย่อหน้าแรกนั้นเป็นเรื่องตลกของวิธีคลาสสิคในการทดสอบสมมติฐาน
whuber

การทดสอบสมมติฐานไม่ได้เป็นเรื่องของการตัดสินใจเสมอไป มันมักจะมีการกำหนดสูตรเช่นนี้ แต่ในทางวิทยาศาสตร์คำถามอาจจะบันทึกว่าโมฆะเป็นเท็จและเท่าไหร่ ฉันดูเกมเล่นคำเพื่อเตือนความจำถึงวัตถุประสงค์นี้ จากมุมมองนี้ความล้มเหลวในการปฏิเสธไม่ได้เป็นการตัดสินใจที่จะยอมรับ แต่การขาดหลักฐานในข้อมูลที่จะปฏิเสธ
NRH

@NRH - ฉันเห็นด้วย แต่นั่นไม่ใช่วัตถุประสงค์เสมอ หากคุณต้องการทดสอบทฤษฎีใหม่คุณต้องการทราบว่ามีความเป็นไปได้ที่จะเป็นจริงเพียงแค่เท่าที่คุณต้องการทราบว่ามีแนวโน้มที่จะเป็นเท็จ และถึงแม้ว่าการทดสอบสมมติฐานจะไม่นำไปสู่การตัดสินใจโดยตรงเสมอไป แต่ดูเหมือนว่าเป็นการเสียเวลาที่จะต้องทำการทดสอบถ้ามันจะไม่นำไปสู่การตัดสินใจในที่สุด คุณอยู่ในความเป็นจริงแล้วการตัดสินใจในความคิดเห็นของคุณ: "ทำราวกับว่าโมฆะเป็นเท็จ" มีทางเลือกเพียงทางเดียวคือ: "ทำตัวเหมือนเป็นโมฆะจริง" หากมีมากกว่าหนึ่งตัวเลือกสมมุติว่า ...
ความน่าจะเป็นทาง

(ต่อ) การทดสอบยังไม่ได้รับการกำหนดอย่างชัดเจนและเป็น "การวางตัวทางคณิตศาสตร์ที่ไม่ดี" ดังนั้นจะพูด อาจมีความไม่แน่นอนอย่างมากเกี่ยวกับการตัดสินใจนี้ แต่ไม่มีทางเลือกอื่น ๆ ค่า null ไม่เป็นความจริงและไม่เป็นเท็จในเวลาเดียวกันยกเว้นว่าคุณมีปัญหาที่ไม่ดี / ไม่ชัดเจน แต่ในกรณีนี้การทดสอบสมมติฐานไม่มีประโยชน์ - อาจไม่มีข้อสรุปที่เหมาะสม
ความน่าจะเป็นทาง

(พูดจาโผงผางต่อ) - และหากเป้าหมายคือการหาปริมาณหลักฐานที่เป็นโมฆะคุณก็ไม่จำเป็นต้องทดสอบสมมติฐาน นี่คือค่า p สำหรับ - คุณไม่จำเป็นต้องยอมรับหรือปฏิเสธเพียงรายงานมูลค่าของมัน
ความน่าจะเป็นทาง

1

โดยทั่วไปสมมติฐานว่างควรสันนิษฐานว่าความแตกต่างในตัวแปรตอบสนองเกิดจากข้อผิดพลาดเพียงอย่างเดียว

ตัวอย่างเช่นหากคุณต้องการทดสอบผลกระทบของปัจจัยบางอย่าง AxH0 = ไม่มีผลกระทบคือการตอบสนองAx

ความล้มเหลวในการปฏิเสธสมมติฐานว่างนี้จะถูกตีความว่า:

1) ความแตกต่างใด ๆ ใน xเกิดจากข้อผิดพลาดเพียงอย่างเดียวและไม่Aหรือ

2) ข้อมูลไม่เพียงพอที่จะตรวจจับความแตกต่างแม้ว่าจะมีอยู่ (ดูข้อผิดพลาดประเภท 2 ด้านล่าง)

HaAตอบสนองxเป็นจริง

H0AxH0Ax


1
ย่อหน้าที่สามดูเหมือนจะบอกเป็นนัยว่าการปฏิเสธโมฆะนั้นหมายความว่าโมฆะนั้นเป็นจริง แต่ชัดเจนว่าผิด: ทางเลือกอาจเป็นจริง (และโดยทั่วไปคือ) แต่ไม่แตกต่างจากโมฆะเพียงพอที่จะตรวจพบกับข้อมูลที่กำหนด
whuber

@whuber - จุดดีฉันจะแก้ไขคำตอบเพื่อสะท้อนสิ่งนี้
DQdlM
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.