ทำไมเราต้องการสมมติฐานทางเลือก


14

เมื่อเราทำการทดสอบเราจะได้ผลลัพธ์ที่สอง

1) เราปฏิเสธสมมติฐานว่าง

2) เราไม่สามารถปฏิเสธสมมติฐานว่างได้

เราไม่พูดถึงการยอมรับสมมติฐานทางเลือก หากเราไม่พูดถึงการยอมรับสมมติฐานทางเลือกทำไมเราต้องมีสมมติฐานทางเลือกเลย

นี่คือการอัปเดต: มีคนให้ฉันสองตัวอย่าง:

1) การปฏิเสธสมมติฐานว่างเท่ากับยอมรับสมมติฐานทางเลือก

2) การปฏิเสธสมมติฐานว่างไม่เท่ากับการยอมรับสมมติฐานทางเลือก


1
เพราะคุณกำลังพยายามหาข้อสรุป หากไม่ใช่สมมติฐานว่างอาจเป็นสมมติฐานทางเลือก (แม้ว่าคุณจะไม่แน่ใจว่าสมมติฐานทางเลือกนั้นสมบูรณ์ถ้าคุณปฏิเสธสมมติฐานว่าง) เมื่อคุณปฏิเสธสมมติฐานว่างคุณพูดว่าคุณมี "หลักฐาน" บางอย่างเพื่อสรุปว่าสมมติฐานทางเลือกอาจเป็นจริง
19

@nbro ขอขอบคุณฉันเพิ่มคำถามในโพสต์ต้นฉบับของฉัน คุณช่วยดูหน่อยได้ไหม?
user1700890

1
ฉันไม่คุ้นเคยกับการทดสอบสมมติฐานโดยทั่วไป เป็นการดีกว่าที่คุณรอให้บุคคลที่มีความสามารถมากกว่าตอบคำถามของคุณ
19

หากสมมติฐานทางเลือกของคุณเป็นส่วนเติมเต็มของสมมติฐานว่างก็ไม่มีประโยชน์อะไรเลย ไม่มีใครใช้สมมติฐานทางเลือกในการฝึกด้วยเหตุผลนี้นอกตำรา
Aksakal

"เราไม่ได้พูดถึงการยอมรับสมมติฐานทางเลือก" - ไม่เป็นความจริงสำหรับทุกคนที่เป็นไปได้ "เรา" บางคนพูดคุยเกี่ยวกับการยอมรับสมมติฐานทางเลือกและอื่น ๆ อีกมากมายคิดว่ามันถึงแม้ว่าพวกเขาเคารพข้อห้ามกับบอกว่ามัน มันค่อนข้างอวดรู้ที่จะหลีกเลี่ยงการพูดคุยเกี่ยวกับการยอมรับสมมติฐานทางเลือกเมื่อไม่มีข้อสงสัยที่สมเหตุสมผลว่าเป็นจริง แต่เนื่องจากสถิติมีแนวโน้มที่จะใช้ในทางที่ผิดดังนั้นในกรณีนี้คนอวดรู้อาจเป็นสิ่งที่ดีในขณะที่มัน inculcates ความระมัดระวังในการตีความผล
John Coleman

คำตอบ:


8

ฉันจะเน้นที่ "ถ้าเราไม่พูดเกี่ยวกับการยอมรับสมมติฐานทางเลือกทำไมเราต้องมีสมมติฐานทางเลือกเลย?"

เพราะมันช่วยให้เราเลือกสถิติการทดสอบที่มีความหมายและออกแบบการศึกษาของเราให้มีพลังสูง --- โอกาสสูงที่จะปฏิเสธค่าว่างเมื่อทางเลือกนั้นเป็นจริง หากไม่มีทางเลือกอื่นเราไม่มีแนวคิดเรื่องพลัง

ลองจินตนาการว่าเรามีสมมติฐานว่างเปล่าและไม่มีทางเลือกอื่น จากนั้นก็ไม่มีแนวทางในการเลือกสถิติทดสอบที่จะมีพลังสูง ทั้งหมดที่เราสามารถพูดได้คือ "ปฏิเสธโมฆะเมื่อใดก็ตามที่คุณสังเกตสถิติทดสอบที่มีค่าไม่น่าจะต่ำกว่าโมฆะ" เราสามารถเลือกอะไรก็ได้: เราสามารถวาดตัวเลขสุ่ม (0,1) สุ่มและปฏิเสธค่าว่างเมื่อต่ำกว่า 0.05 สิ่งนี้เกิดขึ้นภายใต้ค่า null "น้อยมาก" ไม่เกิน 5% ของเวลา --- แต่มันก็หาได้ยากเช่นกันเมื่อค่า null เป็นเท็จ ดังนั้นนี่เป็นการทดสอบทางสถิติ แต่ไม่มีความหมายอะไรเป็นหลักฐาน

แต่เรามักจะมีบางสมมติฐานทางเลือกทางวิทยาศาสตร์ที่น่าเชื่อถือ ( "มีคือความแตกต่างในเชิงบวกในผลระหว่างการรักษาและการควบคุมกลุ่มต่าง ๆ ในการทดสอบของฉัน") เราต้องการปกป้องมันจากนักวิจารณ์ที่อาจก่อให้เกิดสมมุติฐานว่างในฐานะผู้สนับสนุนของปีศาจ ("ฉันยังไม่มั่นใจ - บางทีการรักษาของคุณอาจเจ็บจริงหรือไม่มีผลเลยและความแตกต่างที่ชัดเจนใน ข้อมูลเกิดจากรูปแบบการสุ่มตัวอย่างเท่านั้น ")

ด้วยสมมติฐาน 2 ข้อเหล่านี้ในตอนนี้เราสามารถตั้งค่าการทดสอบที่ทรงพลังได้โดยเลือกสถิติการทดสอบที่ค่าทั่วไปภายใต้ทางเลือกไม่น่าจะอยู่ภายใต้ค่าว่าง (บวก 2 ตัวอย่าง t-statistic ห่างไกลจาก 0 จะไม่แปลกใจถ้าทางเลือกเป็นจริง แต่น่าแปลกใจถ้าเป็นโมฆะจริง) จากนั้นเราหาการแจกแจงการสุ่มตัวอย่างของสถิติการทดสอบภายใต้ null ดังนั้นเราสามารถคำนวณค่า p --- และตีความพวกเขา เมื่อเราสังเกตสถิติทดสอบที่ไม่น่าภายใต้โมฆะ, โดยเฉพาะอย่างยิ่งถ้าการออกแบบการศึกษาขนาดตัวอย่างและอื่น ๆ ได้รับการแต่งตั้งให้มีอำนาจสูงนี้ยังมีบางส่วนหลักฐานทางเลือก

แล้วทำไมเราไม่พูดถึงการยอมรับสมมติฐานทางเลือก? เพราะแม้แต่การศึกษาที่ใช้กำลังสูงก็ไม่ได้พิสูจน์อย่างสมบูรณ์ว่าข้อผิดพลาดนั้นผิด มันยังคงเป็นหลักฐาน แต่ก็อ่อนแอกว่าหลักฐานประเภทอื่น


7

ในอดีตมีความไม่เห็นด้วยเกี่ยวกับการตั้งสมมติฐานทางเลือกว่าจำเป็นหรือไม่ ให้ฉันอธิบายประเด็นของความขัดแย้งนี้โดยพิจารณาจากความคิดเห็นของฟิชเชอร์และเนย์แมนภายใต้บริบทของสถิติบ่อยครั้งและคำตอบแบบเบย์

  • ฟิชเชอร์ - เราไม่ต้องการสมมติฐานอื่น เราสามารถทดสอบสมมติฐานว่างได้โดยใช้การทดสอบความดีพอดี ผลที่ได้คือค่าpให้การวัดหลักฐานสำหรับสมมติฐานว่าง

  • Neyman - เราต้องทำการทดสอบสมมุติฐานระหว่างค่า Null และทางเลือก การทดสอบดังกล่าวว่าจะส่งผลให้ชนิดที่ 1 ข้อผิดพลาดในการแก้ไขอัตราที่กำหนดไว้ล่วงหน้า, ααผลคือการตัดสินใจ - จะปฏิเสธหรือไม่ปฏิเสธสมมติฐานที่ระดับαα

    เราต้องการทางเลือกจากมุมมองทางทฤษฎีการตัดสินใจ - เรากำลังเลือกระหว่างสองหลักสูตรของการกระทำ - และเพราะเราควรรายงานพลังของการทดสอบ

    1p(Accept H0|H1)
    H0

    H0

  • p(H0)=1
    H0p(data|not H0)


1
ประเด็นสุดท้ายของคุณยอดเยี่ยมมากและมักถูกละเลยในสิ่งตีพิมพ์ซึ่งอิงกับการถกเถียงทั้งหมดใน NHST เดี่ยวที่ไม่ได้รับการกระตุ้น
Konrad Rudolph

H0

p(data|notH0)

@innisfree ภายใต้ความคิดไม่บ่อย แต่อาจอยู่ภายใต้เบย์
Michael

ลองทำอย่างนั้นโดยไม่แนะนำรุ่นอย่างน้อย 2 รุ่น ...
14884

4

ฉันไม่แน่ใจ 100% ว่านี่เป็นข้อกำหนดอย่างเป็นทางการ แต่โดยทั่วไปแล้วสมมติฐานว่างและสมมติฐานทางเลือกคือ: 1) เสริมและ 2) หมดจด นั่นคือ: 1) พวกเขาไม่สามารถเป็นทั้งจริงในเวลาเดียวกัน; 2) หากไม่เป็นจริงจะต้องเป็นจริง

heightboys=heightgirlsheightboysheightgirls


1
H0HaH0Ha

2
H0H1

1
H0HaH0HaHaH0HaH0Ha

1
@ ไม่มีใครสามารถทดสอบสมมติฐานสองจุดในกรอบความเป็นไปได้บางอย่าง - แน่นอน แต่ขั้นตอนนั้นจะไม่เรียกว่า "การทดสอบสมมติฐานว่าง" และมันไม่แน่ชัด มันจะเลือกอันที่ใกล้เคียงที่สุดว่าเป็นความจริงแม้ในกรณีที่ไม่มีสิ่งใดจริง นอกจากนี้เกี่ยวกับพลังงาน - เราสามารถเลือกสมมุติฐานทางเลือกหรือขนาดของเอฟเฟกต์เมื่อทำการคำนวณกำลังของการทดสอบ แต่ (ในทัศนะของฉัน) ควรลืมเมื่อการทดสอบเกิดขึ้น เว้นแต่จะมีข้อมูลก่อนหน้านี้บ้างที่บอกเขาเกี่ยวกับผลกระทบที่อาจเกิดขึ้นในข้อมูล เช่นเดียวกับพิกเซลสีขาว / ดำในภาพถ่ายที่มีเสียงดัง
Karolis Koncevičius

1
θ=1H0θ{0,1}H0H1

2

ทำไมเราต้องมีสมมติฐานอื่นเลย

ในการทดสอบสมมติฐานคลาสสิกบทบาททางคณิตศาสตร์เพียงอย่างเดียวที่เล่นโดยสมมุติฐานทางเลือกคือมันมีผลต่อการเรียงลำดับของหลักฐานผ่านสถิติการทดสอบที่เลือก ทางเลือกสมมุติฐานถูกนำมาใช้เพื่อกำหนดสถิติการทดสอบที่เหมาะสมสำหรับการทดสอบซึ่งเทียบเท่ากับการจัดอันดับตามลำดับของผลลัพธ์ข้อมูลที่เป็นไปได้ทั้งหมดจากผู้ที่เอื้อต่อการตั้งสมมติฐานโมฆะ (เทียบกับทางเลือกที่ระบุ) (เทียบกับทางเลือกที่ระบุ) เมื่อคุณได้รูปแบบการจัดอันดับของผลข้อมูลเป็นไปได้ลำดับนี้สมมติฐานทางเลือกเล่นไม่มีบทบาททางคณิตศาสตร์ต่อไปในการทดสอบ


nx=(x1,...,xn)T:RnRที่แมปผลลัพธ์ที่เป็นไปได้ทั้งหมดของข้อมูลลงบนมาตราส่วนที่วัดว่ามันเอื้อต่อการเป็นโมฆะหรือสมมติฐานทางเลือก เราจะสมมติว่าค่าที่ต่ำกว่านั้นเอื้อต่อสมมติฐานว่างมากขึ้นและค่าที่สูงกว่านั้นเอื้อต่อสมมติฐานทางเลือกมากกว่าบางครั้งเราบอกว่าค่าที่สูงกว่าของสถิติการทดสอบคือ "ยิ่งมาก" ตราบเท่าที่พวกมันมีความรุนแรงมากขึ้น หลักฐานสำหรับสมมติฐานทางเลือก) p-value ของการทดสอบจะได้รับจาก:

p(x)pT(x)P(T(X)T(x)|H0).

ฟังก์ชัน p-value นี้กำหนดหลักฐานทั้งหมดในการทดสอบเวกเตอร์ข้อมูลใด ๆ เมื่อรวมกับระดับความสำคัญที่เลือกมันจะกำหนดผลลัพธ์ของการทดสอบสำหรับเวกเตอร์ข้อมูลใด ๆ (เราได้อธิบายเรื่องนี้สำหรับจุดข้อมูลจำนวนคงที่แต่สามารถขยายได้อย่างง่ายดายเพื่ออนุญาตให้ใช้โดยพลการ ) เป็นสิ่งสำคัญที่จะต้องทราบว่าค่า p-value ได้รับผลกระทบจากสถิติการทดสอบผ่านมาตราส่วนตามลำดับที่ทำให้เกิดnnดังนั้นหากคุณใช้การแปลงที่เพิ่มขึ้นแบบ monotonically กับสถิติการทดสอบสิ่งนี้จะไม่สร้างความแตกต่างให้กับการทดสอบสมมติฐาน (นั่นคือการทดสอบเดียวกัน) คุณสมบัติทางคณิตศาสตร์นี้สะท้อนให้เห็นถึงความจริงที่ว่าจุดประสงค์เพียงอย่างเดียวของสถิติการทดสอบคือการชักนำให้เกิดสเกลอันดับในพื้นที่ของเวกเตอร์ข้อมูลที่เป็นไปได้ทั้งหมดเพื่อแสดงว่าสิ่งใดที่เอื้อต่อโมฆะ / ทางเลือก

สมมติฐานทางเลือกมีผลต่อการวัดนี้ผ่านทางฟังก์ชันTเท่านั้นซึ่งจะถูกเลือกโดยอิงจากสมมติฐานว่างเปล่าและสมมติฐานทางเลือกภายในโมเดลโดยรวม ดังนั้นเราสามารถพิจารณาฟังก์ชันสถิติการทดสอบว่าเป็นฟังก์ชันของแบบจำลองโดยรวมและสมมติฐานสองข้อ ตัวอย่างเช่นสำหรับความน่าจะเป็น- อัตราส่วนการทดสอบสถิติการทดสอบจะเกิดขึ้นโดยการใช้อัตราส่วน (หรือลอการิทึมของอัตราส่วน) ของซูพรีมของฟังก์ชันความน่าจะเป็นมากกว่าช่วงพารามิเตอร์ที่เกี่ยวข้องกับสมมติฐานว่างและทางเลือกTg(M,H0,HA)M


สิ่งนี้หมายความว่าอย่างไรถ้าเราเปรียบเทียบการทดสอบกับทางเลือกอื่น สมมติว่าคุณมีรูปแบบคงที่และคุณต้องการที่จะทำสองการทดสอบสมมติฐานที่แตกต่างกันการเปรียบเทียบ null สมมติฐานเดียวกันกับสองทางเลือกที่แตกต่างกันและH_A'ในกรณีนี้คุณจะมีฟังก์ชันสถิติการทดสอบที่แตกต่างกันสองฟังก์ชัน:MH0HAHA

T=g(M,H0,HA)T=g(M,H0,HA),

นำไปสู่ฟังก์ชัน p-value ที่เกี่ยวข้อง:

p(x)=P(T(X)T(x)|H0)p(x)=P(T(X)T(x)|H0).

TTppTT


2
ฉันจะเห็นด้วยกับสิ่งนี้โดยบอกว่าการทดสอบออกแบบมาเพื่อปฏิเสธสมมติฐานว่างเมื่อเผชิญกับผลลัพธ์ที่รุนแรงและบทบาทของสมมติฐานทางเลือกคือการชี้ให้เห็นว่าผลลัพธ์จะถูกมองว่าสุดขั้วหากสมมติฐานว่างเป็นจริง
Henry

1

P(data|H0)H0

α

เหตุผลที่คุณกำหนดสมมติฐานทางเลือกขึ้นมาเนื่องจากคุณอาจมีการทดลองในใจก่อนที่จะเริ่มการสุ่มตัวอย่าง การกำหนดสมมติฐานทางเลือกยังสามารถตัดสินใจได้ว่าคุณใช้การทดสอบแบบหนึ่งด้านหรือสองด้านและด้วยเหตุนี้จึงให้พลังทางสถิติมากขึ้น (ในสถานการณ์แบบด้านเดียว) แต่ในทางเทคนิคเพื่อที่จะทำการทดสอบคุณไม่จำเป็นต้องกำหนดสมมติฐานทางเลือกคุณแค่ต้องการข้อมูล


P(data|H0)P(data as extreme as that observed|H0)

@ ไม่เป็นอิสระฉันเห็นด้วยและนั่นเป็นวิธีที่ฉันกำหนดข้อมูลไว้ในประโยคเดียวกัน
Stefan

? ฉันไม่สามารถดูได้ทุกที่ที่มีการกำหนดข้อมูล (ด้วยวิธีนี้หรือวิธีอื่นใด)
27414

และแม้ว่ามันจะเป็นเช่นนั้นทำไมทำเช่นนั้น? ทำไมต้องกำหนดข้อมูลซ้ำอีกครั้ง ฉันขอแนะนำให้อธิบายบางส่วนของข้อความรอบ ๆ p (data ..
innisfree
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.