การทดสอบสมมติฐานด้วยเหตุผลเดียว


35

ฉันเข้าใจการทดสอบสมมติฐานแบบสองด้าน คุณมี (เทียบกับ ) -value คือน่าจะเป็นที่สร้างข้อมูลอย่างน้อยเป็นอย่างมากกับสิ่งที่เป็นข้อสังเกตH 1 = ¬ H 0 : θ θ 0 p θH0:θ=θ0H1=¬H0:θθ0pθ

ฉันไม่เข้าใจการทดสอบสมมติฐานแบบเดียว ที่นี่ (เทียบกับ ) คำจำกัดความของ p-value ไม่ควรเปลี่ยนแปลงจากด้านบน: มันควรเป็นความน่าจะเป็นที่สร้างข้อมูลอย่างน้อยที่สุดเท่าที่จะสังเกตได้ แต่เราไม่ได้รู้ว่าเพียงว่ามันบนล้อมรอบด้วย\H 1 = ¬ H 0 : θ > θ 0 θ θ θ 0H0:θθ0H1=¬H0:θ>θ0θ θθ0

ดังนั้นฉันจึงเห็นข้อความที่บอกให้เราสันนิษฐานว่า (ไม่ใช่ตาม ) และคำนวณความน่าจะเป็นที่จะสร้างข้อมูลอย่างน้อยที่สุดเท่าที่สังเกต แต่เพียงปลายด้านหนึ่ง . ดูเหมือนว่าจะไม่มีอะไรเกี่ยวข้องกับสมมติฐานทางเทคนิค θ θ 0 H 0θ=θ0θθ0H0

ตอนนี้ฉันเข้าใจแล้วว่านี่คือการทดสอบสมมติฐานบ่อยครั้งและผู้ที่ไม่ได้ใส่บวชใน s แต่นั่นไม่ได้หมายความว่าสมมติฐานนั้นเป็นไปไม่ได้ที่จะยอมรับหรือปฏิเสธแทนที่จะใส่รองเท้าในการคำนวณข้างต้นลงในภาพθ


คำถามที่คล้ายกันถูกถามหลังจากนั้นstats.stackexchange.com/questions/8196/…
robin girard

1
การกำหนดค่าของคุณไม่สมบูรณ์ คุณควรอ่าน (เน้นเพิ่ม): ผู้ -value คือน่าจะเป็นที่สร้างข้อมูลอย่างน้อยเป็นอย่างมากเป็นสิ่งที่ถูกสังเกตสมมติว่าสมมติฐานที่เป็นความจริง p θppθ
Alexis

คำตอบ:


34

นั่นเป็นคำถามที่ไตร่ตรอง บทความจำนวนมาก (อาจเป็นเพราะเหตุผลทางการสอน) มีปัญหาในเรื่องนี้ สิ่งที่เกิดขึ้นจริง ๆ คือเป็น"สมมุติฐาน" เชิงประกอบในสถานการณ์ด้านเดียวของคุณ: จริงๆแล้วมันเป็นชุดของสมมติฐานไม่ใช่หนึ่งเดียว จำเป็นสำหรับทุก ๆ สมมติฐานที่เป็นไปได้ในH 0 θ 0 H 0H0 H0โอกาสของสถิติการทดสอบที่ลดลงในพื้นที่วิกฤติจะต้องน้อยกว่าหรือเท่ากับขนาดการทดสอบ ยิ่งกว่านั้นถ้าการทดสอบนั้นจริงเพื่อให้ได้ขนาดที่กำหนด (ซึ่งเป็นสิ่งที่ดีสำหรับการบรรลุพลังงานที่สูง) ดังนั้นความเป็นไปได้สูงสุดของโอกาสเหล่านี้ ในทางปฏิบัติสำหรับการทดสอบหนึ่งพารามิเตอร์ที่เรียบง่ายของสถานที่ที่เกี่ยวข้องกับบางอย่าง "ที่ดี" ครอบครัวของดิ, supremum นี้จะบรรลุสมมติฐานที่มีพารามิเตอร์\ดังนั้นในทางปฏิบัติการคำนวณทั้งหมดจึงมุ่งเน้นไปที่การแจกแจงแบบนี้ แต่เราต้องไม่ลืมเกี่ยวกับส่วนที่เหลือของชุด : นั่นคือความแตกต่างที่สำคัญระหว่างการทดสอบสองด้านและด้านเดียว (และระหว่าง "ง่าย" และ "คอมโพสิต"θ0H0

อย่างละเอียดนี้มีผลต่อการตีความผลลัพธ์ของการทดสอบด้านเดียว เมื่อ null ถูกปฏิเสธเราสามารถพูดได้จุดหลักฐานกับสภาพที่แท้จริงของธรรมชาติเป็นใด ๆ ของการกระจายในH_0เมื่อโมฆะไม่ได้ถูกปฏิเสธเราสามารถพูดได้ว่ามีการแจกแจงในซึ่ง "สอดคล้อง" กับข้อมูลที่สังเกตได้เท่านั้น เราไม่ได้บอกว่าการแจกแจงทั้งหมดในนั้นสอดคล้องกับข้อมูล: ห่างไกลจากมัน! หลายคนอาจมีโอกาสน้อยมากH 0 H 0H0H0H0


ทุกสิ่งที่คุณพูดนั้นถูกต้องและสำคัญ อีกแง่มุมที่สำคัญที่ฉันคิดว่าปกติแล้วสมมติฐานว่างจะถูกมองว่าเป็นสมมติฐานที่ไม่น่าสนใจ ทางเลือกที่ถูกมองว่าเป็นสมมติฐานทางวิทยาศาสตร์ เป็นสิ่งที่ผู้ทดลองต้องการพิสูจน์ ฉันมักจะพูดเพราะมันแตกต่างกันในการทดสอบความเท่าเทียมและไม่ด้อยกว่า ตอนนี้เกี่ยวกับปัญหาของการทดสอบด้านเดียวมันพูดเฉพาะด้านที่มีพารามิเตอร์มากกว่าที่เป็นค่าว่างที่น่าสนใจ ดังนั้นค่าทั้งหมดที่อยู่ด้านล่างจึงรวมอยู่ในค่าว่าง
Michael Chernick

stats.stackexchange.com/questions/333301/… หากคุณรู้สึกอยากตอบคำถามนี้หรือชี้ให้ฉันดูบรรณานุกรม ... ;)
ชายชราในทะเล

6

ฉันเห็นค่าเป็นค่าความน่าจะเป็นสูงสุดของข้อผิดพลาดประเภทที่ 1 ถ้าความน่าจะเป็นของอัตราความผิดพลาดประเภทที่ 1 อาจเป็นศูนย์ได้อย่างมีประสิทธิภาพ แต่อย่างนั้น เมื่อมองไปที่การทดสอบจากมุมมองของมินิแมกซ์ฝ่ายตรงข้ามจะไม่มีทางดึงจากส่วนลึกของ 'การตกแต่งภายใน' ของสมมติฐานว่างต่อไปและพลังไม่ควรได้รับผลกระทบ สำหรับสถานการณ์อย่างง่าย ( ตัวอย่างเช่น -test) สามารถสร้างการทดสอบโดยมีอัตราการพิมพ์สูงสุดที่รับประกันได้ซึ่งอนุญาตให้สมมุติฐานว่างข้างเดียวθ « θ 0ทีpθθ0t


2

คุณจะใช้การทดสอบสมมติฐานด้านเดียวหากผลลัพธ์ในทิศทางเดียวเท่านั้นที่สนับสนุนข้อสรุปที่คุณพยายามเข้าถึง

คิดในแง่ของคำถามที่คุณถาม ตัวอย่างเช่นสมมติว่าคุณต้องการดูว่าโรคอ้วนนำไปสู่การเพิ่มความเสี่ยงต่อโรคหัวใจวายหรือไม่ คุณรวบรวมข้อมูลของคุณซึ่งอาจประกอบด้วยคนอ้วน 10 คนและคนที่ไม่ใช่คนอ้วน 10 คน ตอนนี้สมมติว่าเนื่องจากปัจจัยรบกวนที่ไม่ได้บันทึกไว้การออกแบบการทดลองที่ไม่ดีหรือเพียงแค่โชคร้ายธรรมดาคุณสังเกตเห็นว่ามีเพียง 2 ใน 10 คนที่เป็นโรคอ้วนเท่านั้นที่มีอาการหัวใจวายเมื่อเทียบกับคนที่ไม่อ้วน 8 คน

ตอนนี้ถ้าคุณต้องทำการทดสอบสมมติฐานแบบสองด้านกับข้อมูลนี้คุณจะสรุปได้ว่ามีความสัมพันธ์ทางสถิติอย่างมีนัยสำคัญ (p ~ 0.02) ระหว่างความอ้วนและความเสี่ยงโรคหัวใจวาย อย่างไรก็ตามสมาคมจะอยู่ในทิศทางตรงกันข้ามกับสิ่งที่คุณคาดหวังว่าจะได้เห็นดังนั้นผลการทดสอบจะทำให้เข้าใจผิด

(ในชีวิตจริงการทดลองที่สร้างผลลัพธ์ที่ตรงข้ามกันอาจนำไปสู่คำถามเพิ่มเติมที่น่าสนใจในตัวเองตัวอย่างเช่นกระบวนการรวบรวมข้อมูลอาจต้องได้รับการปรับปรุงให้ดีขึ้นหรืออาจมีปัจจัยเสี่ยงในการทำงานที่ไม่รู้จักมาก่อนหรือ บางทีภูมิปัญญาดั้งเดิมอาจเข้าใจผิด แต่ประเด็นเหล่านี้ไม่เกี่ยวข้องกับคำถามแคบ ๆ ของการทดสอบสมมติฐานแบบใดที่จะใช้)


2

-value ความน่าจะเป็นของเหตุการณ์ที่เกี่ยวข้องภายใต้เงื่อนไขที่ว่าเป็นความจริง ตัวอย่างของเล่นที่ง่ายที่สุดที่เป็นไปได้คือการทอยเหรียญสองครั้ง แบบ 2 ด้านคือคุณคำนึงถึงความยุติธรรมของเหรียญนั่นคือคุณโยนหนึ่งหัวและหนึ่งหาง ความน่าจะเป็นที่เป็น0.5ในกรณีนี้คือคุณคิดว่ามันเอนเอียงไปทางด้านหนึ่งหรืออีกด้านหนึ่งนั่นคือคุณโยนหัวสองหรือสองก้อย ความน่าจะเป็นอีกครั้งคือH 0 H 0 0.5 H 1 0.5pH0H00.5H10.5

สำหรับแบบ 1 ด้านคิดว่าเป็นเกมที่คุณวางเงินไว้บนหัว คุณโอเคกับเหรียญที่ยุติธรรม แต่แน่นอนว่ามันดีกับการลำเอียงไปทางหัว นี่คือของคุณที่คุณมีความเป็นไปได้ของหนึ่งหัวและหนึ่งหางหรือสองหัว:ความน่าจะเป็น เป็นเพียงกรณีที่เหลือของสองก้อยที่คุณจะเรียกว่าเหม็น: ความน่าจะเป็นโปรดทราบว่าเนื่องจากคุณพิจารณาทั้งภูมิภาคจากการจัดงานไปสู่การลำเอียงต่อหัวเนื่องจากหางสองหางที่เป็นค่าเริ่มต้นของคุณจะได้รับการพิจารณาว่าไม่น่าจะเป็นไปได้มากขึ้นและเป็นการชี้นำว่ามีบางอย่างไม่เป็นระเบียบH 0 0.75 H 1 0.25H0H00.75H10.25

ตอนนี้เมื่อเหตุการณ์ในของเราเกิดขึ้นอย่างไรก็ตามความน่าจะเป็นของพวกเขาคือค่า p ภายใต้เงื่อนไขที่นั้นเป็นจริง - ดังที่ได้กล่าวไว้ข้างต้น ดังนั้นขึ้นอยู่กับระดับความเชื่อมั่นของคุณคุณสามารถหรือไม่สามารถปฏิเสธของคุณได้H 0 H 0H1H0H0

คุณสามารถทดลองกับตัวอย่างของเล่นนี้ใน R ด้วยตัวคุณเองคุณควรลองตัวเลขสัมบูรณ์และการรวมกันของหัวและก้อย:

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.