ทำไมเราไม่ใช้การแจกแจงแบบ t เพื่อสร้างช่วงความมั่นใจสำหรับสัดส่วน?


18

ในการคำนวณช่วงความเชื่อมั่น (CI) สำหรับค่าเฉลี่ยด้วยค่าเบี่ยงเบนมาตรฐานประชากรที่ไม่รู้จัก (sd) เราประมาณค่าเบี่ยงเบนมาตรฐานประชากรโดยใช้การแจกแจงแบบ t ยวดที่n} แต่เนื่องจากเราไม่ได้ประมาณค่าเบี่ยงเบนมาตรฐานของประชากรเราประเมินผ่านการประมาณโดยที่CI=X¯±Z95%σX¯σX¯=σnCI=X¯±t95%(se)se=sn

ในทางตรงกันข้ามสำหรับสัดส่วนประชากรเพื่อคำนวณ CI เราประมาณว่าโดยที่ให้และCI=p^±Z95%(se)se=p^(1p^)nnp^15n(1p^)15

คำถามของฉันคือทำไมเราพึงพอใจกับการกระจายมาตรฐานสำหรับสัดส่วนประชากร?


1
สัญชาตญาณของฉันบอกว่าสิ่งนี้เป็นเพราะได้รับข้อผิดพลาดมาตรฐานของค่าเฉลี่ยที่คุณไม่รู้จักอันดับสองซึ่งประมาณจากตัวอย่างเพื่อทำการคำนวณให้เสร็จ ข้อผิดพลาดมาตรฐานสำหรับสัดส่วนไม่เกี่ยวข้องกับการไม่รู้จักเพิ่มเติม σ
Reinstate Monica - G. Simpson

@GavinSimpson ฟังดูน่าเชื่อถือ ในความเป็นจริงเหตุผลที่เราแนะนำการแจกแจง t คือการชดเชยข้อผิดพลาดที่แนะนำเพื่อชดเชยการประมาณค่าเบี่ยงเบนมาตรฐาน
Abhijit

3
ฉันพบสิ่งนี้น้อยกว่าที่น่าเชื่อถือในส่วนหนึ่งเนื่องจากการแจกแจงแบบเกิดขึ้นจากความเป็นอิสระของความแปรปรวนตัวอย่างและค่าเฉลี่ยตัวอย่างในตัวอย่างจากการแจกแจงแบบปกติในขณะที่ตัวอย่างจากการแจกแจงแบบทวินามสองปริมาณไม่เป็นอิสระ t
whuber

@Abhijit ตำราบางเล่มใช้การแจกแจงแบบ t เป็นค่าประมาณสำหรับสถิตินี้ (ภายใต้เงื่อนไขที่แน่นอน) - ดูเหมือนว่าพวกเขาจะใช้ n-1 เป็น df ในขณะที่ฉันยังไม่เห็นข้อโต้แย้งที่เป็นทางการที่ดีสำหรับมันการประมาณนั้นดูเหมือนจะทำงานได้ค่อนข้างดี สำหรับกรณีที่ฉันตรวจสอบแล้วโดยทั่วไปแล้วจะดีกว่าการประมาณปกติเล็กน้อยเล็กน้อย (แต่สำหรับกรณีที่มีอาร์กิวเมนต์แบบอะซิมโทติคที่เป็นของแข็งที่การประมาณแบบ t ขาดการประมาณ) [แก้ไข: เช็คของตัวเองมีลักษณะคล้ายกับที่แสดง ความแตกต่างระหว่าง z และ t นั้นเล็กกว่าความคลาดเคลื่อนจากสถิติ]
Glen_b

1
อาจเป็นไปได้ว่ามีการโต้แย้งที่เป็นไปได้ (อาจขึ้นอยู่กับเงื่อนไขเริ่มต้นของการขยายตัวของซีรีส์) ที่สามารถพิสูจน์ได้ว่าเสื้อยืดควรได้รับการคาดหวังว่าจะดีกว่าหรือบางทีอาจจะดีกว่าภายใต้เงื่อนไขเฉพาะบางประการ ยังไม่เห็นข้อโต้แย้งใด ๆ ในลักษณะนี้ โดยส่วนตัวแล้วฉันมักจะติดกับ z แต่ฉันไม่ต้องกังวลหากมีคนใช้ t
Glen_b -Reinstate Monica

คำตอบ:


20

ทั้งการแจกแจงแบบปกติและแบบมาตรฐาน t นักเรียนนั้นค่อนข้างที่จะประมาณการกระจายตัวของ

Z=p^pp^(1p^)/n

สำหรับขนาดเล็กจนน่าสงสารที่ข้อผิดพลาดทำให้ความแตกต่างระหว่างการแจกแจงสองอย่างn,

นี่คือการเปรียบเทียบการแจกแจงทั้งสาม (ละเว้นกรณีที่หรือเป็นศูนย์โดยที่ไม่ได้กำหนดอัตราส่วน) สำหรับp^1p^n=10,p=1/2:

รูปที่ 1

การกระจาย "เชิงประจักษ์" นั้นเป็นของซึ่งจะต้องไม่ต่อเนื่องเนื่องจากการประมาณถูก จำกัด ไว้ที่ชุด จำกัดZ,Pp^{0,1/n,2/n,,n/n}.

การแจกแจงแบบดูเหมือนจะทำงานได้ดีขึ้นโดยประมาณt

สำหรับและคุณสามารถเห็นความแตกต่างระหว่างการแจกแจงแบบปกติและแบบมาตรฐานของนักเรียนนั้นเล็กน้อยมาก:n=30p=1/2,

รูปที่ 2

เนื่องจากการแจกแจงของนักเรียน t นั้นซับซ้อนกว่ามาตรฐานปกติ (จริงๆแล้วมันเป็นทั้งครอบครัวของการแจกแจงที่ถูกจัดทำดัชนีโดย "ดีกรีอิสระ" ซึ่งก่อนหน้านี้ต้องการทั้งบทของตารางแทนที่จะเป็นหน้าเดียว) มาตรฐานปกติจึงใช้เกือบทั้งหมด ใกล้เคียง


2
คำตอบที่มีคุณภาพ +1
Demetri Pananos

10

เหตุผลสำหรับการใช้การแจกแจงแบบ t ในช่วงความเชื่อมั่นของค่าเฉลี่ยนั้นขึ้นอยู่กับการสันนิษฐานว่าข้อมูลพื้นฐานเป็นไปตามการแจกแจงแบบปกติซึ่งนำไปสู่การแจกแจงแบบไคสแควร์เมื่อประเมินค่าเบี่ยงเบนมาตรฐานและ{n-1} นี่คือผลที่แน่นอนภายใต้สมมติฐานที่ว่าข้อมูลจะตรงปกติที่นำไปสู่ความเชื่อมั่นว่ามีความคุ้มครอง 95% เมื่อใช้และคุ้มครองน้อยกว่า 95% ถ้าใช้Zx¯μs/ntn1tz

ในกรณีของช่วงเวลา Wald สำหรับสัดส่วนคุณจะได้รับมาตรฐานเชิงเส้นกำกับสำหรับเมื่อ n มีขนาดใหญ่พอซึ่งขึ้นอยู่กับ p ความน่าจะเป็นความคุ้มครองที่เกิดขึ้นจริงของขั้นตอนตั้งแต่การนับพื้นฐานของความสำเร็จมีความต่อเนื่องด้านล่างเป็นบางครั้งและบางครั้งดังกล่าวข้างต้นน่าจะเป็นความคุ้มครองเล็กน้อยจาก 95% ขึ้นอยู่กับที่ไม่รู้จักหน้าดังนั้นจึงไม่มีเหตุผลทางทฤษฎีสำหรับการใช้และไม่มีการรับประกันว่าจากมุมมองการปฏิบัติที่ใช้เพียงเพื่อให้ช่วงกว้างขึ้นจริงจะช่วยให้บรรลุความคุ้มครองเล็กน้อย 95%p^pp^(1p^)/nptt

ความน่าจะเป็นของความครอบคลุมสามารถคำนวณได้อย่างแม่นยำแม้ว่ามันจะค่อนข้างตรงไปตรงมาในการจำลอง ตัวอย่างต่อไปนี้แสดงความน่าจะเป็นของความครอบคลุมที่จำลองขึ้นเมื่อ n = 35 มันแสดงให้เห็นว่าความน่าจะเป็นความครอบคลุมสำหรับการใช้ช่วง z นั้นน้อยกว่า. 95 เล็กน้อยในขณะที่ความน่าจะเป็นความครอบคลุมสำหรับช่วงเวลา t อาจน้อยลงโดยเฉลี่ยอยู่ที่ 0.95 ขึ้นอยู่กับความเชื่อก่อนหน้านี้ของคุณ .

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่


3
+1 เหล่านี้เป็นภาพประกอบที่ยอดเยี่ยมของการอ้างสิทธิ์ที่ฉันทำ (ขึ้นอยู่กับการตรวจสอบกราฟของ CDF มากกว่าการสาธิตอย่างเข้มงวด) เกี่ยวกับความแม่นยำสัมพัทธ์ของ Student t และ CIs ปกติ
whuber

6

ทั้ง AdamO และ jsk ให้คำตอบที่ดี

ฉันจะพยายามทำซ้ำคะแนนของพวกเขาด้วยภาษาอังกฤษธรรมดา:

เมื่อการกระจายพื้นฐานเป็นเรื่องปกติที่คุณรู้ว่ามีสองพารามิเตอร์: ค่าเฉลี่ยและความแปรปรวน การแจกแจงแบบ T เสนอวิธีการอนุมานค่าเฉลี่ยโดยไม่ทราบค่าที่แน่นอนของผลต่าง แทนการใช้ความแปรปรวนที่เกิดขึ้นจริงเพียงตัวอย่างวิธีการและตัวอย่างความแปรปรวนที่มีความจำเป็น เนื่องจากเป็นการกระจายที่แน่นอนคุณจึงรู้ได้อย่างชัดเจนว่าคุณได้อะไร กล่าวอีกนัยหนึ่งน่าจะเป็นความคุ้มครองที่ถูกต้อง การใช้งานของ t ก็สะท้อนให้เห็นถึงความต้องการที่จะหลีกเลี่ยงความแปรปรวนของประชากรที่ไม่รู้จัก

อย่างไรก็ตามเมื่อเราอนุมานตามสัดส่วนอย่างไรก็ตามการแจกแจงพื้นฐานคือทวินาม เพื่อให้ได้การกระจายที่แน่นอนคุณต้องดูช่วงความมั่นใจ Clopper-Pearson สูตรที่คุณให้ไว้เป็นสูตรสำหรับช่วงความเชื่อมั่นของ Wald มันใช้การแจกแจงแบบปกติเพื่อประมาณการกระจายตัวแบบทวินามเนื่องจากการแจกแจงแบบปกติเป็นการ จำกัด การกระจายตัวแบบทวินาม ในกรณีนี้เนื่องจากคุณเป็นเพียงการประมาณค่าระดับความแม่นยำที่เพิ่มขึ้นจากการใช้สถิติ t จึงไม่จำเป็นจึงทำให้ประสิทธิภาพเชิงประจักษ์หมดลง ตามที่แนะนำในคำตอบของ BruceET Agresti-Coull นั้นเรียบง่ายและสูตรมาตรฐานทุกวันนี้สำหรับการประมาณเช่นนั้น

ศาสตราจารย์ Longnecker แห่ง Texas A&M ของฉันทำการจำลองแบบง่าย ๆ เพื่อแสดงให้เห็นว่าการประมาณที่แตกต่างกันทำงานอย่างไรเมื่อเปรียบเทียบกับ CI แบบทวินาม

การเปรียบเทียบ CI ต่างๆ 95% สำหรับสัดส่วน

ข้อมูลเพิ่มเติมสามารถพบได้ในบทความการประมาณค่าช่วงสำหรับสัดส่วนทวินามในวิทยาศาสตร์สถิติปีที่ 16, pp.101-133, โดย L. Brown, T. Cai และ A. DasGupta โดยทั่วไปแนะนำให้ใช้ AC CI สำหรับ n> = 40

ป้อนคำอธิบายรูปภาพที่นี่


3

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยปกติ สมมติว่าเรามีตัวอย่างสุ่มจากประชากรปกติ ลองดูที่ช่วงความมั่นใจสำหรับค่าเฉลี่ยในแง่ของการทดสอบสมมติฐาน ถ้ารู้จักการทดสอบสองด้านของเทียบกับขึ้นอยู่กับสถิติเมื่อเป็นจริงดังนั้นเราจึงปฏิเสธที่ระดับ 5% ถ้าX1,X2,XnμσH0:μ=μ0Ha:μμ0Z=X¯μ0σ/n.H0ZNorm(0,1),H0|Z|1.96.

จากนั้น 'กลับการทดสอบ' เราบอกว่า 95% CI สำหรับประกอบด้วยค่าที่ไม่นำไปสู่การปฏิเสธ - ค่า 'เชื่อ' ของCI มีรูปแบบที่ตัดความน่าจะเป็น 0.025 จากหางบนและล่างตามลำดับของการแจกแจงแบบปกติมาตรฐานμμ0μ.X¯±1.96σ/n,±1.96

หากค่าเบี่ยงเบนมาตรฐานประชากรไม่เป็นที่รู้จักและประเมินโดยค่าเบี่ยงเบนมาตรฐานตัวอย่างเราจะใช้สถิติก่อนต้นปี 1900 คนคิดว่าเป็นค่าปกติประมาณสำหรับใหญ่พอและใช้แทนค่าที่ไม่รู้จักมีการถกเถียงกันว่ามีขนาดใหญ่พอไหมσS,T=X¯μ0S/n.TnSσ.

ในที่สุดก็เป็นที่รู้กันว่าการกระจายของนักเรียนด้วยองศาอิสระ ดังนั้นเมื่อไม่ทราบเราใช้ที่ตัดความน่าจะเป็น 0.025 จากหางบนและล่างตามลำดับของTT(ν=n1),n1σX¯±tS/n,±tT(n-1).

[ หมายเหตุ:สำหรับมีคนสังเกตเห็นว่าสำหรับ 95% CIsดังนั้นความคิดเก่าแก่ศตวรรษที่คุณสามารถ "ได้รับ" เพียงแค่แทนที่สำหรับเมื่อไม่รู้จักและยังคงอยู่แม้ในหนังสือที่ตีพิมพ์เมื่อเร็ว ๆ นี้]n>30,เสื้อ* * * *21.96Sσσn>30,

ช่วงความเชื่อมั่นสำหรับสัดส่วนทวินาม ในกรณีทวินามสมมติว่าเราได้สังเกตความสำเร็จของในการทดลองแบบทวินามด้วยการทดลองอิสระจากนั้นเราใช้เป็นค่าประมาณความน่าจะเป็นสำเร็จทวินาม เพื่อทดสอบเทียบกับเราใช้ statiticภายใต้เรารู้ว่าดังนั้นเราจึงปฏิเสธถ้าXnp^=X/np.H0:p=p0Ha:pp>0,Z=p^p0p0(1p0)/n.H0,ZaprxNorm(0,1).H0|Z|1.96.

หากเราพยายามคว่ำการทดสอบนี้เพื่อให้ได้ 95% CI สำหรับเราพบปัญหาบางอย่าง วิธี 'ง่าย' ในการคว่ำการทดสอบคือการเริ่มต้นโดยการเขียนแต่เขาไม่มีประโยชน์เพราะค่าใต้รากที่ไม่รู้จัก แบบดั้งเดิม Wald CI สันนิษฐานว่าสำหรับมีขนาดใหญ่เพียงพอมันก็โอเคที่จะแทนที่สำหรับไม่รู้จัก ดังนั้น Wald CI จึงมีรูปแบบ[โชคไม่ดีช่วงเวลา Wald ทำงานได้ดีก็ต่อเมื่อจำนวนการทดลองอย่างน้อยหลายร้อย]p,p^±1.96p(1p)n.pn,p^p.p^±1.96p^(1p^)n.n

อย่างละเอียดยิ่งขึ้นหนึ่งสามารถแก้ปัญหาความไม่เท่าเทียมกำลังสองค่อนข้างยุ่งเพื่อ 'คว่ำการทดสอบ' ผลลัพธ์คือช่วงเวลาของ Wilson (ดูWikipedia .) สำหรับช่วงความมั่นใจ 95% ผลลัพธ์ที่ค่อนข้างง่ายรุ่นนี้มาจากการกำหนดและจากนั้นคำนวณช่วงเวลาเป็น รูปแบบของช่วงความเชื่อมั่นทวินามนี้เป็นที่รู้จักกันอย่างกว้างขวางว่าเป็นช่วงเวลา Agresti-Coull มันได้รับการสนับสนุนอย่างกว้างขวางในหนังสือเรียนเบื้องต้นประมาณ 20 ปีที่ผ่านมาnˇ=n+4pˇ=(X+2)/nˇpˇ±1.96pˇ(1pˇ)nˇ.

โดยสรุปวิธีหนึ่งในการดูคำถามของคุณคือสามารถดู CIs สำหรับปกติและทวินามเป็นการทดสอบได้μp

(a) การแจกแจงแบบ t มอบวิธีแก้ปัญหาที่ถูกต้องสำหรับปัญหาที่จำเป็นต้องใช้สำหรับเมื่อไม่ทราบSσσ

(b) การใช้สำหรับต้องใช้ความระมัดระวังเนื่องจากค่าเฉลี่ยและความแปรปรวนของทั้งคู่ขึ้นอยู่กับอาเกรสติ-CI Coull มีวิธีหนึ่งที่จะได้รับใช้สอย CIs สำหรับทวินามที่ถูกต้องเหมาะสมแม้สำหรับขนาดเล็กปานกลางp^pp^p.pn.


2

สังเกตการใช้สัญลักษณ์ซึ่งหมายถึงส่วนเบี่ยงเบนมาตรฐานของประชากร (ที่รู้จัก)σ

T-กระจายเกิดขึ้นเป็นคำตอบสำหรับคำถาม: เกิดอะไรขึ้นเมื่อคุณไม่ทราบว่า ?σ

เขาตั้งข้อสังเกตว่าเมื่อคุณโกงโดยประมาณจากตัวอย่างเป็นตัวประมาณปลั๊กอิน CIs ของคุณโดยเฉลี่ยจะแคบเกินไป สิ่งนี้จำเป็นต้องมีการแจกแจงแบบ Tσ

ตรงกันข้ามถ้าคุณใช้การกระจาย T เมื่อคุณจริงทำรู้ , ช่วงความเชื่อมั่นของคุณจะเฉลี่ยจะกว้างเกินไปσ

นอกจากนี้ควรสังเกตว่าคำถามนี้สะท้อนคำตอบที่ร้องขอโดยคำถามนี้


2
นามแฝง Gosset ที่เผยแพร่ภายใต้ชื่อ "Student" ไม่ใช่ "Student-T" เขายังไม่ได้เกิดขึ้นกับการแจกแจงแบบมาตรฐานเองและไม่ได้เป็นสถิติที่เขาจัดการกับสถิติแบบที (เขาทำสิ่งที่เท่าเทียมกันโดยพื้นฐานแล้วเกี่ยวข้องกับการปรับสเกล แต่เกือบทุกพิธีการที่เราได้มา จากการทำงานของฟิชเชอร์) ฟิชเชอร์เขียนสถิติในแบบที่เราเขียน ฟิชเชอร์เรียกมันว่า ฟิชเชอร์ได้รับการกระจายอย่างเป็นทางการของสถิติ (แสดงให้เห็นถึงการรวมกันของพีชคณิต, ปรีชาและการจำลองการโต้แย้งเกี่ยวกับสถิติของเขาถูกต้อง)
Glen_b -Reinstate Monica

1
ดู Gosset ของ 1908 กระดาษที่นี่: archive.org/details/biometrika619081909pear/page/n13 - นอกจากนี้ยังมีรูปแบบไฟล์ PDF สามารถอ่านได้ที่ดีของตกแต่งกระดาษลงในน้ำยางที่นี่ ทราบว่านี้เป็นลิขสิทธิ์ตั้งแต่มันมานานกว่าไม่กี่ปีก่อนที่เรือกลไฟวิลลี่
Glen_b -Reinstate Monica

@Glen_b ขอบคุณ! ฉันลบเกร็ดเล็กเกร็ดน้อยที่เห็นได้ชัดผิดไปจากประวัติ
AdamO
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.