จะตีความช่วงความเชื่อมั่นของความแตกต่างในค่าเฉลี่ยในการทดสอบ T-test หนึ่งตัวอย่างได้อย่างไร?


21

SPSS ให้เอาต์พุต "ช่วงความมั่นใจของความแตกต่าง" ฉันได้อ่านในบางแห่งว่ามันหมายถึง "95 ครั้งจาก 100 ตัวอย่างเฉลี่ยของเราจะแตกต่างกันระหว่างขอบเขตเหล่านี้" ฉันพบว่าไม่ชัดเจน ใครสามารถแนะนำถ้อยคำที่ชัดเจนขึ้นเพื่ออธิบาย "ช่วงความเชื่อมั่นของความแตกต่างในค่าเฉลี่ย" เอาต์พุตนี้ปรากฏขึ้นในบริบทของการทดสอบ t-test หนึ่งตัวอย่าง


1
อะไรคือภาวะซึมเศร้าของคุณ?
mpiktas

1
โปรดทราบว่าไม่มีอะไรพิเศษเกี่ยวกับสิ่งนี้เป็นสัดส่วน: CI สำหรับการประเมินสิ่งใด ๆ จะถูกตีความในลักษณะที่คล้ายกัน (อย่างไรก็ตามอาจใช้ขั้นตอนที่แตกต่างกันในการสร้าง CI ขึ้นอยู่กับสิ่งที่คาดการณ์ไว้) ดังนั้นคำถามนี้ก็เหมือนกับคำถามก่อนหน้านี้ที่ขอการตีความ CI
whuber

คำตอบ:


13

นี่ไม่ใช่เรื่องง่ายแม้แต่สำหรับนักสถิติที่เคารพนับถือ ดูความพยายามล่าสุดโดยNate Silver :

... ถ้าฉันขอให้คุณบอกฉันว่าการเดินทางของคุณใช้เวลานานกว่าค่าเฉลี่ย 10 นาที - บางอย่างที่ต้องใช้ช่วงความมั่นใจ - คุณต้องคิดถึงเรื่องนั้นสักหน่อย ...

(จากบล็อกFiveThirtyEightใน New York Times, 9/29/10) นี่ไม่ใช่ช่วงความมั่นใจ ขึ้นอยู่กับว่าคุณตีความมันอย่างไรมันเป็นทั้งช่วงความอดทนหรือช่วงการทำนาย (มิฉะนั้นจะไม่มีอะไรเกี่ยวข้องกับการอภิปรายความเป็นไปได้อย่างยอดเยี่ยมในการประเมินความน่าจะเป็นของ Mr. Silver อ่านได้ดี) เว็บไซต์อื่น ๆ อีกหลายแห่ง

นิวยอร์กไทม์สได้พยายามที่จะอธิบายความหมายของผลลัพธ์ทางสถิติที่ผลิตและรายงาน การพิมพ์ที่ดีภายใต้การสำรวจหลายรายการมีดังนี้:

ในทางทฤษฎีใน 19 กรณีจาก 20 ผลลัพธ์ตามตัวอย่างของผู้ใหญ่ทุกคนจะแตกต่างกันไม่เกินสามคะแนนร้อยละในทิศทางใดทิศทางหนึ่งจากสิ่งที่จะได้รับโดยพยายามสัมภาษณ์ผู้ใหญ่ชาวอเมริกันทั้งหมด

( เช่น , วิธีโพลล์ได้ดำเนินการ , 2011/05/02.)

คำพูดเล็ก ๆ น้อย ๆ บางที แต่ชัดเจนและถูกต้อง: คำสั่งนี้เป็นลักษณะความแปรปรวนของการกระจายตัวตัวอย่างของผลการสำรวจความคิดเห็น นั่นใกล้เคียงกับแนวคิดเรื่องช่วงความมั่นใจ แต่มันก็ยังไม่ค่อยอยู่ หนึ่งอาจพิจารณาใช้ถ้อยคำดังกล่าวแทนช่วงความเชื่อมั่นในหลายกรณีอย่างไรก็ตาม

เมื่อมีความสับสนที่อาจเกิดขึ้นบนอินเทอร์เน็ตมันจะเป็นประโยชน์เมื่อต้องหันไปหาแหล่งข้อมูลที่เชื่อถือได้ หนึ่งในรายการโปรดของฉันคือ Freedman, Pisani, & Purves 'text time honoured, Statistics ตอนนี้ในรุ่นที่สี่ของมันถูกนำมาใช้ในมหาวิทยาลัยมานานกว่า 30 ปีและเป็นที่โดดเด่นสำหรับคำอธิบายที่ชัดเจนธรรมดาและมุ่งเน้นไปที่วิธีการ "บ่อย" คลาสสิก เรามาดูสิ่งที่กล่าวเกี่ยวกับการตีความช่วงความเชื่อมั่น:

ระดับความมั่นใจ 95% พูดถึงบางอย่างเกี่ยวกับขั้นตอนการสุ่มตัวอย่าง ...

[ที่หน้า 384; ใบเสนอราคาทั้งหมดมาจากรุ่นที่สาม (1998)] มันยังคง

หากตัวอย่างออกมาต่างกันช่วงความเชื่อมั่นจะแตกต่างกัน ... ประมาณ 95% ของตัวอย่างทั้งหมดช่วงเวลา ... ครอบคลุมถึงเปอร์เซ็นต์ของประชากรและอีก 5% นั้นไม่ได้

[p 384] ข้อความกล่าวถึงช่วงเวลาของความมั่นใจมากขึ้น แต่นี่ก็เพียงพอที่จะช่วย: แนวทางของมันคือการย้ายจุดเน้นของการสนทนาไปยังกลุ่มตัวอย่างทันทีพร้อมนำความแม่นยำและความชัดเจนมาสู่ข้อความ ดังนั้นเราอาจลองทำสิ่งเดียวกันในการรายงานของเราเอง ตัวอย่างเช่นลองใช้วิธีนี้เพื่ออธิบายช่วงความมั่นใจ [34%, 40%] รอบความแตกต่างเปอร์เซ็นต์ที่รายงานในการทดลองสมมุติ:

"การทดลองนี้ใช้กลุ่มตัวอย่างที่เลือกแบบสุ่มและการเลือกการควบคุมแบบสุ่มเรารายงานช่วงความเชื่อมั่นจาก 34% ถึง 40% สำหรับความแตกต่างซึ่งจะทำการตรวจสอบความน่าเชื่อถือของการทดลอง: หากการเลือกวิชาและการควบคุมแตกต่างกัน ช่วงความเชื่อมั่นนี้จะเปลี่ยนไปเพื่อสะท้อนผลลัพธ์ของตัวแบบและตัวควบคุมที่เลือกใน 95% ของกรณีดังกล่าวช่วงความเชื่อมั่นจะรวมถึงความแตกต่างที่แท้จริง (ระหว่างทุกวิชาและตัวควบคุมทั้งหมด ) และอีก 5% ของกรณีนั้น ดังนั้นจึงเป็นไปได้ - แต่ไม่แน่ใจ - ว่าช่วงความเชื่อมั่นนี้รวมถึงความแตกต่างที่แท้จริง: นั่นคือเราเชื่อว่าความแตกต่างที่แท้จริงอยู่ระหว่าง 34% ถึง 40% "

(นี่คือเนื้อหาของฉันซึ่งสามารถปรับปรุงได้อย่างแน่นอน: ฉันเชิญผู้แก้ไขให้ทำงาน)

คำแถลงแบบยาว ๆ แบบนี้ค่อนข้างไม่แน่นอน ในรายงานจริงบริบทส่วนใหญ่ - การสุ่มตัวอย่างแบบสุ่มเรื่องและการควบคุมความเป็นไปได้ของความแปรปรวน - จะได้รับการสร้างขึ้นแล้วทำให้ครึ่งหนึ่งของคำสั่งก่อนหน้านี้ไม่จำเป็น เมื่อรายงานพบว่ามีการสุ่มตัวอย่างความแปรปรวนและแสดงแบบจำลองความน่าจะเป็นสำหรับผลลัพธ์ตัวอย่างมักจะไม่ยากที่จะอธิบายช่วงความเชื่อมั่น (หรือช่วงการสุ่มอื่น ๆ ) อย่างชัดเจนและจริงจังตามที่ผู้ชมต้องการ


ขอบคุณ Whuber ฉันเข้าใจช่วงความมั่นใจสำหรับค่าเฉลี่ยค่อนข้างดี มันคือ CI สำหรับความแตกต่างของค่าเฉลี่ย (ระหว่างตัวอย่างและป๊อป) ที่ฉันสับสน
Anne

@ แอนน์คุณหมายถึงอะไร? ทั้งคำถามและคำตอบใด ๆ ของคุณหมายถึงความแตกต่างระหว่างค่าเฉลี่ยตัวอย่างกับค่าเฉลี่ยประชากรเท่าที่ฉันสามารถบอกได้ คำถามของคุณดูเหมือนจะอ้างถึงความแตกต่างระหว่างค่าเฉลี่ยตัวอย่างสองตัวอย่าง (อาจเป็นค่าเฉลี่ยระหว่างกลุ่มของกลุ่มทดลองและกลุ่มควบคุม)
whuber

ตัวอย่างที่ฉันคิดคือคุณกำลังมองหาความแตกต่างระหว่างตัวอย่างและค่าเฉลี่ยประชากร ในกรณีนี้ CI ระหว่างกลุ่มตัวอย่างกับค่าเฉลี่ยป๊อปหมายถึงอะไร เราใช้ค่าเฉลี่ยตัวอย่างเพื่อประมาณค่าเบี่ยงเบนมาตรฐานป๊อปและจากนั้นเรากำลังประเมิน CI โดยประมาณค่าเฉลี่ย ความแตกต่างของค่าเฉลี่ยนั้นไม่ใช่ความแตกต่างระหว่างค่าเฉลี่ยป๊อปที่เราให้กับค่าเฉลี่ยตัวอย่าง แล้วมันคืออะไร
แอนน์

1
@ แอนน์ "ค่าเฉลี่ยประชากร" เป็นค่าเฉลี่ยที่ไม่รู้จักสมมุติฐานของประชากรที่ถูกสุ่มตัวอย่างหรือเป็นค่าเฉลี่ยที่วัดได้ของประชากรอีกกลุ่มหนึ่งที่สุ่มตัวอย่างอย่างละเอียดหรือไม่ นอกจากนี้ในความรู้สึกสิ่งที่คุณไม่ได้ใช้ "หมายถึงตัวอย่าง" ในการประมาณการประชากรส่วนเบี่ยงเบนมาตรฐาน ? นั่นอาจเป็นคำที่สะกดผิดใช่ไหม
whuber

2
@whuber ขอบคุณ บรรทัดของคุณ "CIs คำนวณได้ 95% ของตัวอย่างทั้งหมด (นั่นคือ 95% ของการจำลองที่เป็นไปได้ทั้งหมด) จะครอบคลุมความแตกต่างที่แท้จริง" ชัดเจนสำหรับฉันมากกว่า "95 เท่าจาก 100 ตัวอย่างความแตกต่างเฉลี่ยของเราจะอยู่ระหว่างขอบเขตเหล่านี้" และคำอธิบายของคุณสมเหตุสมผล
แอน

5

จากมุมมองทางด้านเทคนิคของคนอวดดีฉันไม่คิดว่าจะมี "ถ้อยคำที่ชัดเจน" ในการตีความช่วงความเชื่อมั่น

ฉันจะตีความช่วงความมั่นใจเมื่อ: มีความน่าจะเป็น 95% ที่ช่วงความมั่นใจ 95% ครอบคลุมความแตกต่างเฉลี่ยที่แท้จริง

การตีความของสิ่งนี้คือถ้าเราต้องทำซ้ำการทดลองทั้งหมดครั้งภายใต้เงื่อนไขเดียวกันเราจะมีช่วงความมั่นใจที่แตกต่างกันครั้ง ระดับความเชื่อมั่นคือสัดส่วนของช่วงเวลาเหล่านี้ซึ่งมีความแตกต่างของค่าเฉลี่ยที่แท้จริงNยังไม่มีข้อความยังไม่มีข้อความ

การเล่นโวหารส่วนบุคคลของฉันเองด้วยตรรกะของการให้เหตุผลเช่นนี้คือคำอธิบายของช่วงความมั่นใจนี้ทำให้เราต้องเพิกเฉยตัวอย่างอื่น ๆเมื่อคำนวณช่วงความมั่นใจของเรา ตัวอย่างเช่นหากคุณมีขนาดตัวอย่าง 100 คุณจะไปและคำนวณช่วงความเชื่อมั่น 95% "ตัวอย่าง 1" 95% หรือไม่ยังไม่มีข้อความ-1

แต่โปรดทราบว่านี่คือทั้งหมดที่อยู่ในปรัชญา ช่วงความเชื่อมั่นเป็นสิ่งที่คลุมเครือที่สุดในคำอธิบายที่ฉันคิด พวกเขาให้ผลลัพธ์ที่ดีเมื่อใช้อย่างถูกต้อง


การเริ่มประโยคใหม่หลังจาก "ไม่มีช่วงความมั่นใจที่แตกต่างกัน" ไม่สามารถไหลได้ดีด้วย "คุณสามารถตีความสิ่งนี้เพิ่มเติมเป็นการพูดว่า ... " ฉันขอแนะนำให้แก้ไขวรรคสาม
Theta30

2
ย่อหน้าที่สามของคุณดีกว่าย่อหน้าที่สองมาก ตามเงื่อนไขในข้อมูลที่สังเกตได้ช่วงความมั่นใจอาจมีค่าพารามิเตอร์จริงหรือไม่ก็ได้
พระคาร์ดินัล

@probabilityislogic: เนื่องจากคำตอบนี้ได้รับการยอมรับโปรดพิจารณาแก้ไขวรรคสองของคุณ นอกจากนี้คุณสามารถช่วยอธิบายสิ่งที่คุณหมายถึงในย่อหน้าที่สองถึงย่อหน้าสุดท้ายได้หรือไม่? ขณะที่อ่านฉันไม่แน่ใจว่าคุณกำลังโต้แย้งอะไร
พระคาร์ดินัล

หากเราตีความช่วงความมั่นใจในแง่ของ "การทำซ้ำ" ของการทดสอบเราจะต้องเพิกเฉยต่อการทดลองก่อนหน้าในการทำซ้ำเหล่านี้ ประเด็นของฉันคือ: ทำไมความไม่รู้ของการทดลองก่อนหน้าใน "การทำซ้ำ" ของช่วงความเชื่อมั่นที่ดีสำหรับชุดข้อมูลเหล่านั้นที่เราไม่ได้สังเกต แต่เราต้องรวมข้อมูลเข้าด้วยกันสำหรับข้อมูลที่เราสังเกตเห็น? มันจะไม่สมเหตุสมผลหรือไม่ (จากสิ่งที่ฉันเข้าใจเกี่ยวกับการตีความ CI) เพื่อสร้าง CIs ให้มากที่สุดเท่าที่คุณจะทำได้กับข้อมูลที่คุณมี?
ความน่าจะเป็นเชิง

1
มีทั้งทฤษฎีขนานไปกับทฤษฎีการตัดสินใจที่ดีที่สุดส่วนใหญ่ในชุดความเชื่อมั่นที่แม่นยำที่สุด บางทีนั่นอาจเป็นชิ้นส่วนของปริศนาที่ขาดหายไปสำหรับคุณ (?)
พระคาร์ดินัล

3

คำตอบคร่าวๆสำหรับคำถามคือช่วงความมั่นใจ 95% ช่วยให้คุณมั่นใจ 95% ว่าค่าพารามิเตอร์จริงตั้งอยู่ภายในช่วงเวลา อย่างไรก็ตามคำตอบที่คร่าวๆนั้นไม่สมบูรณ์และไม่ถูกต้อง

ความไม่สมบูรณ์อยู่ในความจริงที่ว่ายังไม่ชัดเจนว่า "95% มั่นใจ" หมายถึงสิ่งใดก็ตามที่เป็นรูปธรรมหรือถ้าเป็นเช่นนั้นความหมายที่เป็นรูปธรรมจะไม่ได้รับการยอมรับในระดับสากลโดยแม้แต่ตัวอย่างเล็ก ๆ ของนักสถิติ ความหมายของความมั่นใจขึ้นอยู่กับวิธีการที่ใช้ในการรับช่วงเวลาและรูปแบบการอนุมานที่ใช้ (ซึ่งฉันหวังว่าจะชัดเจนขึ้นด้านล่าง)

ความไม่ถูกต้องอยู่ที่ความจริงที่ว่าช่วงความเชื่อมั่นจำนวนมากไม่ได้ออกแบบมาเพื่อบอกอะไรคุณเกี่ยวกับที่ตั้งของค่าพารามิเตอร์ที่แท้จริงสำหรับกรณีทดลองเฉพาะที่ให้ช่วงความมั่นใจ! ที่จะน่าแปลกใจสำหรับหลาย ๆ คน แต่มันดังต่อไปนี้โดยตรงจากปรัชญา Neyman-Pearson ที่ระบุไว้อย่างชัดเจนในคำพูดนี้จากกระดาษของพวกเขา 1933 "ในปัญหาของการทดสอบที่มีประสิทธิภาพมากที่สุดของสมมติฐานสถิติ":

เรามีความโน้มเอียงที่จะคิดว่าเท่าที่มีการตั้งสมมติฐานโดยเฉพาะการทดสอบตามทฤษฎีความน่าจะเป็นนั้นไม่สามารถให้หลักฐานที่มีค่าใด ๆ เกี่ยวกับความจริงหรือความเท็จของสมมติฐานนั้น

แต่เราอาจดูวัตถุประสงค์ของการทดสอบจากมุมมองอื่น โดยปราศจากความหวังที่จะรู้ว่าสมมติฐานที่แยกกันแต่ละข้อเป็นจริงหรือเท็จเราอาจค้นหากฎเพื่อควบคุมพฤติกรรมของเราเกี่ยวกับพวกเขาในการติดตามซึ่งเรามั่นใจว่าในประสบการณ์ระยะยาวเราจะไม่ผิดเกินไป

ช่วงเวลาที่เป็นไปตาม 'การผกผัน' ของการทดสอบสมมติฐาน NP จึงจะสืบทอดมาจากการทดสอบนั้นธรรมชาติของการมีคุณสมบัติข้อผิดพลาดที่รู้จักกันในระยะยาวโดยไม่อนุญาตให้อนุมานเกี่ยวกับคุณสมบัติของการทดสอบที่ให้ผล! ความเข้าใจของฉันคือสิ่งนี้ช่วยป้องกันการอนุมานแบบอุปนัยซึ่งเห็นได้ชัดว่าเนย์แมนถือว่าเป็นสิ่งที่น่ารังเกียจ

Neyman ได้วางคำเรียกร้องอย่างชัดเจนในคำว่า 'ช่วงความมั่นใจ' และที่มาของทฤษฎีความเชื่อมั่นในกระดาษ Biometrika ของเขาในปีพ. ศ. 2484“ การโต้แย้งความไว้วางใจและทฤษฎีของช่วงความเชื่อมั่น” ในแง่หนึ่งสิ่งใดก็ตามที่เป็นช่วงความเชื่อมั่นอย่างถูกต้องเล่นตามกฎของเขาและดังนั้นความหมายของแต่ละช่วงเวลาสามารถแสดงได้ในรูปของอัตราระยะยาวที่ช่วงเวลาที่คำนวณโดยวิธีนั้นมี (ครอบคลุม) จริงที่เกี่ยวข้อง ค่าพารามิเตอร์

ตอนนี้เราต้องแยกการอภิปราย หนึ่งสายตามความคิดของ 'ความครอบคลุม' และอีกกลุ่มหนึ่งติดตามช่วงเวลาที่ไม่ใช่ Neymanian ที่เป็นเหมือนช่วงความมั่นใจ ฉันจะเลื่อนอดีตเพื่อให้ฉันสามารถโพสต์นี้ให้เสร็จสมบูรณ์ก่อนที่จะยาวเกินไป

มีวิธีการที่แตกต่างกันมากมายที่ให้ช่วงเวลาที่เรียกว่าช่วงความเชื่อมั่นที่ไม่ใช่ Neymanian ครั้งแรกของเหล่านี้คือช่วงเวลา fiducial ของชาวประมง (คำว่า 'fiducial' อาจทำให้ผู้คนจำนวนมากและหลุดพ้นจากคนอื่น แต่ฉันจะทิ้งมันไว้ ... ) สำหรับข้อมูลบางประเภท (เช่นปกติกับความแปรปรวนของประชากรที่ไม่รู้จัก) ช่วงเวลาที่คำนวณโดยวิธีฟิชเชอร์จะเหมือนกับตัวเลข ช่วงเวลาที่จะคำนวณโดยวิธีของ Neyman อย่างไรก็ตามพวกเขาเชิญตีความที่ตรงกันข้ามกับ diametrically ช่วงเวลา Neymanian สะท้อนให้เห็นถึงคุณสมบัติการครอบคลุมระยะยาวของวิธีการเท่านั้นในขณะที่ช่วงเวลาของ Fisher มีวัตถุประสงค์เพื่อสนับสนุนการอนุมานแบบอุปนัยที่เกี่ยวข้องกับค่าพารามิเตอร์ที่แท้จริงสำหรับการทดลองเฉพาะที่ดำเนินการ

ความจริงที่ว่าขอบเขตของช่วงเวลาหนึ่งชุดอาจมาจากวิธีการที่ขึ้นอยู่กับกระบวนทัศน์ที่แตกต่างกันของปรัชญาสองอันนำไปสู่สถานการณ์ที่สับสนจริงๆ - ผลลัพธ์สามารถตีความได้ในสองวิธีที่ขัดแย้งกัน จากการโต้แย้ง fiducial มีโอกาส 95% ที่ช่วงเวลา fiducial 95% เฉพาะจะมีค่าพารามิเตอร์ที่แท้จริง จากวิธีการของ Neyman เรารู้เพียงว่า 95% ของช่วงเวลาที่คำนวณในลักษณะนั้นจะมีค่าพารามิเตอร์จริงและต้องบอกสิ่งที่สับสนเกี่ยวกับความน่าจะเป็นของช่วงเวลาที่มีค่าพารามิเตอร์จริงที่ไม่รู้จัก แต่อย่างใดอย่างหนึ่งหรือ 0

ในระดับใหญ่วิธีการของ Neyman ได้ส่งผลกระทบต่อฟิชเชอร์ ที่โชคร้ายที่สุดในความคิดของฉันเพราะมันไม่ได้นำไปสู่การตีความตามธรรมชาติของช่วงเวลา (อ่านข้อความอ้างอิงข้างต้นจาก Neyman และ Pearson และดูว่าตรงกับการตีความตามธรรมชาติของผลการทดลองหรือไม่น่าจะเป็นไปได้)

หากช่วงเวลาสามารถตีความได้อย่างถูกต้องในแง่ของอัตราความผิดพลาดทั่วโลก แต่ยังถูกต้องในเงื่อนไขการอนุมานในพื้นที่ฉันไม่เห็นเหตุผลที่ดีที่ผู้ใช้ช่วงเวลาแถบจากการตีความที่เป็นธรรมชาติมากขึ้นโดยหลัง ดังนั้นข้อเสนอแนะของฉันคือการตีความที่เหมาะสมของช่วงความเชื่อมั่นทั้งสองต่อไปนี้:

  • Neymanian: ช่วง 95% นี้ถูกสร้างขึ้นโดยวิธีการที่ให้ช่วงเวลาที่ครอบคลุมค่าพารามิเตอร์ที่แท้จริงใน 95% ของโอกาสในระยะยาว (... จากประสบการณ์เชิงสถิติของเรา)

  • ฟิชเชอร์: ช่วง 95% นี้มีโอกาส 95% ที่จะครอบคลุมค่าพารามิเตอร์จริง

(วิธีการแบบเบย์และความน่าจะเป็นยังให้ผลเป็นระยะด้วยคุณสมบัติที่ต้องการบ่อยครั้งเช่นช่วงนั้นเชิญการตีความที่แตกต่างกันเล็กน้อยซึ่งทั้งสองอาจจะรู้สึกเป็นธรรมชาติมากกว่า Neymanian)


@Micheal - สถานที่ที่พวกเขาจะแตกต่างกันคือช่วงเวลา fudicial ต้องขึ้นอยู่กับสถิติที่เพียงพอและเงื่อนไขในปริมาณเสริมทั้งหมด ช่วงความมั่นใจของ Neymans ไม่ต้องการคุณสมบัตินี้และอยู่ภายใต้ "ช่วงความมั่นใจ 95%" ซึ่งมีความครอบคลุมที่แตกต่างกันสำหรับคลาสย่อยตัวอย่าง
ความน่าจะเป็นที่เป็นไปได้

@probability - คุณสามารถขยายได้ไหม? คุณหมายถึงมีสถานการณ์ที่ช่วงความมั่นใจ 95% Neymanian เป็นช่วงความมั่นใจ แต่ไม่ใช่ช่วง 95%? สถานการณ์เหล่านั้นจะเป็นอย่างไร ช่วงเวลาของชาวประมงจะมีขอบเขตเท่ากันในสถานการณ์เหล่านั้นหรือไม่?
Michael Lew

คุณสามารถแสดงกรณีที่คุณสามารถบอกได้จากตัวอย่างว่าช่วงความมั่นใจ "95%" ไม่มีค่าจริง ตัวอย่างที่ 5 และตัวอย่างที่ 6ในกระดาษของ Jaynes ให้สองกรณีที่ไม่ได้ใช้สถิติที่เพียงพอใน CIs จะให้ความคุ้มครองในระยะยาว แต่ความครอบคลุมจะแตกต่างกันไปในบางกลุ่มตัวอย่าง มันจะคล้ายคลึงกับการมีสองตัวแปรกับค่าเฉลี่ยเดียวกัน (ระยะยาวความคุ้มครอง) แต่ความแปรปรวนที่แตกต่างกัน (ความคุ้มครองในกรณีที่เฉพาะเจาะจง)
probabilityislogic

2

ความหมายของช่วงความมั่นใจคือ: หากคุณต้องทำการทดสอบซ้ำในลักษณะเดียวกัน (เช่น: จำนวนการสังเกตที่เหมือนกันการวาดจากประชากรเดียวกัน ฯลฯ ) และหากสมมติฐานของคุณถูกต้องและคุณจะคำนวณ ช่วงเวลานั้นอีกครั้งในการทำซ้ำแต่ละครั้งดังนั้นช่วงความมั่นใจนี้จะมีความชุกที่แท้จริงใน 95% ของการทำซ้ำ (โดยเฉลี่ย)

ดังนั้นคุณอาจพูดได้ว่าคุณมั่นใจ 95% (หากสมมติฐานของคุณถูกต้อง ฯลฯ ) ซึ่งคุณได้สร้างช่วงเวลาที่มีความชุกที่แท้จริง

โดยทั่วไปแล้วจะกล่าวว่า: ด้วยความมั่นใจ 95% ระหว่าง 4.5 และ 8.3% ของเด็กของแม่ที่สูบบุหรี่ตลอดการตั้งครรภ์จะอ้วน

โปรดทราบว่าโดยทั่วไปแล้วสิ่งนี้ไม่น่าสนใจ: คุณอาจต้องการเปรียบเทียบสิ่งนี้กับความชุกในเด็กของมารดาที่ไม่สูบบุหรี่ (อัตราต่อรองความเสี่ยงสัมพัทธ์ ฯลฯ )


(ตอบนี้ซึ่งจะมาถึงที่นี่หลังจากการควบรวมกิจการของทั้งสองหัวข้อที่มีการตอบสนองกับคำถามที่ซ้ำกันในกรอบการ CI สัดส่วนที่.)
whuber

0

หากความแตกต่างเฉลี่ยที่แท้จริงอยู่นอกช่วงเวลานี้มีโอกาสเพียง 5% เท่านั้นที่ความแตกต่างเฉลี่ยจากการทดสอบของเราจะห่างไกลจากความแตกต่างเฉลี่ยที่แท้จริง


คุณหมายความว่าอย่างไรที่ไกลแสนไกล? นี่เป็นขอบเขตสูงสุดของ CI ที่อยู่ไกลหรือค่าเฉลี่ยที่สังเกตหรือไม่?
ความน่าจะเป็นเชิง

ระยะห่างระหว่างค่าเฉลี่ยที่แท้จริงกับค่าเฉลี่ยที่สังเกตคือสิ่งที่ฉันหมายถึงโดย ฉันจะเปลี่ยนเป็น "ไกล"; ฉันคิดว่ามันชัดเจนกว่านี้เล็กน้อย
โทมัสเลวีน

-2

การตีความของฉัน: หากคุณทำการทดลอง N ครั้ง (โดยที่ N มีแนวโน้มที่จะไม่มีที่สิ้นสุด) จากการทดลองจำนวนมากเหล่านี้ 95% ของการทดลองจะมีช่วงความมั่นใจซึ่งอยู่ภายในขีด จำกัด 95% เหล่านี้ ชัดเจนยิ่งขึ้นสมมติว่าขีด จำกัด เหล่านั้นคือ "a" และ "b" จากนั้น 95 จาก 100 เท่าค่าเฉลี่ยตัวอย่างของคุณจะอยู่ระหว่าง "a" และ "b" ฉันคิดว่าคุณเข้าใจว่าการทดสอบที่แตกต่างกันอาจมีตัวอย่างที่แตกต่างกัน จากประชากรทั้งหมด


@ Ayush ขอบคุณ นั่นเป็นประโยชน์ ขอโทษฉันไม่ได้ทำตามประโยคสุดท้ายของคุณ
แอนน์

@anne - ตกลง สิ่งที่ฉันหมายถึงคือถ้าคุณต้องการทดสอบค่าเฉลี่ยระหว่างสองตัวอย่างและสมมุติว่าแต่ละตัวอย่างมี 1,000 คนคุณสามารถกำหนดตัวอย่างที่ไม่มีที่สิ้นสุดได้ (จากสมมุติ 40 คนจากแต่ละตัวอย่าง) .. ฉันเขียนสิ่งนี้เพื่อบอกว่าทำไม การทดลองที่แตกต่างกันนั้นแตกต่างกันไป .. การทดลองที่เราสังเกตช่วงความมั่นใจ
ayush biyani

2
@ayush - นี่ไม่ใช่การตีความที่ถูกต้องในประโยคที่สองของคุณ หรืออย่างน้อยคุณควรเพิ่มตัวห้อยไปที่ "a" และ "b" ซึ่งทำให้ชัดเจนว่ามันคือปริมาณที่แตกต่างกันไปกว่า 100 เท่า เครื่องหมายปัจจุบันของคุณทำให้ดูเหมือนว่า "a" และ "b" เป็นปริมาณคงที่
ความน่าจะเป็นของระบบ

@probabilityislogic - เห็นด้วย.. ตัวห้อยมีความจำเป็น
ayush biyani

1
[a,]

-2

"95 ครั้งจาก 100 ค่าของคุณจะตกอยู่ภายในค่าเบี่ยงเบนมาตรฐานเดียวของค่าเฉลี่ย"


4
ยินดีต้อนรับสู่เว็บไซต์ @beginnerstat ฉันสงสัยว่าคุณตั้งใจจะพูดว่า " ค่าเบี่ยงเบนมาตรฐานสองค่า" หรือไม่? นอกจากนี้ฉันไม่แน่ใจว่าฉันเห็นว่าถ้อยคำนี้ปรับปรุงสิ่งที่ OP อ่านได้จากที่อื่นอย่างไร คุณต้องการที่จะอธิบายรายละเอียดเล็กน้อย?
gung - Reinstate Monica

1
ใช่ความคิดเห็นของ @ gung: ฉันสนใจเป็นพิเศษในการทำความเข้าใจความหมายของคำว่า "หมายถึง" และ "SD" ที่นี่ สิ่งเหล่านี้อ้างถึงพารามิเตอร์พื้นฐานหรือตัวอย่างการประมาณหรือไม่ พวกมันอ้างถึงการกระจายตัวของตัวแปรสุ่มพื้นฐานหรือการกระจายตัวตัวอย่างของค่าเฉลี่ยของตัวแปร iid จากการแจกแจงแบบนั้นหรือไม่?
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.