ช่วงความมั่นใจแคบลง - มีความแม่นยำมากขึ้นหรือไม่


18

ฉันมีคำถามสองข้อเกี่ยวกับช่วงความมั่นใจ:

เห็นได้ชัดว่าช่วงความมั่นใจแคบหมายความว่ามีโอกาสน้อยที่จะได้รับการสังเกตภายในช่วงเวลานั้นดังนั้นความแม่นยำของเราจึงสูงกว่า

นอกจากนี้ช่วงความมั่นใจ 95% นั้นแคบกว่าช่วงความมั่นใจ 99% ซึ่งกว้างกว่า

ช่วงความมั่นใจ 99% นั้นแม่นยำกว่า 95%

ใครช่วยอธิบายง่ายๆที่จะช่วยให้ฉันเข้าใจความแตกต่างระหว่างความถูกต้องและความแคบนี้


2
ฉันคิดว่าคุณหมายถึง "มีโอกาสน้อยกว่าที่จะได้รับการสังเกตนอกช่วงเวลานั้น" น่าเสียดายที่ Confidence Interval อาจไม่ได้หมายถึงสิ่งที่ดูเหมือนว่ามีความหมายเนื่องจากปัญหาทางเทคนิคและสถิติ แต่โดยทั่วไปแล้วช่วงเวลาที่แคบลง (ในระดับความเชื่อมั่นที่กำหนด) จะมีความไม่แน่นอนน้อยลงเกี่ยวกับผลลัพธ์ มีหลายเธรดในไซต์นี้ที่พูดถึงความมั่นใจช่วงเวลาที่มีความหมายว่า เราไม่ได้เข้าสู่ช่วงการคาดการณ์ ...
Wayne

@ เวย์นเหตุใดคำสั่งจึงไม่เป็น "มีโอกาสน้อยกว่าที่จะได้รับการสังเกตภายใน ช่วงเวลานั้น"? เนื่องจากช่วงเวลาที่แคบมีข้อผิดพลาดประเภท 1 ขนาดใหญ่จึงมีแนวโน้มที่จะปฏิเสธสมมติฐานว่างที่แท้จริงได้นั่นคือค่า null ที่แท้จริงของฉันไม่มีอยู่ในช่วงเวลานั้น ดังนั้นดูเหมือนว่าฉันa narrow confidence interval implies that there is a smaller chance of obtaining an observation within that intervalถูกต้อง คุณช่วยอธิบายฉันทีฉันทำผิดพลาดได้ที่ไหน
ผู้ใช้ 31466

คำตอบ:


19

95% นั้นไม่ได้มีการแนบตัวเลขเพื่อความมั่นใจว่าคุณได้ครอบคลุมผลกระทบที่แท้จริงในการทดสอบของคุณ อาจจำได้ว่า "ช่วงเวลาที่ใช้การคำนวณช่วงความครอบคลุม 95%" อาจเป็นชื่อที่แม่นยำกว่า คุณสามารถเลือกได้ว่าจะให้ช่วงเวลานั้นมีค่าจริงหรือไม่ และคุณจะถูกต้องถ้าคุณทำอย่างนั้นอย่างสม่ำเสมอ 95% ของเวลา แต่คุณไม่รู้จริงๆว่ามันเป็นไปได้สำหรับการทดสอบเฉพาะของคุณโดยไม่มีข้อมูลเพิ่มเติม

คำถามที่ 1: ข้อความค้นหาแรกของคุณทำให้ข้อความสองอย่างสับสนและใช้คำผิด ไม่น่าแปลกใจที่คุณสับสน ช่วงความมั่นใจที่แคบอาจมีความแม่นยำมากขึ้น แต่เมื่อคำนวณด้วยวิธีเดียวกันเช่นวิธี 95% พวกเขาทั้งหมดมีความแม่นยำเท่ากัน พวกเขาจับมูลค่าที่แท้จริงในสัดส่วนที่เท่ากันของเวลา

นอกจากนี้เนื่องจากความแคบไม่ได้หมายความว่าคุณมีโอกาสน้อยที่จะพบตัวอย่างที่อยู่ในช่วงความมั่นใจที่แคบ ช่วงความมั่นใจแคบสามารถทำได้หนึ่งในสามวิธี วิธีการทดลองหรือลักษณะของข้อมูลอาจมีความแปรปรวนต่ำมาก ช่วงความมั่นใจรอบ ๆ จุดเดือดของน้ำประปาที่ระดับน้ำทะเลนั้นค่อนข้างเล็กโดยไม่คำนึงถึงขนาดตัวอย่าง ช่วงความมั่นใจรอบ ๆ น้ำหนักเฉลี่ยของคนอาจจะค่อนข้างใหญ่เพราะคนนั้นแปรปรวนมาก แต่คนเราสามารถทำให้ช่วงความมั่นใจนั้นเล็กลงด้วยการได้รับการสังเกตมากขึ้น ในกรณีดังกล่าวเมื่อคุณได้รับความมั่นใจมากขึ้นเกี่ยวกับสถานที่ที่คุณเชื่อว่ามูลค่าที่แท้จริงคือโดยการเก็บตัวอย่างมากขึ้นและสร้างช่วงความมั่นใจที่แคบลง ความน่าจะเป็นของการเผชิญหน้ากับบุคคลในช่วงความเชื่อมั่นนั้นลดลง (มันจะลงในกรณีใด ๆ เมื่อคุณเพิ่มขนาดตัวอย่าง แต่คุณอาจไม่ต้องเก็บตัวอย่างขนาดใหญ่ในเคสน้ำเดือด) ในที่สุดมันอาจแคบเพราะตัวอย่างของคุณไม่ได้เป็นตัวแทน ในกรณีนั้นคุณมักจะมีช่วงเวลาหนึ่งใน 5% ของช่วงเวลาที่ไม่มีค่าจริง มันเป็นเรื่องที่ค่อนข้างขัดแย้งกันเกี่ยวกับความกว้างของ CI และบางสิ่งที่คุณควรตรวจสอบโดยรู้จากวรรณกรรมและความแปรปรวนของข้อมูลนี้ ในกรณีนั้นคุณมักจะมีช่วงเวลาหนึ่งใน 5% ของช่วงเวลาที่ไม่มีค่าจริง มันเป็นเรื่องที่ค่อนข้างขัดแย้งกันเกี่ยวกับความกว้างของ CI และบางสิ่งที่คุณควรตรวจสอบโดยรู้จากวรรณกรรมและความแปรปรวนของข้อมูลนี้ ในกรณีนั้นคุณมักจะมีช่วงเวลาหนึ่งใน 5% ของช่วงเวลาที่ไม่มีค่าจริง มันเป็นเรื่องที่ค่อนข้างขัดแย้งกันเกี่ยวกับความกว้างของ CI และบางสิ่งที่คุณควรตรวจสอบโดยรู้จากวรรณกรรมและความแปรปรวนของข้อมูลนี้

พิจารณาเพิ่มเติมว่าช่วงความมั่นใจนั้นเกี่ยวกับการพยายามประเมินค่าเฉลี่ยที่แท้จริงของประชากร หากคุณรู้ว่าจุดนั้นคุณจะแม่นยำยิ่งขึ้น (และแม่นยำ) และไม่มีช่วงการประมาณ แต่ความน่าจะเป็นของคุณที่จะพบกับการสังเกตด้วยค่าเดียวกันที่แน่นอนนั้นจะต่ำกว่าการค้นหาหนึ่งค่าในตัวอย่าง CI ใด ๆ ก็ตาม

Q2 : ช่วงความมั่นใจ 99% นั้นกว้างกว่า 95% ดังนั้นจึงมีแนวโน้มที่จะมีค่าที่แท้จริง ดูความแตกต่างด้านบนระหว่างความแม่นยำและความแม่นยำคุณกำลังสับสนทั้งสอง ถ้าฉันทำให้ช่วงความเชื่อมั่นแคบลงด้วยความแปรปรวนต่ำกว่าและขนาดตัวอย่างที่สูงขึ้นมันจะแม่นยำยิ่งขึ้นค่าที่น่าจะครอบคลุมช่วงที่เล็กลง ถ้าฉันเพิ่มความครอบคลุมโดยใช้การคำนวณ 99% มันจะแม่นยำมากขึ้นค่าจริงจะมีแนวโน้มที่จะอยู่ในช่วง


2
ความแปรปรวนของค่าเฉลี่ย (= สิ่งที่คุณพยายามประมาณ) ในประชากรคือศูนย์
Nick Sabbe

10

สำหรับชุดข้อมูลที่กำหนดการเพิ่มระดับความเชื่อมั่นของช่วงความมั่นใจจะส่งผลให้มีช่วงเวลาที่มากขึ้นเท่านั้น (หรืออย่างน้อยก็ไม่น้อยไปกว่านี้) ) นั่นไม่เกี่ยวกับความถูกต้องหรือความแม่นยำ แต่เป็นความเสี่ยงที่คุณต้องการรับเกี่ยวกับการสูญเสียคุณค่าที่แท้จริง

หากคุณกำลังเปรียบเทียบช่วงความเชื่อมั่นสำหรับประเภทเดียวกันของพารามิเตอร์จากข้อมูลหลายชุดและมีขนาดเล็กกว่าที่อื่น ๆ ที่คุณอาจกล่าวได้ว่าเป็นคนที่มีขนาดเล็กมากขึ้นได้อย่างแม่นยำ ฉันชอบที่จะพูดเกี่ยวกับความแม่นยำมากกว่าความถูกต้องในสถานการณ์นี้ (ดูบทความ Wikipedia ที่เกี่ยวข้อง )


"พารามิเตอร์ประเภทเดียวกัน" และ "ชุดข้อมูลหลายชุด" มีความหมายอย่างไร บอกเด็ก ๆ ว่าการสำรวจความไม่รู้หนังสือและการสำรวจนั้นดำเนินการในเวลาต่างกัน, 1995, 1998 เป็นต้น จากนั้นเป็น "อัตราการไม่รู้หนังสือ" ประเภทเดียวกันของพารามิเตอร์และชุดข้อมูลปี 1995, 1998 และอื่น ๆ ระบุชุดข้อมูลหลายชุดหรือไม่
ผู้ใช้ 31466

ตัวอย่างเช่นชุดของช่วงความมั่นใจแต่ละชุดมีค่าเฉลี่ยของประชากรบางส่วน ตัวอย่างของคุณก็เหมาะกับฉันด้วย
Karl

3

ก่อนอื่น CI สำหรับเปอร์เซ็นต์ความเชื่อมั่นที่กำหนด (เช่น 95%) หมายถึงสำหรับวัตถุประสงค์ในทางปฏิบัติทั้งหมด (แม้ว่าในทางเทคนิคจะไม่ถูกต้อง) ที่คุณมั่นใจว่ามูลค่าที่แท้จริงอยู่ในช่วงเวลา

หากนี่คือช่วงเวลา "แคบ" (โปรดทราบว่าสิ่งนี้สามารถถือได้ว่าเป็นแบบสัมพัทธ์เท่านั้นดังนั้นสำหรับการเปรียบเทียบกับสิ่งต่อไปนี้บอกว่ามันเป็น 1 หน่วยกว้าง) หมายความว่าไม่มีที่ว่างสำหรับเล่นมาก: ค่าใด ๆ คุณเลือกในช่วงเวลานั้นจะใกล้เคียงกับมูลค่าที่แท้จริง (เพราะช่วงเวลาแคบ) และคุณค่อนข้างแน่ใจ (95%)

เปรียบเทียบสิ่งนี้กับ 95% CI ที่ค่อนข้างกว้าง (เพื่อให้ตรงกับตัวอย่างก่อนหน้านี้กล่าวคือกว้าง 100 หน่วย): ที่นี่คุณยังคงแน่ใจ 95% ว่ามูลค่าที่แท้จริงจะอยู่ภายในช่วงเวลานี้ แต่นั่นไม่ได้บอกอะไรคุณมาก มากเนื่องจากมีค่าค่อนข้างมากในช่วงเวลา (ประมาณ 100 เท่าเมื่อเทียบกับ 1 - และฉันถามอีกครั้งว่านักพิถีพิถันไม่สนใจความเรียบง่าย)

โดยทั่วไปคุณจะต้องมีช่วงเวลาที่มากขึ้นเมื่อคุณต้องการให้แน่ใจ 99% ว่ามูลค่าที่แท้จริงนั้นอยู่ในนั้นมากกว่าเมื่อคุณจะต้องแน่ใจ 95% (หมายเหตุ: สิ่งนี้อาจไม่เป็นจริงถ้าช่วงไม่ซ้อนกัน ) ดังนั้นยิ่งคุณมีความมั่นใจมากเท่าใดคุณจะต้องเลือกช่วงเวลาที่กว้างขึ้น

ในทางกลับกันคุณจะมั่นใจมากขึ้นด้วยช่วงความมั่นใจที่สูงขึ้น ดังนั้นถ้าผมให้ช่วงความกว้างเท่ากัน 2 ช่วงและผมบอกว่าอันหนึ่งคือ 95% CI และอีกอันคือ 99% CI ผมหวังว่าคุณจะชอบ 99% ในแง่นี้ 99% CIs มีความแม่นยำมากขึ้น: คุณมีข้อสงสัยน้อยลงว่าคุณจะพลาดความจริง


ขอบคุณ! ดังนั้นเมื่อพวกเขากล่าวว่าการวิจัยใหม่เกี่ยวกับนิวตริโนที่เร็วกว่าแสงมีช่วงความเชื่อมั่นน้อยมาก (ฉันเดาว่านี่หมายถึงแคบลง) ดังนั้นนั่นหมายความว่าพวกเขามีแนวโน้มที่จะแม่นยำมากขึ้นถ้าเป็นช่วงความมั่นใจกว้าง (ไม่สนใจประเด็นอื่น ๆ ทั้งหมด)
เปิดตัว

10
นิคประโยคแรกของคุณผิด มันไม่ใช่ "ปัญหาทางเทคนิค" แต่ก็ไม่ถูกต้อง ช่วงความมั่นใจเป็นข้อความเกี่ยวกับสิ่งที่จะเกิดขึ้นในการทดลองซ้ำซึ่งพวกเขาจะครอบคลุมมูลค่าที่แท้จริง 95% ของเวลา คำแถลงเกี่ยวกับความเชื่อมั่นว่ามูลค่าที่แท้จริงอยู่ในช่วงที่ฉันกำหนดที่พบในการทดสอบที่กำหนดของฉันไม่ตรงกับที่ หากคุณลบ "ว่า" ใน "มั่นใจ" และจำนวนตัวเลขที่สอดไว้แล้วคุณจะเข้าใกล้ความจริงมากขึ้น คุณสามารถบอกได้ว่ามันหมายความว่าคุณเชื่อว่ามูลค่าที่แท้จริงน่าจะตกอยู่ในช่วงเวลานั้น
จอห์น

ไม่อย่างนั้นคำตอบก็ค่อนข้างดี ...
John

4
@ จอห์น: ฉันหลีกเลี่ยงโดยเฉพาะบอกว่าช่วงเวลาที่ตัวเองเป็นตัวแปรสุ่มแม้ว่าประโยคของฉันไม่ได้หมายความว่ามันจะไม่เป็น (ยอมรับว่ามันแนะนำเช่นนั้น) ฉันรู้ปัญหาที่เกี่ยวข้อง แต่พบว่าไม่เกี่ยวข้องกับคำถาม ฉันไม่เคยเห็นสถานการณ์ในทางปฏิบัติที่ความแตกต่างมีความสำคัญดังนั้น "สำหรับทุกวัตถุประสงค์ในการปฏิบัติ"
Nick Sabbe

4
ไม่พบปัญหาใช่ไหม นั่นก็เหมือนกับการบอกว่า p-value = ความน่าจะเป็นของโมฆะแล้วบอกว่าคุณไม่เคยเจอปัญหา คุณจะไม่ถ้าคุณอยู่ในวารสารที่ถูกต้อง มันไม่ถูกต้องที่จะบอกว่าคุณแน่ใจ 95% ว่ามูลค่าที่แท้จริงอยู่ในช่วงปัจจุบันของคุณ การปฏิบัติอย่างที่เป็นเรื่องลึกลับนั้นหมายถึงตอนนี้เราจะมีอีกคน (อย่างน้อย) เดินไปรอบ ๆ พูดว่า "ฉันมั่นใจ 95% คุณค่าอยู่ในช่วงนี้" มันแทบจะไม่เปลี่ยนคำตอบของคุณเพื่อแก้ไข ปัญหาอื่น ๆ ที่คุณกระโปรงอาจถูกละเว้นหากคุณเปลี่ยนคำสั่งที่หนึ่ง
จอห์น

3

ฉันกำลังเพิ่มคำตอบที่ดีบางอย่างที่นี่ฉันให้ upvotes ฉันคิดว่ามีอีกเล็กน้อยที่ควรกล่าวเพื่อสรุปข้อสรุปให้สมบูรณ์ ฉันชอบคำที่ถูกต้องและถูกต้องตามที่ Efron กำหนดไว้ ฉันให้การอภิปรายที่ยาวมากเกี่ยวกับเรื่องนี้เมื่อเร็ว ๆ นี้โดยคำถามอื่น เสียงหวีดปานกลางชอบคำตอบนั้นจริงๆ ฉันจะไม่ไปที่เดียวกันเพื่อทำซ้ำที่นี่ อย่างไรก็ตามความแม่นยำของ Efron นั้นเกี่ยวข้องกับระดับความเชื่อมั่นและความถูกต้องของความกว้างหรือความหนาแน่นของช่วงเวลา แต่คุณไม่สามารถพูดถึงความรัดกุมโดยไม่คำนึงถึงความถูกต้องก่อน ช่วงความเชื่อมั่นบางอย่างนั้นถูกต้องเพราะมีความครอบคลุมจริงที่โฆษณา ช่วงความเชื่อมั่น 95% อาจเป็นค่าประมาณได้เนื่องจากใช้การแจกแจงแบบเชิงเส้น ช่วงเวลาโดยประมาณขึ้นอยู่กับ asymptotics สำหรับขนาดตัวอย่างที่ จำกัด n จะไม่มีการครอบคลุมโฆษณาที่เป็นความครอบคลุมที่คุณจะได้รับหากการกระจายเชิงซีมโทติคเป็นการกระจายที่แน่นอน ดังนั้นช่วงเวลาโดยประมาณอาจมีสายลับ (เช่นโฆษณา 95% เมื่อความคุ้มครองที่แท้จริงมีเพียง 91%) หรือในกรณีที่ครอบคลุมน้อยกว่า แต่ร้ายแรงน้อยกว่า (เช่นโฆษณาที่ครอบคลุมคือ 95% แต่จริงใน 98%) ในกรณีก่อนหน้านี้เรากังวลเกี่ยวกับความครอบคลุมที่แท้จริงที่เกิดขึ้นกับการครอบคลุมที่โฆษณาไว้) การวัดความใกล้ชิดคือลำดับของความแม่นยำซึ่งอาจพูดได้ 1 / √nหรือ 1 / n หากระดับความเชื่อมั่นที่แท้จริงอยู่ใกล้เราเรียกว่าถูกต้อง Accuray มีความสำคัญต่อช่วงเวลาการบูตความมั่นใจซึ่งไม่แน่นอน แต่ตัวแปรบางตัวมีความแม่นยำมากกว่ารุ่นอื่น

คำจำกัดความความแม่นยำนี้อาจแตกต่างจากที่ OP อ้างถึง แต่ควรชัดเจนในขณะนี้นิยามของ Efron คืออะไรและเหตุใดจึงสำคัญที่ต้องแม่นยำ ตอนนี้ถ้าคุณมีสองวิธีที่แน่นอนเราสามารถเลือกวิธีอื่นถ้าระดับความเชื่อมั่นมีความกว้างน้อยกว่าที่คาดไว้ ช่วงความมั่นใจที่ดีที่สุดในแง่นี้ (บางครั้งเรียกว่าสั้นที่สุด) จะเป็นช่วงที่จะเลือก แต่สิ่งนี้ต้องการความแน่นอน หากระดับความเชื่อมั่นเป็นเพียงค่าประมาณเราสามารถเปรียบเทียบแอปเปิ้ลและส้ม สิ่งหนึ่งอาจแคบกว่าอีกสิ่งหนึ่งเนื่องจากความแม่นยำน้อยกว่าดังนั้นจึงมีความครอบคลุมจริงน้อยกว่าความครอบคลุมที่โฆษณาไว้

หากช่วงความมั่นใจสองช่วงนั้นมีความแม่นยำมากหรืออีกช่วงหนึ่งที่ถูกต้องและอีกช่วงความแม่นยำที่ถูกต้องมาก ๆ อาจจะไม่เป็นไรเพราะอย่างน้อยตอนนี้เรากำลังดูแอปเปิ้ลสองสายพันธุ์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.