การตีความช่วงความมั่นใจ


16

หมายเหตุ: ขออภัยล่วงหน้าหากซ้ำกันฉันไม่พบคิวที่คล้ายกันในการค้นหาของฉัน

สมมติว่าเรามีพารามิเตอร์จริง p ช่วงความเชื่อมั่น C (X) เป็น RV ที่มี p พูด 95% ของเวลา ทีนี้สมมติว่าเราสังเกต X และคำนวณ C (X) คำตอบทั่วไปน่าจะเป็นว่ามันไม่ถูกต้องที่จะตีความว่ามี "95% โอกาสที่จะบรรจุ p" เพราะมัน "ไม่หรือไม่มี p"

อย่างไรก็ตามสมมติว่าฉันเลือกการ์ดจากด้านบนของสำรับสับและทิ้งมันลง ฉันคิดอย่างถี่ถ้วนว่าความน่าจะเป็นของการ์ดใบนี้จากการเป็นเอซโพดำในฐานะ 1/52 แม้ว่าในความเป็นจริง "มันอาจเป็นหรือไม่ใช่เอซโพดำ" เหตุใดฉันจึงไม่สามารถใช้เหตุผลนี้กับตัวอย่างของช่วงความมั่นใจได้

หรือถ้ามันไม่มีความหมายเลยที่จะพูดถึง "ความน่าจะเป็น" ของการ์ดที่เป็นเอซโพดำเพราะมัน "เป็นหรือไม่ใช่" ฉันจะยังคงวางอัตราต่อรอง 51: 1 ว่ามันไม่ใช่เอซโพดำ มีคำอื่นที่อธิบายข้อมูลนี้หรือไม่? แนวคิดนี้แตกต่างจาก "ความน่าจะเป็น" อย่างไร

แก้ไข: อาจจะมีความชัดเจนมากขึ้นจากการตีความความน่าจะเป็นแบบเบย์ถ้าฉันบอกว่าตัวแปรสุ่มมี p 95% ของเวลาเนื่องจากการรับรู้ของตัวแปรสุ่มนั้น (และไม่มีข้อมูลอื่นที่จะมีเงื่อนไข) ถูกต้องที่จะบอกว่าตัวแปรสุ่มมีความน่าจะเป็น 95% ของการมี p?

แก้ไข: จากการตีความความน่าจะเป็นของผู้ใช้บ่อย ๆ สมมติว่าผู้ลงนามยอมรับไม่พูดอะไรเช่น "มีความน่าจะเป็น 95% ที่ช่วงความเชื่อมั่นมี p" มันยังคงเป็นตรรกะหรือไม่สำหรับผู้ที่ใช้บ่อยครั้งที่จะมี "ความมั่นใจ" ที่ช่วงความมั่นใจมี p หรือไม่?

ให้อัลฟาเป็นระดับนัยสำคัญและให้ t = 100-alpha K (t) เป็น "ความมั่นใจ" ของผู้ใช้บ่อยที่ช่วงความมั่นใจมี p มันสมเหตุสมผลแล้วที่ K (t) ควรจะเพิ่มขึ้นใน t เมื่อ t = 100% ผู้ที่พบบ่อยควรมีความมั่นใจ (ตามคำนิยาม) ว่าช่วงความเชื่อมั่นมี p ดังนั้นเราจึงสามารถทำให้ปกติ K (1) = 1 ในทำนองเดียวกัน K (0) = 0 น่าจะเป็น K (0.95) 0 และ 1 และ K (0.999999) มากกว่า ผู้ที่ใช้บ่อยจะพิจารณา K แตกต่างจาก P อย่างไร (การแจกแจงความน่าจะเป็น)


1
พิจารณาเหรียญพลิกที่เหรียญม้วนอยู่ใต้โต๊ะและเราพิจารณาเหตุการณ์ที่เหรียญลงบนหัว ในภาพรวมก่อนหน้านี้ดูเหมือนว่าจะคล้ายกันมากกับปัญหา CI - ไม่ว่าจะเกิดเหตุการณ์ขึ้นหรือไม่ แต่ในกรณีพลิกเหรียญผู้ใช้บ่อย (อาจมากที่สุด) ดูเหมือนว่าจะมีความสุขอย่างสมบูรณ์แบบในการกำหนดความน่าจะเป็นที่คาดการณ์ (พูด ) ให้กับเหรียญที่ไม่ได้สังเกตเห็นได้ลงเอยบนหัวในขณะที่ถอยห่างออกไป พารามิเตอร์. สำหรับฉันดูเหมือนว่าจะมีความไม่สอดคล้องกัน p
Glen_b -Reinstate Monica

@Glen_b Frequentists ในไม่มีใครสังเกตลดลงสถานการณ์เหรียญใช้เหตุผล counterfactual ที่จะพูดไม่ได้ว่ามูลค่าที่แท้จริงของเหรียญคือ "สุ่ม" (แม้ว่ามันจะไม่มีใครสังเกต) แต่ที่เราอาจจะคุยผลสังเกตใด ๆ อื่น ๆผลที่อาจเกิดขึ้นในวันนี้ปรับตัวลดลง เหรียญและคำนวณความน่าจะเป็น เท่าที่ความน่าจะเป็นสำหรับมูลค่าที่แท้จริงของเหรียญมันอาจเป็นหรือไม่ได้เป็นหัวไม่มีความน่าจะเป็น จะถูกบันทึกไว้สำหรับการก่อสร้าง counterfactual การตั้งค่านี้ p
AdamO

@Glen_b: ฉันเห็นด้วยดูคำถามของฉันที่นี่: stats.stackexchange.com/questions/233588/…
vonjd

@ vonjd คำถามของคุณในระดับใดไม่เพียง แต่ซ้ำซ้อนในวรรคแรกหลังจากการเปิด "หมายเหตุ:" ที่นี่
Glen_b -Reinstate Monica

@Glen_b: ตามจริงแล้วฉันไม่ได้ตระหนักถึงคำถามนี้เมื่อฉันโพสต์ของฉันและพวกเขาทับซ้อนกันอย่างแน่นอน แต่ฉันคิดว่าพวกเขาจะไม่ซ้ำซ้อนเพราะโดยทั่วไปแล้วฉันมักเกี่ยวข้องกับการใช้ความน่าจะเป็นสำหรับผลลัพธ์ที่ซ่อนเร้น แต่ถ้าคุณคิดว่าฉันเป็นคนที่ซ้ำซ้อนอย่าลังเลที่จะปิดมัน
vonjd

คำตอบ:


8

ฉันคิดว่าบัญชีทั่วไปจำนวนมากในเรื่องนี้ไม่ชัดเจน

ช่วยบอกว่าคุณจะใช้ตัวอย่างขนาดและได้รับ95 %ช่วงความเชื่อมั่นสำหรับพี10095%p

แล้วคุณจะใช้ตัวอย่างของผู้อื่นเป็นอิสระจากครั้งแรกและได้รับอีก95 %ช่วงความเชื่อมั่นสำหรับพี10095%p

การเปลี่ยนแปลงอะไรคือช่วงความมั่นใจ สิ่งที่ไม่เปลี่ยนคือพีp นั่นหมายความว่าในวิธีการที่ใช้บ่อยคนหนึ่งบอกว่าช่วงความมั่นใจคือ "สุ่ม" แต่คือ "คงที่" หรือ "คงที่" นั่นคือไม่สุ่ม ในวิธีการที่ใช้บ่อยเช่นวิธีช่วงความเชื่อมั่นจะกำหนดความน่าจะเป็นให้กับสิ่งที่สุ่มเท่านั้นp

ดังนั้นและ( L , U )เป็นช่วงความมั่นใจ ( L = "Lower" และU = "Upper") นำตัวอย่างใหม่และการเปลี่ยนแปลงLและUแต่pไม่ได้Pr(L<p<U)=0.95(L,U)L=U=LUp

สมมติว่าในโดยเฉพาะอย่างยิ่งเช่นคุณมีและU = 43.61 ในวิธีการหนึ่งบ่อยครั้งจะไม่กำหนดความน่าจะเป็นให้กับคำสั่ง40.53 < p < 43.61นอกเหนือจากความน่าจะเป็นที่0หรือ1เนื่องจากไม่มีสิ่งใดที่นี่คือการสุ่ม: 40.53ไม่สุ่ม, pไม่สุ่ม (เนื่องจากจะไม่เปลี่ยนแปลงถ้า เราใช้ตัวอย่างใหม่) และ43.61ไม่สุ่มL=40.53U=43.6140.53<p<43.610140.53p43.61

ในทางปฏิบัติคนทำประพฤติราวกับว่าพวกเขากำลังแน่ใจว่าหน้าอยู่ระหว่าง40.53และ43.61 และเป็นเรื่องเชิงปฏิบัติที่มักจะทำให้รู้สึก แต่บางครั้งมันก็ไม่ได้ กรณีดังกล่าวหนึ่งกรณีหากทราบว่าหมายเลขที่มีขนาดใหญ่กว่า 40ขึ้นไปเป็นความไม่น่าจะเป็นไปได้ล่วงหน้าหรือเป็นที่รู้กันว่ามีความเป็นไปได้สูง ถ้าใครสามารถมอบหมายการแจกแจงความน่าจะเป็นก่อนให้กับpเราจะใช้ทฤษฎีบทของเบย์เพื่อให้ได้ช่วงเวลาที่น่าเชื่อถือซึ่งอาจแตกต่างจากช่วงความเชื่อมั่นเนื่องจากความรู้ก่อนหน้าของช่วงค่าของp95%p40.5343.6140ppเป็นไปได้หรือไม่น่าจะเป็นไปได้ นอกจากนี้ยังสามารถเกิดขึ้นได้จริงว่าข้อมูลที่ตัวเอง --- สิ่งที่เปลี่ยนแปลงถ้าตัวอย่างใหม่จะได้รับการสามารถบอกคุณได้ว่าไม่น่าจะเป็นหรือแม้กระทั่งบางอย่างไม่ได้ที่จะเป็นใหญ่เป็น40 ที่สามารถเกิดขึ้นได้แม้ในกรณีที่คู่( L , U )เป็นสถิติที่เพียงพอสำหรับพี ปรากฏการณ์ดังกล่าวสามารถแก้ไขได้ในบางกรณีโดยวิธีการฟิชเชอร์สของเงื่อนไขในสถิติเสริม ตัวอย่างของปรากฏการณ์ที่ผ่านมานี้คือเมื่อกลุ่มตัวอย่างประกอบด้วยเพียงสองข้อสังเกตอิสระที่มีการกระจายอย่างสม่ำเสมอในช่วงθ ± 1 / 2p40(L,U)pθ±1/2. จากนั้นช่วงเวลาจากการสังเกตสองครั้งที่น้อยกว่าไปยังช่วงที่ใหญ่กว่าคือช่วงความมั่นใจแต่ถ้าระยะห่างระหว่างพวกเขาเป็น0.001มันจะไร้สาระที่จะเป็นที่ใดก็ได้ที่อยู่ใกล้50 %หนึ่งพอสมควรเกือบจะ100 %แน่ใจθคือระหว่างพวกเขา ระยะห่างระหว่างพวกเขาจะเป็นสถิติเสริมที่หนึ่งจะมีเงื่อนไข50%0.00150%แน่ใจว่าอยู่ระหว่างพวกเขาและถ้าระยะทางคือ0.999θ0.999100%θ


ขอบคุณ Michael ที่มีเหตุผลมากมาย สมมติว่าในตัวอย่างของคุณว่าเรามีค่าเฉพาะ (L, U) แต่เราไม่ทราบค่านิยม สิ่งที่เรารู้คือมันเป็นความตระหนักถึงตัวแปรสุ่มช่วงความมั่นใจ 95% หากไม่มีพารามิเตอร์หรือข้อมูลอื่นใดมาก่อนจะเป็นไปได้หรือไม่ที่จะวางอัตราต่อรองที่ 19: 1 ที่ (L, U) มีพารามิเตอร์? หากผู้สมัครเป็นประจำยินดีที่จะทำเช่นนี้ แต่ไม่เรียกว่า "ความตั้งใจของเขาที่จะวางราคา 19: 1 ซึ่งมีพารามิเตอร์" a "ความน่าจะเป็น" เราจะเรียกมันว่าอะไร?
applicative_x

ใช่น่าจะเป็นที่เป็น0.95แน่นอนภายในวิธี frequentist หนึ่งสามารถพูดได้ว่าอยู่ในสถานะของความโง่เขลาของ( L , U )น่าจะเป็น0.95ว่าช่วงเวลาที่มีP แต่เมื่อมีค่าเฉพาะที่ไม่สุ่มผู้ใช้บ่อยจะไม่กำหนด probabliity นอกเหนือจาก0หรือ1ให้กับคำสั่งเนื่องจากค่าที่ทราบของLและUไม่สุ่ม0.95(L,U)0.95p01LU
Michael Hardy

4

นิยามหนังสือเรียนขนาดช่วงความมั่นใจ ( 1 - α ) % คือ:100×(1α)

ช่วงเวลาซึ่งภายใต้การจำลองแบบอิสระหลายครั้งของการศึกษาภายใต้สภาวะที่เหมาะจับภาพการวัดผลที่จำลองแบบได้ % ของเวลา100×(1α)

ความน่าจะเป็นสำหรับผู้ใช้บ่อยมาจากแนวคิดของ "เวลากรอกลับและพื้นที่" เพื่อทำซ้ำการค้นพบราวกับว่ามีสำเนาของโลกจำนวนนับไม่ถ้วนถูกสร้างขึ้นเพื่อประเมินการค้นพบทางวิทยาศาสตร์ครั้งแล้วครั้งเล่า ความน่าจะเป็นคือความถี่แน่นอน สำหรับนักวิทยาศาสตร์นี่เป็นวิธีที่สะดวกมากในการอภิปรายผลการวิจัยเนื่องจากหลักการแรกของวิทยาศาสตร์คือการศึกษาจะต้องทำซ้ำได้

ในตัวอย่างการ์ดของคุณความสับสนสำหรับ Bayesians และ Frequentists คือผู้ที่ไม่ได้กำหนดความน่าจะเป็นให้กับมูลค่าของการ์ดที่คุณได้พลิกจากสำรับในขณะที่ Bayesian จะ ผู้ประจำจะกำหนดความน่าจะเป็นให้กับไพ่โดยพลิกจากด้านบนของไพ่ที่สับแบบสุ่ม Bayesian ไม่ได้กังวลกับการทำซ้ำการศึกษาเมื่อการ์ดถูกพลิกตอนนี้คุณมีความเชื่อ 100% เกี่ยวกับสิ่งที่เป็นบัตรและ 0% เชื่อว่ามันสามารถใช้ค่าอื่น ๆ สำหรับ Bayesians ความน่าจะเป็นเป็นตัวชี้วัดความเชื่อ

โปรดทราบว่า Bayesians ไม่มีช่วงความมั่นใจด้วยเหตุนี้พวกเขาจึงสรุปความไม่แน่นอนด้วยช่วงความน่าเชื่อถือ


ขอบคุณสำหรับคำตอบ ในตัวอย่างการ์ดทั้งสองแบบเบย์และผู้ใช้บ่อยเห็นด้วยว่า 51: 1 เป็นอัตราต่อรองที่ยุติธรรมว่าการ์ดคือเอซโพดำ ในทำนองเดียวกันสำหรับการรับรู้ช่วงความมั่นใจ 95% (และไม่มีข้อมูลอื่น) ทั้งคู่จะไม่วางอัตราต่อรองที่ 19: 1 ซึ่งมีพารามิเตอร์จริงหรือไม่ ในแง่นั้น Bayesian สามารถตีความช่วงความมั่นใจ 95% ว่ามีโอกาส 95% ที่มีพารามิเตอร์จริงหรือไม่?
applicative_x

@applicative_x แล้วดาดฟ้า pinochle ล่ะ? คุณกำลังพิจารณาการใช้ข้อมูลก่อนหน้า frequentist อาจจะเป็นเพียงสมมติฐานว่าน่าจะเป็นและใช้เฉพาะใบหน้าของการ์ด valueto แจ้งว่าการทดลองนี้มีความสอดคล้องหรือไม่สอดคล้องกับสมมติฐานที่ว่า ความถูกต้องของการประมาณช่วงเวลาใด ๆ (ความน่าเชื่อถือหรือความเชื่อมั่น) ขึ้นอยู่กับสมมติฐานที่พิสูจน์ไม่ได้ ไม่มีสิ่งใดที่เป็นพารามิเตอร์ที่แท้จริงนี่เป็นวิธีที่อันตรายในการคิดเกี่ยวกับวิทยาศาสตร์ Bayesians ไม่เล่นด้วยช่วงความมั่นใจตามคำจำกัดความก่อนหน้านี้ อ่านคำตอบใหม่ p=1/52
AdamO

ขอบคุณอดัมฉันคิดว่าฉันยังสับสนอยู่ สมมติว่าฉันรู้ (โดยดูที่ไพ่) ว่าสำรับไพ่ 52 ใบเป็นมาตรฐาน ฉันสับไพ่และหยิบไพ่ 10 อันดับแรกโดยไม่มองดู ฉันไม่สามารถกำหนด "พารามิเตอร์ที่แท้จริง" ในกรณีนี้ให้เป็นจำนวนใบแดงได้หรือไม่ จากนั้นไม่คำนึงถึง Bayesian กับผู้ใช้บ่อยมี "พารามิเตอร์จริง" หากฉันได้รับอนุญาตให้หยิบไพ่ 7 ใบโดยการสุ่มฉันก็สามารถจินตนาการได้ว่าการสร้างช่วงความมั่นใจสำหรับ #of ใบแดงของฉันออกมาจาก 10 ใบของฉัน
applicative_x

1
Bayesian ไม่จำเป็นต้องเชื่อว่าไม่มีสิ่งเช่นค่าที่แท้จริงของพารามิเตอร์ Bayesianism หมายถึงการกำหนดความน่าจะเป็นให้กับข้อความที่ไม่แน่นอนไม่ว่าจะเป็นแบบสุ่มหรือไม่ คชกรรมสามารถกำหนดความน่าจะเป็นคำสั่งที่ว่ามีสิ่งมีชีวิตบนดาวอังคารพันล้านปีก่อน ผู้ใช้บ่อยไม่สามารถทำเช่นนั้นได้เนื่องจากไม่สามารถพูดได้ว่าเกิดขึ้นในครึ่งหนึ่งของทุกกรณี ไม่มีสิ่งใดที่บอกว่าชาว Bayesian ไม่เชื่อว่าจะมีคำตอบที่แท้จริงสำหรับคำถามที่ว่ามีสิ่งมีชีวิตบนดาวอังคารหรือไม่ ดูคำตอบที่โพสต์ในคำถามของคุณด้วย 1/2
Michael Hardy

1
@ Adamo: ฉันพบความคิดเห็นของคุณเป็นความลับ 'สิ่งที่ยูทิลิตี้คือความคิดของ "ความจริง" คือการเปลี่ยนแปลงของเรื่อง "เราคิดว่าความจริงไม่อาจเปลี่ยนแปลงได้" ดังนั้น "เรา" หมายถึงคุณและคนอื่น ๆ และสิ่งที่เกี่ยวข้องกับสิ่งที่พวกเขาคิดคืออะไร? "ไม่มีนักวิทยาศาสตร์คนไหนที่จะรวบรวมข้อมูลเพื่อยืนยันสิ่งที่รู้แล้ว" ดูเหมือนว่าจะมีการเปลี่ยนแปลงหัวเรื่องอีกครั้ง จากนั้นก็ติดตามความคิดเห็นเกี่ยวกับผู้ใช้บ่อยและชาวเบย์ ฉันไม่รู้สึกอยากเดาสิ่งที่คุณพยายามจะพูด
Michael Hardy
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.