ช่วงความเชื่อมั่นสำหรับความแปรปรวนที่กำหนดหนึ่งการสังเกต


25

นี่เป็นปัญหาจาก "7th Kolmogorov Student Olympiad in The Probability Theory Theory":

เมื่อทำการสังเกตจาก aโดยไม่ทราบพารามิเตอร์ทั้งสองให้ช่วงความมั่นใจสำหรับด้วยระดับความมั่นใจอย่างน้อย 99%XNormal(μ,σ2)σ2

สำหรับฉันแล้วมันน่าจะเป็นไปไม่ได้ ฉันมีวิธีแก้ปัญหา แต่ยังไม่ได้อ่าน ความคิดใด ๆ

ฉันจะโพสต์โซลูชันในอีกสองสามวัน

[การแก้ไขการติดตาม: การแก้ปัญหาอย่างเป็นทางการที่โพสต์ด้านล่าง วิธีแก้ปัญหาของ Cardinal นั้นยาวกว่า แต่ให้ช่วงความมั่นใจที่ดีกว่า ขอบคุณ Max และ Glen_b สำหรับอินพุตของพวกเขา]


1
ดูเหมือนว่าเป็นไปไม่ได้สำหรับฉันเช่นกัน ฉันรอคำตอบ
Peter Flom - Reinstate Monica


3
นี่คือกระดาษที่มีการจัดรูปแบบที่ดีกว่า: กระดาษ
สันนิษฐานว่าเป็นปกติ

หึ ฉันจำได้ว่าอ่านกระดาษเกี่ยวกับสิ่งนี้ (หนึ่งช่วงเวลาสังเกต) หลายปีหลัง อาจจะได้รับนี้อย่างใดอย่างหนึ่ง
Glen_b

1
@ Max ขอบคุณสำหรับลิงค์! ฉันยังไม่ได้มีเวลาดูอย่างใกล้ชิด แต่ฉันจะ ฉันโพสต์คำตอบ "อย่างเป็นทางการ" ด้านล่าง
Jonathan Christensen

คำตอบ:


17

เมื่อดูผ่านเลนส์ที่มีความไม่เท่าเทียมกันน่าจะเป็นและการเชื่อมต่อกับหลายกรณีสังเกตผลลัพธ์นี้อาจดูเหมือนเป็นไปไม่ได้หรืออย่างน้อยก็น่าจะเป็นไปได้มากขึ้น

ปล่อยด้วยและไม่ทราบ เราสามารถเขียนสำหรับ(0,1)XN(μ,σ2)μσ2X=σZ+μZN(0,1)

เรียกร้องหลัก :เป็นช่วงความเชื่อมั่นที่เป็นระดับพื้นดิน quantile ของการกระจายไคสแควร์กับหนึ่งระดับของ เสรีภาพ นอกจากนี้เนื่องจากช่วงนี้มีว่าความคุ้มครองเมื่อมันเป็นช่วงเวลาที่เป็นไปได้ที่แคบที่สุดของแบบฟอร์มสำหรับบางR[0,X2/qα)(1α)σ2qαα (1α)μ=0[0,bX2)bR

เหตุผลในการมองในแง่ดี

จำได้ว่าในกรณีด้วยที่ทั่วไปช่วงความเชื่อมั่นเป็น ที่เป็นquantile ระดับพื้นดินของไคสแควร์กับองศาอิสระ นี้แน่นอนถือสำหรับการใด ๆ\แม้ว่านี่จะเป็นช่วงเวลาที่ได้รับความนิยมมากที่สุด (เรียกว่าช่วงเวลาเท่ากันเพื่อเหตุผลที่ชัดเจน) แต่ก็ไม่ใช่เพียงความกว้างที่เล็กที่สุด! ตามที่ควรจะเห็นได้ชัดการเลือกที่ถูกต้องอื่นคือ n2T=i=1n(XiX¯)2 (1α)σ2

(Tqn1,(1α)/2,Tqn1,α/2),
qk,aakμ
(0,Tqn1,α).

ตั้งแต่จากนั้น นอกจากนี้ยังมีความคุ้มครองอย่างน้อยalpha)Ti=1nXi2

(0,i=1nXi2qn1,α),
(1α)

ดูในแง่นี้เรานั้นอาจจะเป็นในแง่ดีว่าช่วงเวลาในการเรียกร้องหลักที่เป็นจริงสำหรับ1 ความแตกต่างที่สำคัญคือไม่มีการแจกแจงแบบไคสแควร์แบบไม่มีศูนย์สำหรับกรณีของการสังเกตการณ์เดี่ยวดังนั้นเราต้องหวังว่าการใช้ควอไทล์แบบหนึ่งองศาอิสระจะทำงานได้n=1

ขั้นตอนครึ่งไปยังปลายทางของเรา ( Exploiting หางขวา )

ก่อนที่จะดำน้ำเพื่อพิสูจน์ข้อเรียกร้องหลักก่อนอื่นมาดูการอ้างสิทธิ์เบื้องต้นที่เกือบจะไม่แข็งแกร่งหรือน่าพอใจทางสถิติ แต่อาจให้ข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับสิ่งที่เกิดขึ้น คุณสามารถข้ามไปที่หลักฐานการอ้างสิทธิ์หลักด้านล่างโดยไม่มีการสูญเสีย (ถ้ามี) ในส่วนนี้และบทต่อไปบทพิสูจน์ - ในขณะที่บอบบางเล็กน้อย - ขึ้นอยู่กับข้อเท็จจริงเบื้องต้นเท่านั้น: ความน่าจะเป็นแบบโมโนโพนิคของสมมาตรและสมมาตรและไม่แปรเปลี่ยนของการแจกแจงแบบปกติ

เสริมการเรียกร้อง :เป็นช่วงความเชื่อมั่นตราบใดที่1/2 ที่นี่คือ level quantile ของมาตรฐานปกติ[0,X2/zα2)(1α)σ2α>1/2zαα

พิสูจน์ และโดยความสมมาตรดังนั้นในสิ่งต่อไปนี้เราสามารถรับโดยไม่สูญเสียความสามารถ ตอนนี้สำหรับและ , และด้วยเราเห็นว่า นี้จะทำงานเฉพาะสำหรับเนื่องจากว่าเป็นสิ่งที่จำเป็นสำหรับ0|X|=|X||σZ+μ|=d|σZ+μ|μ0θ0μ0

P(|X|>θ)P(X>θ)=P(σZ+μ>θ)P(Z>θ/σ),
θ=zασ
P(0σ2<X2/zα2)1α.
α>1/2zα>0

สิ่งนี้พิสูจน์ข้อเรียกร้องเสริม ในขณะที่เป็นตัวอย่างมันไม่ได้แยกแยะจากมุมมองเชิงสถิติเนื่องจากมันต้องการขนาดใหญ่ที่ไร้เหตุผลในการทำงานα

การพิสูจน์การอ้างสิทธิ์หลัก

การปรับแต่งของอาร์กิวเมนต์ข้างต้นนำไปสู่ผลลัพธ์ที่จะทำงานในระดับความเชื่อมั่นโดยพลการ ก่อนอื่นให้สังเกตว่า ตั้งและ0 จากนั้น หากเราสามารถแสดงให้เห็นว่าด้านขวามือเพิ่มขึ้นในสำหรับทุก ๆ ค่าคงที่ดังนั้นเราสามารถใช้อาร์กิวเมนต์ที่คล้ายกันเช่นเดียวกับในอาร์กิวเมนต์ก่อนหน้า อย่างน้อยน่าจะเป็นไปได้เพราะเราอยากจะเชื่อว่าถ้าค่าเฉลี่ยเพิ่มขึ้นก็จะเป็นไปได้มากขึ้นที่เราจะเห็นค่าที่มีโมดูลัสที่เกิน

P(|X|>θ)=P(|Z+μ/σ|>θ/σ).
a=μ/σ0b=θ/σ0
P(|Z+a|>b)=Φ(ab)+Φ(ab).
abb. (อย่างไรก็ตามเราต้องระวังว่ามวลจะลดลงเร็วแค่ไหนที่หางซ้าย!)

ชุด(-ab) จากนั้น โปรดทราบว่าและบวก ,จะลดลงในยูตอนนี้สำหรับมันเป็นเรื่องง่ายที่จะเห็นว่า(ข) ข้อเท็จจริงเหล่านี้นำมารวมกันได้อย่างง่ายดายบ่งบอกว่า สำหรับและคงที่fb(a)=Φ(ab)+Φ(ab)

fb(a)=φ(ab)φ(ab)=φ(ab)φ(a+b).
fb(0)=0uφ(u)ua(0,2b)φ(ab)φ(b)=φ(b)
fb(a)0
a0b0

ดังนั้นเราได้แสดงให้เห็นว่าสำหรับและ , a0b0

P(|Z+a|>b)P(|Z|>b)=2Φ(b).

แก้ทั้งหมดนี้ถ้าเรารับเราจะได้ ซึ่งสร้างการอ้างสิทธิ์หลักθ=qασ

P(X2>qασ2)P(Z2>qα)=1α,

หมายเหตุการปิด : การอ่านอย่างถี่ถ้วนของอาร์กิวเมนต์ข้างต้นแสดงให้เห็นว่ามันใช้เฉพาะคุณสมบัติสมมาตรและ unimodal ของการแจกแจงแบบปกติ ดังนั้นวิธีการทำงานแบบอะนาล็อกเพื่อรับช่วงความเชื่อมั่นจากการสังเกตเพียงครั้งเดียวจากตระกูลระดับตำแหน่งแบบ unimodal ใด ๆ เช่นการแจกแจง Cauchy หรือ Laplace


ว้าว! และนักเรียนคาดว่าจะเกิดข้อโต้แย้งประเภทนี้ขึ้นในช่วงเวลาสั้น ๆ ของการสอบโอลิมปิก?
Dilip Sarwate

1
@Dilip: ฉันไม่มีความคิด! ฉันไม่คุ้นเคยกับรูปแบบของโอลิมปิกนี้หรือสิ่งที่คาดหวังในแง่ของการแก้ปัญหา จากการอ่านหนังสือฉันคิดว่าคำตอบของ Scortchi นั้นเป็นที่ยอมรับ ฉันสนใจที่จะลองคิดดูว่าคน ๆ นั้นจะได้รับวิธีการแก้ปัญหาแบบ "ไม่ไร้สาระ" ได้อีก การสำรวจของฉันเอง (ค่อนข้างน้อย) เป็นไปตามแนวทางความคิดเดียวกับที่อธิบายไว้ในคำตอบ มันค่อนข้างเป็นไปได้ที่จะมีทางออกที่ดีกว่า :-)
พระคาร์ดินัล

นี่ยาวกว่าวิธีแก้ปัญหาอย่างเป็นทางการ แต่ให้ความแตกต่างได้ดีกว่าดังนั้นฉันจึงทำเครื่องหมายว่าเป็นคำตอบที่ "ถูกต้อง" ฉันโพสต์คำตอบ "อย่างเป็นทางการ" ด้านล่างรวมถึงผลการจำลองและการอภิปรายบางส่วน ขอบคุณ @cardinal!
Jonathan Christensen

2
@ Jonathan: ขอบคุณ ใช่ฉันสามารถพิสูจน์หลักฐานได้อีกเล็กน้อย เนื่องจากภูมิหลังที่หลากหลายของผู้เข้าร่วมที่นี่ฉันมักจะหลงระเริงในรายละเอียดเพิ่มเติม (หรือบางทีอาจมากเกินไป) :-)
สำคัญ

12

ถึงเวลาติดตาม! นี่คือทางออกที่ฉันได้รับ:

เราจะสร้างช่วงความมั่นใจของแบบฟอร์มโดยที่เป็นสถิติ ตามคำนิยามนี่จะเป็นช่วงความมั่นใจที่มีระดับความมั่นใจอย่างน้อย 99% ถ้า เราทราบว่ามีความหนาแน่นของการกระจายไม่เกินปี่} ดังนั้นทุก0 มันตามมาว่า เสียบใน[0,T(X))T()

(μR)(σ>0)Pμ,σ2(σ2>T(X))<0.01.
N(μ,σ2)1/σ2πP(|X|a)a/σa0
tP(|X|/σt)=P(X2t2σ2)=P(σ2X2/t2).
t=0.01เราได้รับสถิติที่เหมาะสมคือT(X)=10000X2.

ช่วงความเชื่อมั่น (ซึ่งกว้างมาก) นั้นค่อนข้างอนุรักษ์นิยมในการจำลองเล็กน้อยโดยไม่มีการรายงานเชิงประจักษ์ (ในการจำลอง 100,000 ครั้ง) ต่ำกว่า 99.15% เนื่องจากฉันเปลี่ยนแปลง CV ในหลาย ๆ ขนาด

สำหรับการเปรียบเทียบฉันยังจำลองช่วงความเชื่อมั่นของพระคาร์ดินัล ฉันควรทราบว่าช่วงเวลาที่สำคัญของพระคาร์ดินัลค่อนข้างแคบลง - ในกรณี 99% ของเขาจบลงด้วยความสูงถึงเมื่อเทียบกับในโซลูชันที่ให้ไว้ การคุ้มครองจากการประจักษ์นั้นอยู่ในระดับที่ถูกต้องอีกทั้งยังมีคำสั่งมากมายสำหรับ CV ดังนั้นช่วงเวลาของเขาจึงชนะแน่นอน6300X210000X2

ฉันไม่ได้มีเวลาดูอย่างระมัดระวังที่กระดาษ Max โพสต์ แต่ฉันวางแผนที่จะดูและอาจเพิ่มความคิดเห็นเกี่ยวกับมันในภายหลัง (กล่าวคือไม่ช้ากว่าหนึ่งสัปดาห์) กระดาษนั้นอ้างว่าช่วงความเชื่อมั่น 99% ของซึ่งมีความคุ้มครองเชิงประจักษ์ลดลงเล็กน้อย (ประมาณ 98.85%) กว่าความครอบคลุมเล็กน้อยสำหรับ CVs ขนาดใหญ่ในการจำลองสั้น ๆ ของฉัน(0,4900X2)


1
(+1) นั่นเป็นทางออกที่ดี คุณควรมีแทนที่จะเป็นในสมการการแสดงผลหรือไม่? tt
พระคาร์ดินัล

2
อีกสองสามคะแนน: วิธีแก้ปัญหาของคุณนั้นใกล้เคียงกับฉันมากโดยไม่มีการเปลี่ยนแปลงในการโต้แย้ง โปรดทราบว่าคุณสามารถอ้างว่าปี่} จากนั้นช่วงเวลาที่จะกลายเป็นสำหรับการใด ๆ\การใช้อัตราผลตอบแทนเทียบกับในคำตอบของฉัน ยิ่งระดับความเชื่อมั่นที่สูงขึ้น (เช่นเล็กกว่า ) ยิ่งวิธีของคุณใกล้เคียงกับของคุณมากเท่าใด (แม้ว่าช่วงเวลาของคุณจะกว้างขึ้นเสมอ) P(|X|a)2a/σ2π(0,2X2/πα2)αα=0.01T(X)6366.198X21/q0.016365.864α
พระคาร์ดินัล

1
ประการที่สองฉันไม่ได้ดูที่กระดาษนั้น แต่ฉันมีข้อสงสัยอย่างมากว่าสามารถเป็นช่วงความมั่นใจ 99% ที่ถูกต้อง แท้จริงพิจารณาทุกช่วงความเชื่อมั่นของแบบฟอร์มสำหรับบางขจากนั้นเมื่อเรามีที่เป็นว่าไคสแควร์กับหนึ่งระดับของเสรีภาพและอื่น ๆ ที่มีขนาดเล็กเราสามารถเลือกในกรณีนี้คือ . กล่าวอีกนัยหนึ่งช่วงเวลาที่ให้ไว้ในคำตอบของฉันเป็นไปได้น้อยที่สุดของแบบฟอร์มที่ระบุ (0,4900X2)(0,bX2)bμ=0X2/σ2bb=1/qα
พระคาร์ดินัล

1
ฉันแก้ไขคำผิด (ที่สงสัย) นอกจากนี้pchisq(1/4900,1,lower.tail=F)ในRผลตอบแทนที่0.9886ค่อนข้างใกล้เคียงกับผลการจำลองของคุณสำหรับช่วงเวลา (0,4900X2)
พระคาร์ดินัล

1
ขอบคุณสำหรับความคิดเห็นทั้งหมด @cardinal ฉันคิดว่าการเปลี่ยนแปลงของคุณถูกต้องแม้ว่าฉันจะพิมพ์อย่างที่เป็นอยู่ในโซลูชันดั้งเดิม - พิมพ์ที่นั่นฉันเดา
Jonathan Christensen

5

CI'sน่าจะเป็น(0,)


1
ฉันคิดว่ามันจะมีประโยชน์สำหรับคุณที่จะบอกว่าทำไมคุณไม่สามารถรับช่วงความมั่นใจที่ จำกัด ได้
สันนิษฐานว่าเป็นปกติ

1
@ Max ฉันไม่ฉลาดพอ - แต่คำถามไม่ได้ถาม
Scortchi - Reinstate Monica

4
+1 สำหรับสิ่งนี้ คำถามไม่ได้บอกว่า CI ที่มีการครอบคลุมน้อยที่สุดและในความเป็นจริงก็หมายความว่าสิ่งนี้อาจเป็นที่ยอมรับผ่านถ้อยคำที่น่าสงสัย "ช่วงความเชื่อมั่นที่มีระดับความเชื่อมั่นอย่างน้อย 99%"
Ari B. Friedman
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.