Keith Winstein
แก้ไข: เพื่อชี้แจงคำตอบนี้อธิบายตัวอย่างที่ให้ไว้ใน Keith Winstein Answer on the King กับเกมสถิติโหดร้าย ชาวเบย์และผู้ตอบคำถามประจำใช้ทั้งข้อมูลที่เหมือนกันซึ่งเป็นการเพิกเฉยข้อมูลจำนวนเหรียญที่ยุติธรรมและไม่เป็นธรรมเมื่อสร้างช่วงเวลา หากข้อมูลนี้ไม่ได้ถูกละเว้นผู้ใช้ควรใช้โอกาสเบต้า - ทวินามแบบรวมเป็นตัวกระจายตัวอย่างในการสร้างช่วงความเชื่อมั่นซึ่งในกรณีนี้ช่วงความเชื่อมั่นแบบ Clopper-Pearson ไม่เหมาะสมและจำเป็นต้องแก้ไข การปรับที่คล้ายกันควรเกิดขึ้นในโซลูชัน Bayesian
แก้ไข: ฉันยังชี้แจงการใช้งานครั้งแรกของ Clopper Pearson Interval
แก้ไข: อนิจจาอัลฟาของฉันเป็นวิธีที่ผิดรอบและช่วงเวลาที่ลูกแพร์ของฉันเสื้อคลุมไม่ถูกต้อง คำขอโทษที่อ่อนน้อมถ่อมตนของฉันต่อ @whuber ผู้ซึ่งชี้ให้เห็นอย่างถูกต้อง แต่ในขั้นต้นฉันไม่เห็นด้วยและไม่สนใจ
CI ใช้วิธี Clopper Pearson เป็นวิธีที่ดีมาก
หากคุณได้รับการสังเกตเพียงครั้งเดียวก็สามารถประเมินค่า Clopper Pearson Interval ได้ สมมติว่าเหรียญขึ้นมาเป็น "ความสำเร็จ" (หัว) คุณต้องเลือกเช่นนั้นθ
[ พีr ( B i ( 1 , θ ) ≥ X) ≥ อัลฟ่า2] ∩ [ Pr ( B i ( 1 , θ ) ≤ X) ≥ อัลฟ่า2]
เมื่อน่าจะเป็นเหล่านี้เป็นพีอาร์( B ฉัน( 1 , θ ) ≥ 1 ) = θและP R ( B ฉัน( 1 , θ ) ≤ 1 ) = 1ดังนั้น Clopper เพียร์สัน CI หมายความว่าθ ≥ อัลฟ่าX= 1Pr(Bi(1,θ)≥1)=θPr(Bi(1,θ)≤1)=1 (นิด ๆ และเป็นจริงเสมอ1≥อัลฟ่าθ≥α2 ) เมื่อX=1 เมื่อX=0ความน่าจะเป็นเหล่านี้คือPr(Bi(1,θ)≥0)=1และPr(Bi(1,θ)≤0)=1-θดังนั้น Clopper Pearson CI จึงมีความหมายว่า1-θ≥อัลฟ่า1≥α2X=1X=0Pr(Bi(1,θ)≥0)=1Pr(Bi(1,θ)≤0)=1−θหรือθ≤1-α1 - θ ≥ อัลฟ่า2เมื่อX=0 ดังนั้นสำหรับ 95% CI เราได้รับ[0.025,1]เมื่อX=1และ[0,0.975]เมื่อX=0θ ≤ 1 - α2X= 0[ 0.025 , 1 ]X= 1[ 0 , 0.975 ]X= 0
ดังนั้นผู้ที่ใช้ Clopper Pearson Confidence Interval จะไม่ถูกตัดหัวเลย เมื่อสังเกตช่วงเวลามันเป็นพื้นที่พารามิเตอร์ทั้งหมด แต่ช่วงเวลา CP ทำเช่นนี้โดยให้ความคุ้มครอง 100% กับช่วงเวลา 95% ที่คาดคะเน! โดยพื้นฐานแล้วผู้ที่ใช้บ่อย ๆ "กลโกง" โดยให้ช่วงความมั่นใจ 95% ครอบคลุมมากกว่าที่เขา / เธอถูกขอให้ให้ (แม้ว่าใครจะไม่โกงในสถานการณ์เช่นนี้หรือไม่ถ้าเป็นฉันฉันจะให้ทั้งหมด [0, 1] ช่วงเวลา) หากพระราชาถามหา95% CI ที่แน่นอนวิธีการนี้บ่อยครั้งจะล้มเหลวโดยไม่คำนึงถึงสิ่งที่เกิดขึ้นจริง (อาจเป็นวิธีที่ดีกว่าอยู่แล้ว)
สิ่งที่เกี่ยวกับช่วงเวลาที่เบย์ (โดยเฉพาะช่วงหลังสุด (HPD) Bayesian ช่วง)
เนื่องจากเรารู้ว่านิรนัยที่ทั้งหัวและก้อยสามารถเกิดขึ้นได้ชุดก่อนจึงเป็นตัวเลือกที่สมเหตุสมผล นี้จะช่วยให้การกระจายหลังของ ) ตอนนี้สิ่งที่เราต้องทำตอนนี้คือการสร้างช่วงเวลาที่มีความน่าจะเป็นหลัง 95% คล้ายกับ clopper เพียร์สัน CI, การกระจายเบต้า Cummulative คือการวิเคราะห์ที่นี่ยังเพื่อให้พีอาร์( θ ≥ θ อี | x = 1 ) = 1 -( θ | X) ∼ B e t a ( 1 + X, 2 - X)และ P R ( θ ≤ θ อี | x = 0 ) = 1 - ( 1 - θ E ) 2การตั้งค่าเหล่านี้เพื่อให้ 0.95 θ E = √PR ( θ ≥ θอี| x=1)=1-( θอี)2PR ( θ ≤ θอี| x=0)=1-(1- θอี)2เมื่อX=1และθ E =1- √θอี= 0.05----√≈ 0.224X= 1เมื่อX=0 ดังนั้นสองช่วงเวลาที่น่าเชื่อถือคือ(0,0.776)เมื่อX=0และ(0.224,1)เมื่อX=1θอี= 1 - 0.05----√≈ 0.776X= 0( 0 , 0.776 )X= 0( 0.224 , 1 )X= 1
ดังนั้น Bayesian จะถูกตัดหัวสำหรับช่วง HPD ที่น่าเชื่อถือของเขาในกรณีที่เขาได้รับเหรียญที่ไม่ดีและเหรียญที่ไม่ดีจะเกิดขึ้นซึ่งจะเกิดขึ้นเมื่อมีโอกาส011012+ 1× 110≈ 0
การสังเกตครั้งแรกช่วง Bayesian นั้นเล็กกว่าช่วงความมั่นใจ อีกสิ่งหนึ่งคือ Bayesian จะใกล้เคียงกับความครอบคลุมจริงตามที่ระบุไว้ 95% มากกว่าผู้ใช้บ่อย ในความเป็นจริง Bayesian นั้นใกล้เคียงกับความคุ้มครอง 95% มากพอ ๆ กับที่จะได้รับจากปัญหานี้ และตรงกันข้ามกับคำแถลงของ Keith หากเลือกเหรียญที่ไม่ดี 10 Bayesians จาก 100 โดยเฉลี่ยจะสูญเสียหัวของพวกเขา (ไม่ใช่ทั้งหมดเพราะเหรียญที่ไม่ดีจะต้องขึ้นหัวในช่วงเวลาที่ไม่มี ) 0.1
ที่น่าสนใจถ้าใช้ CP-interval สำหรับการสังเกต 1 ครั้งซ้ำ ๆ (ดังนั้นเราจึงมี N ช่วงเวลาดังกล่าวตามการสังเกต 1 ครั้ง) และสัดส่วนที่แท้จริงคืออะไรระหว่างถึง0.975ดังนั้นการครอบคลุม 95% CI จะเป็น 100 เสมอ % และไม่ใช่ 95%! ชัดเจนขึ้นอยู่กับมูลค่าที่แท้จริงของพารามิเตอร์! ดังนั้นนี่คืออย่างน้อยหนึ่งกรณีที่การใช้ช่วงความเชื่อมั่นซ้ำ ๆ ไม่ได้นำไปสู่ระดับความมั่นใจที่ต้องการ0.0250.975
การพูดของแท้ช่วงความเชื่อมั่น 95% แล้วโดยมีความหมายว่าควรจะมีบางกรณี (เช่นอย่างน้อยหนึ่ง) ของช่วงสังเกตซึ่งไม่ได้มีมูลค่าที่แท้จริงของพารามิเตอร์ มิฉะนั้นจะปรับแท็ก 95% ให้เหมาะสมได้อย่างไร มันจะไม่ถูกต้องหรือไม่ถูกต้องที่จะเรียกมันว่าช่วง 90%, 50%, 20% หรือแม้กระทั่ง 0%?
ฉันไม่เห็นว่าการระบุเพียง "จริง ๆ แล้วหมายถึง 95% หรือมากกว่า" โดยไม่มีข้อ จำกัด ฟรีเป็นที่น่าพอใจ นี่เป็นเพราะวิธีการแก้ปัญหาทางคณิตศาสตร์ที่เห็นได้ชัดคือพื้นที่พารามิเตอร์ทั้งหมดและปัญหาเล็กน้อย สมมติว่าฉันต้องการ CI 50%? ถ้ามัน จำกัด ขอบเขตเชิงลบเท็จเท่านั้นพื้นที่พารามิเตอร์ทั้งหมดคือ CI ที่ถูกต้องโดยใช้เกณฑ์นี้เท่านั้น
บางทีเกณฑ์ที่ดีกว่าคือ (และนี่คือสิ่งที่ฉันเชื่อว่าเป็นนัยในคำจำกัดความของ Kieth) "ใกล้ถึง 95% ที่สุดเท่าที่จะเป็นไปได้โดยไม่ต่ำกว่า 95%" The Bayesian Interval จะมีความคุ้มครองใกล้เคียงกับ 95% มากกว่าผู้ใช้บ่อย (แม้ว่าจะไม่มากนัก) และจะไม่อยู่ภายใต้การคุ้มครอง 95% (ความคุ้มครองเมื่อX = 0 , และ100 × 10 12 + 9100%X= 0ความคุ้มครองเมื่อX=1)100 × 1012+ 9101012+ 1% > 95%X= 1
ในการปิด, มันดูค่อนข้างแปลกที่จะถามหาช่วงเวลาของความไม่แน่นอน, แล้วประเมินช่วงเวลานั้นโดยการใช้ค่าจริงที่เราไม่แน่ใจ การเปรียบเทียบ "ธรรม" สำหรับทั้งความเชื่อมั่นและช่วงเวลาที่มีความน่าเชื่อถือให้ฉันดูเหมือนว่าความจริงของคำสั่งของความไม่แน่นอนที่ได้รับกับช่วงเวลา