ชี้แจงเกี่ยวกับการตีความช่วงความเชื่อมั่นหรือไม่


47

ความเข้าใจปัจจุบันของฉันเกี่ยวกับแนวคิด "ช่วงความเชื่อมั่นที่มีระดับความเชื่อมั่น " คือถ้าเราพยายามคำนวณช่วงความเชื่อมั่นหลายครั้ง (แต่ละครั้งที่มีตัวอย่างสด) มันจะมีพารามิเตอร์ที่ถูกต้องของ เวลา.1 - α1α1α

แม้ว่าฉันจะรู้ว่านี่ไม่เหมือนกับ "ความน่าจะเป็นที่พารามิเตอร์จริงอยู่ในช่วงเวลานี้" แต่มีบางอย่างที่ฉันต้องการชี้แจง

[การอัพเดทที่สำคัญ]

ก่อนที่เราจะคำนวณช่วงความมั่นใจ 95% มีความน่าจะเป็น 95% ที่ช่วงเวลาที่เราคำนวณจะครอบคลุมพารามิเตอร์จริง หลังจากที่เราคำนวณช่วงความเชื่อมั่นและได้รับช่วงเวลาเฉพาะเราจะไม่สามารถพูดสิ่งนี้ได้อีกต่อไป เราไม่สามารถสร้างข้อโต้แย้งที่ไม่ได้เกิดขึ้นบ่อยนักซึ่งเรามั่นใจได้ว่า 95% ของพารามิเตอร์ที่แท้จริงจะอยู่ใน ; เพราะถ้าเราทำได้มันจะขัดแย้งกับตัวอย่างโต้แย้งเช่นนี้: อะไรคือช่วงความมั่นใจ[ a , b ][a,b][a,b]

ฉันไม่ต้องการอภิปรายเรื่องปรัชญาของความน่าจะเป็น แต่ฉันกำลังมองหาคำอธิบายทางคณิตศาสตร์ที่แม่นยำว่าทำไมและทำไมถึงเห็นช่วงเวลาเฉพาะการเปลี่ยนแปลง (หรือไม่เปลี่ยน) ความน่าจะเป็น 95% ที่เรามีก่อนที่จะเห็นช่วงเวลานั้น หากคุณยืนยันว่า "หลังจากที่ได้เห็นช่วงเวลาที่ความคิดของความน่าจะไม่ทำให้รู้สึก" จากนั้นปรับให้ทำงานในการตีความของความน่าจะเป็นในการที่มันไม่เข้าท่า[a,b]

อย่างแม่นยำมากขึ้น:

สมมติว่าเราตั้งโปรแกรมคอมพิวเตอร์เพื่อคำนวณช่วงความมั่นใจ 95% คอมพิวเตอร์ทำการบดตัวเลขคำนวณช่วงเวลาและปฏิเสธที่จะแสดงช่วงเวลาให้ฉันจนกว่าฉันจะป้อนรหัสผ่าน ก่อนที่ฉันจะป้อนรหัสผ่านและดูช่วงเวลา (แต่หลังจากที่คอมพิวเตอร์คำนวณไปแล้ว) ความน่าจะเป็นที่ช่วงเวลานั้นจะมีพารามิเตอร์ที่แท้จริงคืออะไร มันเป็น 95% และส่วนนี้ไม่ได้ขึ้นอยู่กับการถกเถียง : นี่เป็นการตีความความน่าจะเป็นที่ฉันสนใจสำหรับคำถามนี้ (ฉันรู้ว่ามีประเด็นทางปรัชญาที่สำคัญที่ฉันระงับและนี่คือเจตนา)

แต่ทันทีที่ฉันพิมพ์รหัสผ่านและทำให้คอมพิวเตอร์แสดงช่วงเวลาที่คำนวณความน่าจะเป็น (ที่ช่วงเวลานั้นมีพารามิเตอร์จริง) อาจเปลี่ยนได้ การอ้างสิทธิ์ใด ๆ ที่ความน่าจะเป็นนี้ไม่เคยเปลี่ยนแปลงจะขัดแย้งกับตัวอย่างด้านบน ในตัวอย่างตัวอย่างนี้ความน่าจะเป็นอาจเปลี่ยนจาก 50% เป็น 100% แต่ ...

  • มีตัวอย่างใดบ้างที่ความน่าจะเป็นเปลี่ยนไปเป็นอย่างอื่นที่ไม่ใช่ 100% หรือ 0% (แก้ไข: และถ้าเป็นเช่นนั้นจะมีอะไรบ้าง)

  • มีตัวอย่างใดบ้างที่ความน่าจะเป็นไม่เปลี่ยนแปลงหลังจากเห็นช่วงเวลาเฉพาะ (เช่นความน่าจะเป็นที่พารามิเตอร์จริงอยู่ในยังคง 95%) หรือไม่[ a , b ][a,b][a,b]

  • ความน่าจะเป็นจะเปลี่ยนแปลงโดยทั่วไปอย่างไรและหลังจากที่เห็นคอมพิวเตอร์พ่นอย่างไร[a,b]

[แก้ไข]

ขอบคุณสำหรับคำตอบที่ดีและการอภิปรายที่เป็นประโยชน์!


1
นี่อาจเป็นประเด็นที่น่าสนใจ: en.wikipedia.org/wiki/Credible_interval
nico

ข้อสมมติของคุณที่ P (E | C) = 1 และ P (E | C ') = 0 นั้นไม่ยุติธรรม ทำไมคุณถึงกล่าวว่าหากช่วงเวลาจริงไม่ได้มีค่าพารามิเตอร์จริงหนึ่งหลังนี้แน่นอนนอกมัน?
glassy

ฉันไม่แน่ใจว่าสิ่งที่คุณหมายถึงโดย "ช่วงเวลาที่เกิดขึ้นจริง" หรือ "หลังหนึ่ง" คุณช่วยอธิบายได้ไหม?
เอลเลียต

@nico ขอบคุณสำหรับลิงค์ เจตนาของคำถามเดิมของฉันคือ "การโต้แย้งของฉันดูเหมือนจะแสดงให้เห็นว่าช่วงความมั่นใจสามารถตีความได้ว่าเป็นช่วงเวลาที่น่าเชื่อถือแบบเบย์ แต่นี่ไม่ใช่กรณีดังนั้นสิ่งที่ผิดกับเหตุผลของฉัน" แต่ฉันต้องยอมรับว่าฉันไม่พอใจกับความคิด "ความน่าจะเป็นที่ช่วงเวลานั้นมีพารามิเตอร์ [ไม่ทราบ] จริงคือ 0 หรือ 1" สำหรับฉันแล้วมันเหมือนกับการพูดว่า "ความน่าจะเป็นที่เหรียญหัวหล่นหลังจากฉันพลิกมัน แต่ก่อนที่ฉันจะดูมันจะเป็น 0 หรือ 1" ฉันไม่เห็นว่าทำไมมันถึงไม่ 1/2
เอลเลียต

@Elliot: แมวของSchrödingerนึกถึง :) ฉันไม่เชี่ยวชาญพอที่จะให้คำอธิบายที่เหมาะสม แต่ฉันชอบที่จะเห็นคำตอบของสิ่งนี้ PS: และอย่าลืมว่าเหรียญก็สามารถตกลงมาได้!
โก้

คำตอบ:


28

ฉันคิดว่าปัญหาพื้นฐานคือสถิติบ่อยสามารถกำหนดความน่าจะเป็นให้กับสิ่งที่สามารถมีความถี่ในระยะยาว ไม่ว่าค่าที่แท้จริงของพารามิเตอร์จะอยู่ในช่วงเวลาใดช่วงเวลาหนึ่งหรือไม่ไม่มีความถี่ในการทำงานนานเนื่องจากเราสามารถทำการทดลองได้เพียงครั้งเดียวดังนั้นคุณจึงไม่สามารถกำหนดความน่าจะเป็นประจำให้กับมันได้ ปัญหาเกิดขึ้นจากการนิยามความน่าจะเป็น หากคุณเปลี่ยนคำจำกัดความของความน่าจะเป็นแบบเบย์แล้วปัญหาจะหายไปทันทีเนื่องจากคุณไม่ได้เชื่อมโยงกับการอภิปรายเรื่องความถี่ในระยะยาวอีกต่อไป

ดูคำตอบของคำถามที่เกี่ยวข้องที่นี่ :

" นักบวชประจำคือคนที่เชื่อว่า probabilies เป็นตัวแทนของความถี่ในระยะยาวซึ่งเหตุการณ์เกิดขึ้นถ้าจำเป็นเขาจะประดิษฐ์ประชากรที่สมมติขึ้นซึ่งสถานการณ์เฉพาะของคุณอาจได้รับการพิจารณาเป็นตัวอย่างแบบสุ่มเพื่อให้เขาสามารถพูดคุยเกี่ยวกับความถี่ในระยะยาวได้ คุณถามคำถามเขาเกี่ยวกับสถานการณ์เฉพาะเขาจะไม่ให้คำตอบโดยตรง แต่ให้ออกแถลงการณ์เกี่ยวกับประชากร (อาจเป็นจินตภาพ) แทน "

ในกรณีของช่วงความมั่นใจคำถามที่เราต้องการถามปกติ (ยกเว้นกรณีที่เรามีปัญหาในการควบคุมคุณภาพ) คือ "ให้ข้อมูลตัวอย่างนี้คืนค่าช่วงเวลาที่เล็กที่สุดที่มีค่าจริงของพารามิเตอร์ที่มีความน่าจะเป็น X" อย่างไรก็ตามผู้ทำการทดสอบไม่สามารถทำได้เนื่องจากการทดลองนั้นทำเพียงครั้งเดียวดังนั้นจึงไม่มีความถี่ที่สามารถใช้ในการกำหนดความน่าจะเป็นได้ ดังนั้นผู้ที่ใช้บ่อยจะต้องคิดค้นประชากรของการทดลอง (ซึ่งคุณไม่ได้ทำ) ซึ่งการทดลองที่คุณทำนั้นถือเป็นตัวอย่างแบบสุ่ม จากนั้นผู้ให้คำตอบจะให้คำตอบโดยอ้อมเกี่ยวกับการทดลองที่สมมติขึ้นแทนที่จะตอบคำถามโดยตรงที่คุณต้องการถามเกี่ยวกับการทดลองหนึ่ง ๆ

โดยพื้นฐานแล้วมันเป็นปัญหาเกี่ยวกับภาษาคำจำกัดความที่บ่อยของประชากรไม่อนุญาตให้มีการอภิปรายถึงความน่าจะเป็นของมูลค่าที่แท้จริงของพารามิเตอร์ที่อยู่ในช่วงเวลาหนึ่ง นั่นไม่ได้หมายความว่าสถิติผู้ใช้บ่อยนั้นไม่ดีหรือไม่มีประโยชน์ แต่เป็นสิ่งสำคัญที่จะต้องทราบข้อ จำกัด

เกี่ยวกับการอัพเดทครั้งใหญ่

ฉันไม่แน่ใจว่าเราสามารถพูดได้ว่า "ก่อนที่เราจะคำนวณช่วงความมั่นใจ 95% มีความน่าจะเป็น 95% ที่ช่วงเวลาที่เราคำนวณจะครอบคลุมพารามิเตอร์จริง" ภายในกรอบบ่อยๆ มีการอนุมานโดยนัยที่นี่ว่าความถี่ระยะยาวซึ่งค่าที่แท้จริงของพารามิเตอร์อยู่ในช่วงความเชื่อมั่นที่สร้างโดยวิธีการเฉพาะบางอย่างก็คือความน่าจะเป็นที่ค่าที่แท้จริงของพารามิเตอร์จะอยู่ในช่วงความมั่นใจสำหรับตัวอย่างเฉพาะ ของข้อมูลที่เรากำลังจะใช้ นี่เป็นการอนุมานที่สมเหตุสมผลอย่างสมบูรณ์ แต่มันเป็นการอนุมานแบบเบย์ไม่ใช่ความบ่อยครั้งเนื่องจากความน่าจะเป็นที่ค่าที่แท้จริงของพารามิเตอร์อยู่ในช่วงความเชื่อมั่นที่เราสร้างขึ้นสำหรับตัวอย่างเฉพาะของข้อมูลที่ไม่มี freqency ในระยะยาว เรามีตัวอย่างข้อมูลเพียงตัวอย่างเดียวเท่านั้น

อย่างไรก็ตามเราสามารถ "ทำการโต้แย้งที่ไม่เกิดขึ้นบ่อยครั้งซึ่งเรามั่นใจว่า 95% ของพารามิเตอร์ที่แท้จริงจะอยู่ใน [a, b]" นั่นคือสิ่งที่ช่วงเวลาที่เชื่อถือได้ของ Bayesian และสำหรับปัญหามากมายที่ช่วงเวลาที่น่าเชื่อถือของ Bayesian ตรงกับช่วงความมั่นใจเป็นประจำ

"ฉันไม่ต้องการที่จะทำให้การอภิปรายเกี่ยวกับปรัชญาของความน่าจะเป็น" นี้น่าเศร้าที่หลีกเลี่ยงไม่ได้เหตุผลที่คุณไม่สามารถกำหนดความน่าจะเป็นประจำว่าค่าที่แท้จริงของสถิติอยู่ในช่วงความมั่นใจหรือไม่นั้นเป็นผลโดยตรง ของปรัชญาความน่าจะเป็นที่เกิดขึ้นบ่อยครั้ง ผู้ใช้บ่อยสามารถกำหนดความน่าจะเป็นให้กับสิ่งต่าง ๆ ที่มีความถี่ในระยะยาวได้ซึ่งเป็นวิธีที่ผู้ใช้บ่อยกำหนดความน่าจะเป็นในปรัชญาของพวกเขา นั่นไม่ได้ทำให้ปรัชญาบ่อยนักผิด แต่สิ่งสำคัญคือต้องเข้าใจขอบเขตที่กำหนดโดยคำจำกัดความของความน่าจะเป็น

"ก่อนที่ฉันจะป้อนรหัสผ่านและดูช่วงเวลา (แต่หลังจากที่คอมพิวเตอร์ได้คำนวณไปแล้ว) ความน่าจะเป็นที่ช่วงเวลานั้นจะมีพารามิเตอร์ที่แท้จริงคืออะไร 95% และส่วนนี้ไม่ได้สำหรับการอภิปราย:" นี่ ไม่ถูกต้องหรืออย่างน้อยคุณก็ออกจากกรอบการทำงานของสถิติบ่อยครั้งและได้ทำการอนุมานแบบเบย์ซึ่งเกี่ยวข้องกับระดับความน่าเชื่อถือในความจริงของข้อความแทนที่จะเป็นความถี่ในระยะยาว อย่างไรก็ตามอย่างที่บอกไปก่อนหน้านี้มันเป็นการอนุมานที่สมเหตุสมผลและเป็นธรรมชาติอย่างสมบูรณ์

ไม่มีอะไรเปลี่ยนแปลงก่อนหรือหลังการป้อนรหัสผ่านเนื่องจากเหตุการณ์ niether สามารถกำหนดความน่าจะเป็นได้บ่อยครั้ง สถิติของผู้ใช้บ่อยสามารถตอบโต้ได้ง่ายเนื่องจากเรามักต้องการถามคำถามเกี่ยวกับความน่าเชื่อถือของข้อความที่เกี่ยวข้องกับเหตุการณ์บางอย่าง แต่สิ่งนี้อยู่นอกความหมายของสถิติที่ใช้บ่อยและนี่คือจุดเริ่มต้นของการตีความขั้นตอนที่ใช้บ่อย


2
ใช่ว่าเป็นสิ่งที่ฉันกำลังทำอยู่คำพูดที่สองไม่ใช่คำแถลงเกี่ยวกับเหรียญนี้ มันเป็นคำแถลงเกี่ยวกับประชากรในจินตนาการของเหรียญที่คนส่วนใหญ่ใส่เข้าไปอย่างไม่ถูกต้องเป็นคำแถลงเกี่ยวกับเหรียญเฉพาะของเรา อย่างไรก็ตามในการก้าวกระโดดนั้นเราใช้สัญชาตญาณแบบเบย์เกี่ยวกับความน่าจะเป็นและไม่สนใจว่าช่วงความมั่นใจคืออะไร ไม่มีปัญหาในการกำหนดความน่าจะเป็นให้กับสถานะของเหรียญหากเราย้ายออกไปจากคำจำกัดความความน่าจะเป็นประจำ
Dikran Marsupial

2
เพื่ออธิบายให้ชัดเจนว่า "ลองจินตนาการถึงตัวอย่างที่แยกจากกันในช่วงต้นของเวลาคุณคาดหวังว่าประมาณครึ่งหนึ่งของผู้ที่จะสร้างหัว" นั้นเป็นเหตุผลที่ถูกต้องอย่างสม่ำเสมอ อย่างไรก็ตามการไปจากที่นั่นถึง "ดังนั้นความน่าจะเป็นที่เหรียญกัมมันตภาพรังสีนี้ก็คือ 0.5" ไม่ใช่ความน่าจะเป็นที่ใช้กับสิ่งที่ไม่มีความถี่ในการวิ่งระยะยาวเพราะมันสามารถเกิดขึ้นได้เพียงครั้งเดียวเท่านั้น มันเป็นเหตุผลที่สมบูรณ์แบบในการให้เหตุผลของ Bayesian เนื่องจากความน่าจะเป็นแบบ Bayesian เป็นคำแถลงเกี่ยวกับความน่าเชื่อถือของข้อเสนอ (ซึ่งอาจขึ้นอยู่กับความถี่ในระยะยาวของประชากร)
Dikran Marsupial

1
คำตอบของเขาสำหรับคำถามทั้งสองนั้นจริง ๆ แล้วเป็นคำแถลงเกี่ยวกับสัดส่วนของจำนวนประชากรในจินตนาการของเหรียญที่จะขึ้นฝั่ง แต่มีความเป็นไปได้ที่จะไม่ทำให้ชัดเจนเนื่องจากคนทั่วไปต้องการความช่วยเหลือ (คำตอบทางอ้อมไม่ใช่คำตอบที่เป็นประโยชน์) และสถิติผู้ใช้บ่อยก็ค่อนข้างตอบโต้ง่ายและมีแนวโน้มที่จะหลีกเลี่ยง ความสับสน หากกดลงเพื่อสร้างความน่าจะเป็นเกี่ยวกับการพลิกเป็นประจำผู้ที่ดีก็เพียงปฏิเสธที่จะตอบ - มันอยู่นอกขอบเขตของสถิติบ่อย
Dikran Marsupial

1
โดยพื้นฐานแล้วนักประพันธ์จะไม่ตอบคำถามของคุณจริง ๆ เขาจะออกแถลงการณ์เกี่ยวกับประชากรเหรียญพลิกและทำให้คุณเข้าใจว่าความน่าจะเป็นที่จะเป็นหัวหน้าของการพลิกครั้งนั้นนั้นก็เหมือนกับสัดส่วนในประชากรโดยปริยาย . แต่นั่นจะเป็นการอนุมานแบบเบย์ของคุณไม่ใช่ของเขา
Dikran Marsupial

1
@Aaron แน่นอนคุณสามารถพูดว่า "ความน่าจะเป็นเป็น 0 หรือ 1" สำหรับหลาย ๆ สิ่ง แต่คำตอบนั้นไม่ได้ซื้อเราอย่างแน่นอน (ตัวอย่างเช่นถ้าเราต้องการตอบคำถามที่เป็นรูปธรรมเกี่ยวกับจำนวนที่เราควรเดิมพันในเกมหรือไม่ หรือไม่เราควรเปิดกระสวยอวกาศ) นอกจากนี้สิ่งที่ "อาจเกิดขึ้น" คือ: (1) หัวเหรียญที่ตกลงมาและคุณครอบคลุมมัน, (2) เหรียญที่หางลงและคุณครอบคลุมมัน; ใน "ประชากรจินตภาพ" ของการทดลอง "พลิกและปิด" จำนวนมากผลประมาณ 50% ทำให้คุณเห็นหัว
เอลเลียต

14

การอัปเดตที่สำคัญคำตอบใหม่ที่สำคัญ ให้ฉันพยายามระบุจุดนี้ให้ชัดเจนเพราะปัญหาอยู่ตรงไหน:

"ถ้าคุณให้เหตุผลว่า" หลังจากที่ได้เห็นช่วงเวลาความคิดของความน่าจะเป็นไม่มีเหตุผลอีกต่อไป "ถ้าอย่างนั้นก็ให้เราทำงานในการตีความความน่าจะเป็นที่มันสมเหตุสมผล"

กฎของความน่าจะไม่เปลี่ยนแปลง แต่แบบจำลองของคุณสำหรับจักรวาลนั้น คุณยินดีที่จะประเมินความเชื่อก่อนหน้าของคุณเกี่ยวกับพารามิเตอร์โดยใช้การแจกแจงความน่าจะเป็นหรือไม่? การอัปเดตการกระจายความน่าจะเป็นนั้นหลังจากเห็นข้อมูลเป็นสิ่งที่สมเหตุสมผลหรือไม่ หากคุณคิดว่าเป็นอย่างนั้นคุณสามารถทำให้งบเช่นx) การกระจายก่อนหน้าของฉันสามารถแสดงถึงความไม่แน่นอนของฉันเกี่ยวกับสถานะที่แท้จริงของธรรมชาติไม่ใช่แค่การสุ่มตามที่เข้าใจกันโดยทั่วไป - นั่นคือถ้าฉันกำหนดการกระจายก่อนหน้านี้ให้กับจำนวนลูกบอลสีแดงในโกศซึ่งไม่ได้หมายความว่า ของลูกบอลสีแดงสุ่ม มันคงที่ แต่ฉันไม่แน่ใจเกี่ยวกับเรื่องนี้P(θ[L(X),U(X)]|X=x)

หลายคนรวมทั้งผมได้กล่าวนี้ แต่ถ้าคุณไม่เต็มใจที่จะเรียกตัวแปรสุ่มแล้วงบไม่ได้ มีความหมาย ถ้าฉันเป็นนักบวชฉันกำลังรักษาเป็นปริมาณคงที่และฉันไม่สามารถบอกความน่าจะเป็นได้ ทำไม? เพราะมันได้รับการแก้ไขและการตีความความน่าจะเป็นของฉันอยู่ในแง่ของความถี่ในระยะยาว จำนวนลูกบอลสีแดงในโกศไม่เคยเปลี่ยนแปลง คือสิ่งที่คือ ถ้าฉันดึงลูกบอลออกมาสองสามลูกฉันก็จะมีตัวอย่างแบบสุ่ม ฉันสามารถถามว่าจะเกิดอะไรขึ้นถ้าฉันสุ่มตัวอย่างแบบสุ่ม - กล่าวคือฉันสามารถพูดเกี่ยวกับP ( θ [ L ( X ) , U ( X ) ] | X = x ) θ θ θ P ( θ [ L ( X ) , U ( X ) ] )θP(θ[L(X),U(X)]|X=x)θθθP(θ[L(X),U(X)]) เนื่องจากช่วงเวลาขึ้นอยู่กับตัวอย่างซึ่งเป็นแบบสุ่ม (รอ!)

แต่คุณไม่ต้องการที่ คุณต้องการ - ความน่าจะเป็นที่ช่วงเวลานี้ที่ฉันสร้างขึ้นด้วยตัวอย่างที่สังเกต (และตอนนี้คงที่) ของฉันมีพารามิเตอร์ อย่างไรก็ตามเมื่อคุณมีเงื่อนไขในจากนั้นสำหรับฉันบ่อยนักไม่มีอะไรเหลือสุ่มและคำสั่ง doesn ' ทำให้รู้สึกในทางที่มีความหมายใด ๆX = x P ( θ [ L ( X ) , U ( X ) ] | X = x )P(θ[L(X),U(X)]|X=x)X=xP(θ[L(X),U(X)]|X=x)

หลักการเดียว (IMO) ในการสร้างข้อความเกี่ยวกับคือการหาปริมาณความไม่แน่นอนของเราเกี่ยวกับพารามิเตอร์ที่มีการแจกแจงความน่าจะเป็น (ก่อน) อัปเดตการแจกจ่ายด้วยข้อมูลใหม่ผ่านทาง Bayes Theorem วิธีการอื่นที่ฉันได้เห็นก็คือการประมาณค่าที่ไม่น่าสนใจสำหรับ Bayes แน่นอนคุณไม่สามารถทำได้จากมุมมองของผู้ใช้บ่อยP(θ[L(X),U(X)]|X=x)

ไม่ได้หมายความว่าคุณไม่สามารถประเมินขั้นตอนการดำเนินการแบบดั้งเดิมจากมุมมองแบบเบย์ (บ่อยครั้งที่ช่วงความเชื่อมั่นเป็นเพียงช่วงเวลาที่น่าเชื่อถือภายใต้ชุดนักบวชเช่น) หรือการประเมินตัวประมาณค่าแบบเบส์ / ช่วงเวลาที่เชื่อถือได้ (ฉันคิดว่ามันสามารถ) มันไม่ได้หมายความว่าสถิติแบบคลาสสิก / บ่อยครั้งไม่มีประโยชน์เพราะมันไม่ใช่ มันคือสิ่งที่เป็นและเราไม่ควรพยายามทำให้มากขึ้น

คุณคิดว่ามันสมเหตุสมผลหรือไม่ที่จะให้การกระจายพารามิเตอร์ก่อนหน้านี้เป็นตัวแทนของความเชื่อของคุณเกี่ยวกับจักรวาล? ดูเหมือนว่าจากความคิดเห็นของคุณที่คุณทำ จากประสบการณ์ของฉันคนส่วนใหญ่จะเห็นด้วย (นั่นเป็นเรื่องตลกเล็ก ๆ น้อย ๆ ที่ฉันทำในความคิดเห็นของฉันที่ @G คำตอบของ Jay Kerns) ถ้าเป็นเช่นนั้นกระบวนทัศน์แบบเบย์ยังมีตรรกะวิธีที่สอดคล้องกันที่จะทำให้งบที่เกี่ยวกับx) วิธีการที่ใช้บ่อยไม่ได้เป็นเช่นนั้นP(θ[L(X),U(X)]|X=x)


1
(+1) ทำได้ดีมากอีกครั้งและไปที่จุดศูนย์กลาง

+1 ความคิดเห็นเดียวกันกับข้างบน (ดูคำตอบของ G. Jay Kerns); สิ่งนี้มีประโยชน์จริงๆ
Elliott

Bounty schmounty :) ฉันดีใจที่คุณเห็นว่ามีประโยชน์
JMS

11

ตกลงตอนนี้คุณกำลังพูด! ฉันโหวตให้ลบคำตอบก่อนหน้านี้เพราะไม่เหมาะสมกับคำถามที่อัปเดตที่สำคัญนี้

ในคำถามใหม่ที่ได้รับการอัปเดตด้วยคอมพิวเตอร์ที่คำนวณช่วงความเชื่อมั่น 95% ภายใต้การตีความบ่อยครั้งของออร์โธดอกซ์นี่คือคำตอบสำหรับคำถามของคุณ:

  1. เลขที่
  2. เลขที่
  3. เมื่อสังเกตช่วงเวลามันจะไม่สุ่มอีกต่อไปและจะไม่เปลี่ยนแปลง (อาจเป็นช่วงเวลา ) แต่จะไม่เปลี่ยนแปลงเช่นกันและไม่เคยเปลี่ยน (อาจเป็น ) ความน่าจะเป็นเปลี่ยนจาก 95% เป็น 0% เพราะ 95% ของช่วงเวลาที่คอมพิวเตอร์คำนวณครอบคลุม 7 แต่ 100% ของช่วงเวลาไม่ครอบคลุม 7θ θ = 7 [ 1 , 3 ][1,3]θθ=7[1,3]

(โดยวิธีการในโลกแห่งความจริงผู้ทดลองไม่เคยรู้ว่าซึ่งหมายความว่าผู้ทดลองไม่สามารถรู้ได้ว่าความน่าจะเป็นที่แท้จริงครอบคลุมถึงเป็นศูนย์หรืออย่างใดอย่างหนึ่ง (S) เขาเท่านั้น บอกว่ามันจะต้องเป็นอย่างใดอย่างหนึ่ง) นั่นบวกกับผู้ทดลองสามารถบอกได้ว่า 95% ของช่วงเวลาของคอมพิวเตอร์ครอบคลุมแต่เรารู้แล้ว[ 1 , 3 ] θ θθ=7[1,3]θθ

จิตวิญญาณของคำถามของคุณช่วยให้เค้ากลับไปสังเกตการณ์ความรู้และวิธีการที่เกี่ยวข้องกับที่โกหก ที่ (น่าจะ) เป็นเหตุผลที่คุณได้พูดคุยเกี่ยวกับรหัสผ่านที่เกี่ยวกับคอมพิวเตอร์คำนวณช่วงเวลาของคุณโดยไม่เห็นว่ามันยังฯลฯ ฉันเคยเห็นในความคิดเห็นของคุณเพื่อตอบว่าดูเหมือนว่าไม่น่าพอใจ / ไม่ถูกต้องที่จะต้องกระทำเพื่อ 0 หรือ 1 หลังจากทั้งหมดทำไมเราไม่เชื่อว่ามันคือ 87% หรือหรือแม้แต่ 99% ?? ? แต่นั่นคือพลัง - และพร้อมกันที่ส้นเท้าของ Achilles - ของกรอบงานบ่อย ๆ : ความรู้ / ความเชื่อตามอัตวิสัยของผู้สังเกตการณ์นั้นไม่เกี่ยวข้อง สิ่งที่สำคัญคือความถี่สัมพัทธ์ในระยะยาว ไม่มีอะไรเพิ่มเติมไม่น้อยไปกว่านี้15 / 16θ15/16

ในฐานะ BTW สุดท้าย: หากคุณเปลี่ยนการตีความความน่าจะเป็น (ซึ่งคุณตั้งใจจะเลือกที่จะไม่ทำกับคำถามนี้) ดังนั้นคำตอบใหม่คือ:

  1. ใช่.
  2. ใช่.
  3. ความน่าจะเป็นเปลี่ยนแปลงได้เนื่องจากความน่าจะเป็น = ความรู้เชิงอัตวิสัยหรือระดับความเชื่อและความรู้ของผู้สังเกตการณ์เปลี่ยนไป เราเป็นตัวแทนของความรู้ที่มีการแจกแจงก่อนหน้า / หลังและเมื่อข้อมูลใหม่พร้อมใช้งาน morphs เดิมจะเข้าสู่ยุคหลัง (ผ่านกฎของเบย์)

(แต่สำหรับการเปิดเผยอย่างเต็มรูปแบบการตั้งค่าที่คุณอธิบายนั้นไม่ตรงกับการตีความเชิงอัตนัยเป็นอย่างดีตัวอย่างเช่นเรามักจะมีช่วงเวลาที่น่าเชื่อถือ 95% ก่อนที่จะเปิดคอมพิวเตอร์แล้ว ช่วงหลังที่น่าเชื่อถือ 95% ของเราซึ่งโดยปกติแล้วจะน่าสนใจมากกว่าช่วงก่อน ๆ )


อีกครั้ง! :) ทำได้ดี.
JMS

3
ฉันควรจะชี้ให้เห็นว่าการสกัดความน่าจะเป็นแบบเบย์นั้นไม่จำเป็นต้องเป็นอัตวิสัยดังนั้นจึงไม่ได้เป็นจุดแข็งของวิธีการที่ใช้บ่อย ในกรณีของวัตถุประสงค์ Bayesian เข้าใกล้กับ "ความน่าจะเป็นของปัญหาการลงจอดของเหรียญ" โดยใช้ uninformative ก่อนไม่เกี่ยวข้องกับการกระทำใด ๆ เลย จุดแข็งที่แท้จริงของวิธีการแบบประจำอยู่ที่ปัญหาเช่นการควบคุมคุณภาพซึ่งเป็นเรื่องปกติที่จะพูดถึงการทดลองซ้ำและความถี่ระยะยาว มันมีปัญหาเมื่อคุณตั้งคำถามเกี่ยวกับเหตุการณ์เฉพาะ
Dikran Marsupial

@ JMS ขอบคุณ @Dikran มันยากที่จะพูดถึงเรื่องนี้ด้วย 544 ตัวอักษรในกล่องเล็ก ๆ บนหน้าจอคอมพิวเตอร์ สั้น ๆ : ฉันเห็นด้วยกับคุณว่าคำว่า "Bayesian" ไม่ได้มีความหมายเหมือนกันกับ "อัตนัย" และไม่มีประเด็นใดที่จะพยายามตอกย้ำความแข็งแกร่งที่แท้จริงของการเข้าใกล้ บรรทัดล่าง: เราทุกคนสามารถเห็นด้วยกับความถี่สัมพัทธ์ในระยะยาว แต่บ่อยกว่านั้นไม่ได้หลังของคุณจะแตกต่างจากของฉัน

2
@Dikran Marsupial คุณทำจุดดี ฉันแค่เพิ่มว่าเมื่อเราย้ายปัญหาของเล่นที่ผ่านมาเป็นการสร้างแบบจำลองที่ใช้จริงมันมักจะเป็นกรณีที่ผู้กระทำที่สำคัญอย่างแท้จริงเกิดขึ้นผ่านวิธีที่เราระบุโอกาสไม่จำเป็นต้องมีการแจกแจงก่อนหน้าตัวเอง ฯลฯ ) ด้วยวิธีการนี้ผู้กระทำจะถูกสร้างขึ้นเป็นส่วนใหญ่ของสถิติแบบจำลองเบย์และผู้ใช้บ่อยเหมือนกัน
JMS

+1 ขอบคุณสำหรับคำตอบที่สวยงาม สิ่งนี้สมควรได้รับความโปรดปรานอย่างแน่นอน แต่เพื่อหลีกเลี่ยงการเป็นเรื่องการเมืองฉันก็ลงเอยด้วยการลงคะแนน
Elliott

6

ฉันจะโยนสองเซ็นต์ของฉัน (อาจ redigesting บางคำตอบเดิม) สำหรับผู้ที่ใช้บ่อยช่วงความมั่นใจนั้นสำคัญมากคือตัวแปรสุ่มสองมิติ: หากคุณต้องการทำการทดสอบซ้ำอีกครั้งหนึ่งพันล้านครั้งช่วงความเชื่อมั่นที่คุณจะประเมิน (เช่น: คำนวณจากข้อมูลที่คุณพบใหม่ในแต่ละครั้ง) จะแตกต่างกันไปในแต่ละครั้ง . ดังนั้นสองขอบเขตของช่วงเวลาจึงเป็นตัวแปรสุ่ม

จากนั้น 95% CI หมายถึงไม่มีอะไรมากไปกว่าความเชื่อมั่น (จากสมมติฐานทั้งหมดของคุณที่นำไปสู่ ​​CI นี้ถูกต้อง) ว่าชุดตัวแปรสุ่มนี้จะมีค่าที่แท้จริง (นิพจน์ที่พบบ่อยมาก) ใน 95% ของคดี

คุณสามารถคำนวณช่วงความมั่นใจได้อย่างง่ายดายสำหรับค่าเฉลี่ย 100 เสมอจากการแจกแจงแบบปกติมาตรฐาน จากนั้นหากคุณวาด 10,000 ค่า 100 ค่าจากการแจกแจงแบบปกติมาตรฐานและแต่ละครั้งคำนวณช่วงความมั่นใจสำหรับค่าเฉลี่ยคุณจะเห็นว่า 0 อยู่ในนั้นประมาณ 9500 ครั้ง

ความจริงที่ว่าคุณได้สร้างช่วงความเชื่อมั่นเพียงครั้งเดียว (จากข้อมูลจริงของคุณ) จะลดความน่าจะเป็นของค่าจริงที่อยู่ในช่วงเวลานั้นเป็น 0 หรือ 1 แต่มันไม่เปลี่ยนความน่าจะเป็นของช่วงความมั่นใจเป็น ตัวแปรสุ่มที่มีค่าจริง

ดังนั้นกำไร: ความน่าจะเป็นของช่วงเวลาความเชื่อมั่นใด ๆ (เช่นโดยเฉลี่ย) 95% ที่มีค่าจริง (95%) ไม่เปลี่ยนแปลงและความน่าจะเป็นของช่วงเวลาใดช่วงหนึ่ง (CI หรืออะไรก็ตาม) ที่มีค่าจริง (0 หรือ 1) ความน่าจะเป็นของช่วงเวลาที่คอมพิวเตอร์รู้ แต่คุณไม่ได้เป็น 0 หรือ 1 (เพราะมันเป็นช่วงเวลาเฉพาะ) แต่เนื่องจากคุณไม่รู้ ((และตามปกติแล้ว) ไม่สามารถคำนวณช่วงเวลาเดียวกันนี้ซ้ำได้ หลายต่อหลายครั้งอีกครั้งจากข้อมูลเดียวกัน) สิ่งที่คุณต้องทำคือความน่าจะเป็นของช่วงเวลาใด ๆ


ข้อความด้านตลก: ตัวตรวจสอบการสะกดในไซต์นี้พบคำที่ใช้บ่อยว่าควรมีการขีดเส้นใต้ ไซต์นี้ซ่อนเร้นอย่างเชี่ยวชาญโดยชาวเบย์หรือไม่? โอ้ฉันเดาว่าไม่ใช่เพราะชาวเบย์มีการขีดเส้นใต้ของตัวเอง :-)
Nick Sabbe

4

เหตุผลที่ช่วงความเชื่อมั่นไม่ได้ระบุ "ความน่าจะเป็นที่พารามิเตอร์ที่แท้จริงอยู่ในช่วงเวลา" นั้นเป็นเพราะเมื่อระบุช่วงเวลาแล้วพารามิเตอร์จะอยู่ในนั้นหรือไม่ก็ได้ อย่างไรก็ตามสำหรับช่วงความมั่นใจ 95% คุณมีโอกาส 95% ในการสร้างช่วงความมั่นใจที่มีค่า นี่เป็นแนวคิดที่ค่อนข้างเข้าใจยากดังนั้นฉันจึงอาจไม่ชัดเจน ดูhttp://frank.itlab.us/datamodel/node39.htmlสำหรับการชี้แจงเพิ่มเติม


2
สมมติว่าคุณตั้งโปรแกรมคอมพิวเตอร์เพื่อคำนวณช่วงความมั่นใจ แต่คุณไม่ได้ดูผลลัพธ์ ก่อนที่คุณจะเห็นผลลัพธ์คุณรู้ว่ามีโอกาส 95% ที่ช่วงเวลานั้นมีพารามิเตอร์ที่ถูกต้อง (เหมือนก่อนที่คุณเห็นผลลัพธ์ของการโยนเหรียญคุณรู้ว่ามีโอกาส 50% ที่หัว) การดูผลลัพธ์จะเปลี่ยนความน่าจะเป็นนี้อย่างไรในภายหลังเนื่องจากคุณไม่ทราบพารามิเตอร์ที่ถูกต้องในตอนแรก (ฉันยอมรับว่าการดูผลลัพธ์ของการโยนเหรียญเปลี่ยนความน่าจะเป็นของหัวจาก 50% เป็น 1 หรือ 0)?
เอลเลียต

นอกจากนี้ในขณะที่ฉันยอมรับว่ามีความแตกต่างฉันสงสัยว่ามีอะไรผิดปกติกับ "โต้แย้ง" ข้างต้นของฉันแสดงให้เห็นว่าพวกเขาเป็นสิ่งเดียวกัน
เอลเลียต

2
@Elliott คำถามของคุณดูเหมือนจะเหมือนกับการเปรียบเทียบนี้: คุณพลิกเหรียญที่ยุติธรรม ดังนั้นความน่าจะเป็นของหัวคือ 50% ตอนนี้คุณดูที่เหรียญและมันเป็นหัว สิ่งนี้เปลี่ยนแปลงความน่าจะเป็นของหัวได้อย่างไร คำตอบก็คือมันไม่ได้เพราะความน่าจะเป็นหมายถึงขั้นตอนการโยนเหรียญไม่ใช่ผลลัพธ์ ฉันคิดว่าตัวอย่างที่คุณอ้างถึงทำงานในลักษณะเดียวกัน: ขั้นตอนอาจมีโอกาส 50% ที่จะครอบคลุมพารามิเตอร์ แต่หลังจากข้อเท็จจริงแล้วมันเป็นไปได้ที่จะตรวจสอบว่าครอบคลุมพารามิเตอร์จริง ๆ แล้วอะไรล่ะ
whuber

ฉันไม่ได้พูดถึงการเปลี่ยนความน่าจะเป็นที่เหรียญยุติธรรมจะเป็นผู้นำ ฉันกำลังพูดถึงการเปลี่ยนความน่าจะเป็นที่เหรียญนี้จะเป็นผู้นำ หลังจากที่ฉันพลิกมันและก่อนที่ฉันจะดูมันฉันจะยืนยันว่าความน่าจะเป็นที่เป็นปัญหาคือ 50% เพราะประมาณครึ่งหนึ่งของกรณีดังกล่าวเกี่ยวข้องกับเหรียญที่มีหัวขึ้น ในทางกลับกันหลังจากที่ฉันได้ดูและมองเห็นผู้คน 100% ของกรณีเช่นนั้นเกี่ยวข้องกับเหรียญที่มีหัวขึ้น (กรณีที่มีก้อยถูกกำจัดเมื่อฉันมองเหรียญและไม่เห็นหัว)
เอลเลียต

ฉันยอมรับว่าหลังจากข้อเท็จจริงแล้วอาจเป็นไปได้ที่จะตรวจสอบว่าพารามิเตอร์ครอบคลุม คำตอบของฉันคือ "อะไรนะ?" คือ "ดังนั้นอาร์กิวเมนต์ข้างต้นของฉัน (ในคำถามเดิม) จะต้องผิดและฉันสงสัยว่ามีอะไรผิดปกติกับมัน"
เอลเลียต

4

ฉันไม่คิดว่าผู้ถี่ถ้วนจะพูดว่ามีความน่าจะเป็นของค่าจริง (ประชากร) ของสถิติที่อยู่ในช่วงความมั่นใจสำหรับตัวอย่างเฉพาะ ไม่ว่าจะเป็นหรือไม่ แต่ไม่มีความถี่ในการรันนานสำหรับเหตุการณ์เฉพาะเพียงจำนวนประชากรของเหตุการณ์ที่คุณจะได้รับจากการทำงานซ้ำ ๆ ของกระบวนการทางสถิติ นี่คือเหตุผลที่เราต้องยึดติดกับข้อความเช่น "95% ของช่วงความเชื่อมั่นดังนั้นการสร้างจะมีค่าที่แท้จริงของสถิติ" แต่ไม่ใช่ "มีความน่าจะเป็น ap% ที่ค่าจริงอยู่ในช่วงความเชื่อมั่นที่คำนวณสำหรับเรื่องนี้โดยเฉพาะ ตัวอย่าง". สิ่งนี้เป็นจริงสำหรับค่าใด ๆ ของ p มันเป็นไปไม่ได้โดยนิยามความหมายของความเป็นไปได้ที่เกิดขึ้นจริง Bayesian สามารถสร้างข้อความเช่นนั้นโดยใช้ช่วงเวลาที่น่าเชื่อถือได้


3

E[a,b]

E~(L(X),U(X))

แก้ไข: @G Jay Kerns ทำให้การโต้แย้งดีกว่าฉันและพิมพ์เร็วขึ้นดังนั้นอาจเป็นไปตาม :)


[a,b]

2
|

ฉันไม่รู้คุณเป็นที่ :-)

2

E[a,b]ECCP(E|C)=P(E)P(E|C)=P(E)

P(E|C)=1P(E|C)=0


เมื่อพิจารณาว่าฉันกำหนดให้ C เป็นเหตุการณ์ที่เกิดขึ้นในช่วงเวลานี้ [a, b] มีพารามิเตอร์จริงฉันไม่แน่ใจว่าฉันยอมรับว่า E และ C / C 'เป็นอิสระ: รู้ว่า C เกิดขึ้นรับประกันได้ว่า E เกิดขึ้น .
เอลเลียต

แต่ C เป็นตัวแปรสุ่ม! คุณจะเปลี่ยนคำจำกัดความของเหตุการณ์เหล่านี้หลังจากที่ทุกอย่างเกิดขึ้นแล้ว อีกวิธีหนึ่งถ้าคุณกำหนดให้ C เป็นเหตุการณ์เฉพาะนี้ C จะไม่เป็นช่วงความมั่นใจอีกต่อไป
raegtin

2
ปัญหาคือว่าถ้า C เป็นเหตุการณ์ที่ช่วงเวลามีพารามิเตอร์จริงในการทดสอบนี้โดยเฉพาะก็ไม่ได้มีความถี่ในการใช้งานนาน (การวิ่งนั้นจะเกิดขึ้นเพียงครั้งเดียวเท่านั้น) ดังนั้นคุณไม่สามารถกำหนดได้ ความน่าจะเป็นแบบนี้ นี่คือเหตุผลที่คำจำกัดความของช่วงความมั่นใจเป็นประจำนั้นอยู่ในรูปของประชากรของการทดลองที่ทำซ้ำ ดูเหมือนว่าคุณจะใช้การให้เหตุผลแบบเบย์กับการตั้งค่าแบบประจำและมีการจับคู่คำจำกัดความความน่าจะเป็นที่ผิดพลาด
Dikran Marsupial

นี่เป็นอีกวิธีในการดู สิ่งที่คุณกำลังทำอยู่มีดังต่อไปนี้: เรียกใช้การคำนวณเพื่อให้ได้ช่วงความมั่นใจ [a, b] กำหนด C เป็นเหตุการณ์ที่ช่วงความเชื่อมั่นนี้เป็นพิเศษ [a, b] มีพารามิเตอร์จริง กำหนด E ให้เป็นเหตุการณ์ที่ช่วงเวลาเฉพาะ [a, b] มีพารามิเตอร์จริง ดังนั้น E และ C จึงเป็นเหตุการณ์เดียวกัน!
raegtin

นั่นคือสิ่งที่คุณกำลังทำจริง ดูเหมือนว่าคุณคิดว่าคุณกำลังทำสิ่งต่อไปนี้ (ซึ่งคุณไม่ใช่): เรียกใช้การคำนวณ # 1 เพื่อรับช่วงเวลา [a, b] กำหนด E ให้เป็นเหตุการณ์ที่ช่วงเวลาเฉพาะ [a, b]มีพารามิเตอร์จริง ถัดไปลืมเกี่ยวกับการคำนวณ # 1 และกำหนด C ให้เป็นเหตุการณ์ที่ช่วงเวลาการคำนวณอื่นใด [a ', b'] มีพารามิเตอร์จริง ในกรณีนี้ E และ C เป็นอิสระ
raegtin

2

มีคำอธิบายมากมายที่นี่ที่ฉันไม่มีเวลาอ่าน แต่ฉันคิดว่าคำตอบสำหรับคำถามพื้นฐานอาจสั้นและหวาน มันเป็นความแตกต่างระหว่างความน่าจะเป็นที่ไม่มีเงื่อนไขในข้อมูล ความน่าจะเป็นที่ 1-alpha ก่อนรวบรวม dats คือความน่าจะเป็นที่กระบวนการที่กำหนดไว้อย่างดีจะรวมพารามิเตอร์ไว้ด้วย หลังจากที่คุณรวบรวมข้อมูลและทราบช่วงเวลาเฉพาะที่คุณสร้างช่วงเวลาได้รับการแก้ไขและเนื่องจากพารามิเตอร์เป็นค่าคงที่ความน่าจะเป็นแบบมีเงื่อนไขนี้อาจเป็น 0 หรือ 1 แต่เนื่องจากเราไม่ทราบค่าที่แท้จริงของพารามิเตอร์ หลังจากรวบรวมข้อมูลแล้วเราไม่ทราบว่าเป็นค่าใด

ส่วนขยายของโพสต์โดย Michael Chernick คัดลอกความคิดเห็นในแบบฟอร์ม:

มีข้อยกเว้นทางพยาธิวิทยาสำหรับสิ่งนี้ซึ่งสามารถเรียกว่าการประเมินที่สมบูรณ์แบบ สมมติว่าเรามีกระบวนการตอบกลับอัตโนมัติลำดับแรกที่กำหนดโดย X (n) = pX (n-1) + en มันคงที่ดังนั้นเราจึงรู้ว่า p ไม่ใช่ 1 หรือ -1 และ <1 มีค่าสัมบูรณ์ ตอนนี้ en ถูกกระจายอย่างอิสระเหมือนกันกับการกระจายแบบผสมมีความน่าจะเป็นเป็นบวก q ที่ en = 0

มีข้อยกเว้นทางพยาธิวิทยาสำหรับสิ่งนี้ซึ่งสามารถเรียกว่าการประเมินที่สมบูรณ์แบบ สมมติว่าเรามีกระบวนการตอบกลับอัตโนมัติลำดับแรกที่กำหนดโดย X (n) = pX (n-1) + en มันคงที่ดังนั้นเราจึงรู้ว่า p ไม่ใช่ 1 หรือ -1 และ <1 มีค่าสัมบูรณ์

ตอนนี้ en มีการกระจายอย่างเป็นอิสระเหมือนกันกับการกระจายแบบผสมมีความเป็นไปได้ในเชิงบวก q ที่ en = 0 และด้วยความน่าจะเป็น 1-Q มันมีการแจกแจงแบบต่อเนื่องอย่างแน่นอน (กล่าวว่าความหนาแน่นไม่เป็นศูนย์ในช่วงเวลา รวบรวมข้อมูลจากอนุกรมเวลาตามลำดับและสำหรับแต่ละคู่ที่ต่อเนื่องกันประมาณค่า p โดย X (i) / X (i-1) ตอนนี้เมื่อ ei = 0 อัตราส่วนจะเท่ากับ p อย่างแน่นอน

เนื่องจาก q มากกว่า 0 ในที่สุดอัตราส่วนจะทำซ้ำค่าและค่านั้นจะต้องเป็นค่าที่แน่นอนของพารามิเตอร์ p เพราะถ้าไม่ใช่ค่าของ ei ซึ่งไม่ใช่ 0 จะทำซ้ำด้วยความน่าจะเป็น 0 และ ei / x (i -1) จะไม่ทำซ้ำ

ดังนั้นกฎการหยุดแบบต่อเนื่องคือการสุ่มตัวอย่างจนกว่าอัตราส่วนจะทำซ้ำอย่างแน่นอนจากนั้นใช้ค่าซ้ำเป็นประมาณการของ p เนื่องจากมันเป็นช่วงเวลาใด ๆ ที่คุณสร้างที่อยู่ตรงกลางที่การประเมินนี้มีความน่าจะเป็น 1 ซึ่งรวมถึงพารามิเตอร์ที่แท้จริง แม้ว่านี่จะเป็นตัวอย่างทางพยาธิวิทยาที่ไม่สามารถใช้งานได้จริง แต่ก็มีกระบวนการสุ่มอยู่กับคุณสมบัติที่เราต้องการสำหรับการแจกแจงความผิด


2
คุณได้พิจารณาเพิ่มตัวอย่างที่อธิบายไว้ในหลักสูตรของความคิดเห็นเหล่านี้ไปยังคำตอบของคุณหรือไม่
มาโคร

@Michael ฉันจะแสดงความคิดเห็นที่สองของแมโคร โปรดทราบว่าความคิดเห็นมักถูกมองว่าเป็นวิธีการโต้ตอบกับผู้ใช้รายอื่น (เช่นเมื่อขอคำชี้แจง ฯลฯ ) และในบางกรณีบางครั้งก็ถูกมองว่าเป็น ' พลเมืองชั้นสามในกองแลกเปลี่ยน ' อย่างไรก็ตามหลังจากการแลกเปลี่ยนครั้งล่าสุดของเราฉันจะให้คุณตัดสินใจเกี่ยวกับวิธีดำเนินการกับความคิดเห็นชุดนี้ คำพูดนี้ใช้กับชุดของความคิดเห็นอื่นพบที่นี่
chl

ฉันไม่ได้ใส่ความเห็นลงในคำตอบเพราะดูเหมือนว่าจะมีนโยบายในการลดคำตอบที่มีการพูดคุยกันมากมายโดยเฉพาะเมื่อมีคนตัดสินว่าคำตอบนั้นไม่ได้ตอบคำถามจริงๆ ดังนั้นคำตอบคือให้คำตอบและความคิดเห็นก็อยู่ภายใต้ความคิดเห็น ความคิดเห็นของฉันมีแนวโน้มเกินขีด จำกัด จำนวนอักขระดังนั้นฉันจึงใช้หลายอย่าง
Michael Chernick

@MichaelChernick ไม่มีนโยบายดังกล่าวดังนั้นฉันจึงรวมความคิดเห็นของคุณไว้ในโพสต์

1
@MichaelChernick ฉันโพสต์ในเว็บไซต์นี้เป็นประจำนานประมาณหนึ่งปีและฉันไม่เคยได้ยินใครบอกว่าผู้ดูแลมีความกดดันหรือกฎของเว็บไซต์สับสน ปัญหาที่คุณพบอีกครั้ง: โพสต์ของคุณเป็นสิ่งที่กล่าวถึงอย่างชัดเจนในคำถามที่พบบ่อย
มาโคร

1

ข้อสังเกตสองข้อเกี่ยวกับคำถามและคำตอบมากมายที่อาจช่วยได้

ความสับสนส่วนหนึ่งมาจากการทำคณิตศาสตร์ให้ลึกซึ้งในทฤษฎีความน่าจะเป็นซึ่งบางครั้งก็ไม่ได้อยู่บนพื้นฐานทางคณิตศาสตร์ที่มั่นคงจนกระทั่งประมาณปี 1940 มันกลายเป็นสิ่งที่ประกอบด้วยพื้นที่ตัวอย่างพื้นที่น่าจะเป็น ฯลฯ

ก่อนอื่นคุณได้กล่าวว่าหลังจากการพลิกเหรียญเรารู้ว่ามีความน่าจะเป็น 0% มันไม่ได้เกิดขึ้นหากมันเกิดขึ้น ณ จุดนี้มันไม่มีเหตุผลที่จะพูดถึงความน่าจะเป็น เกิดอะไรขึ้นและเรารู้ ความน่าจะเป็นเกี่ยวกับสิ่งที่ไม่รู้จักในอนาคตไม่ใช่สิ่งที่รู้ในปัจจุบัน

ในฐานะที่เป็นข้อพิสูจน์เล็ก ๆ น้อย ๆ เกี่ยวกับความน่าจะเป็นที่ศูนย์หมายถึงอะไรให้ลองพิจารณาสิ่งนี้: เราถือว่าการนับที่ยุติธรรมนั้นมีความน่าจะเป็นที่ 0.5 ของหัวที่กำลังมา ซึ่งหมายความว่ามีโอกาส 100% ในการขึ้นมาทั้งหัวหรือก้อยเนื่องจากผลลัพธ์เหล่านั้นเป็น MECE (ไม่เกิดร่วมกันและมีความสมบูรณ์ครบถ้วน) มันมีการเปลี่ยนแปลงเป็นศูนย์ร้อยละอย่างไรก็ตามจากการคำนวณหัวและก้อย : ความคิดของเราเกี่ยวกับ 'หัว' และ 'ก้อย' คือสิ่งที่พวกเขาเป็นเอกสิทธิ์ร่วมกัน ดังนั้นนี่จึงมีโอกาสเป็นศูนย์ร้อยละเพราะมันเป็นไปไม่ได้ในวิธีที่เราคิด (หรือนิยาม) 'การโยนเหรียญ' และมันเป็นไปไม่ได้ก่อนและหลังการโยน

ในฐานะที่เป็นข้อพิสูจน์ต่อไปนี้อะไรที่ไม่โดยความหมายเป็นไปไม่ได้เป็นไปได้. ในโลกแห่งความเป็นจริงฉันเกลียดเมื่อทนายถามว่า "เป็นไปไม่ได้ที่คุณจะลงนามในเอกสารนี้และลืมไปเลย" เพราะคำตอบคือ 'ใช่' เสมอโดยธรรมชาติของคำถาม สำหรับเรื่องนั้นคำตอบก็คือ 'ใช่' สำหรับคำถามที่ว่า "มันเป็นไปไม่ได้ที่คุณจะถูกส่งผ่าน dematerialization ไปยังดาวเคราะห์ Remulak 4 และถูกบังคับให้ทำอะไรบางอย่างแล้วส่งกลับโดยไม่มีความทรงจำ? โอกาสที่อาจจะต่ำมาก แต่สิ่งที่เป็นไปไม่ได้เป็นไปไม่ได้ ในแนวคิดทั่วไปของความน่าจะเป็นเมื่อเราพูดถึงการโยนเหรียญมันอาจเกิดขึ้นได้ มันอาจขึ้นมาหาง; และมันอาจจะยืนอยู่บนปลาย (หรืออย่างใดอย่างหนึ่งเช่นถ้าเราถูกลอบเข้าไปในยานอวกาศในขณะที่วางยาและนำขึ้นสู่วงโคจร) ลอยอยู่ในอากาศตลอดไป แต่ก่อนหรือหลังการโยน ก้อยในเวลาเดียวกัน: เป็นผลลัพธ์ที่ไม่เกิดร่วมกันในพื้นที่ตัวอย่างของการทดสอบ (ค้นหา 'ช่องว่างตัวอย่างความน่าจะเป็น' และ 'ซิกม่า - อัลจีบรา')

ประการที่สองในปรัชญา Bayesian / Frequentist ทั้งหมดนี้ในช่วงความเชื่อมั่นมันเป็นเรื่องจริงที่เกี่ยวข้องกับความถี่หากมีใครทำหน้าที่เป็นผู้ปฏิบัติบ่อย ๆ ดังนั้นเมื่อเราบอกว่าช่วงความเชื่อมั่นของค่าเฉลี่ยตัวอย่างและค่าประมาณคือ 95% เราไม่ได้บอกว่าเรามั่นใจได้ 95% ว่าค่า 'จริง' อยู่ระหว่างขอบเขต เรากำลังบอกว่าถ้าเราสามารถทำซ้ำการทดลองนี้ซ้ำแล้วซ้ำอีก 95% ของเวลาที่เราจะพบว่าค่าเฉลี่ยนั้นแท้จริงระหว่างขอบเขต เมื่อเราทำมันด้วยการวิ่งครั้งเดียวเรากำลังใช้ช็อตคัททางจิตและบอกว่า 'เรามั่นใจได้ 95% ว่าเราถูกต้อง'

ในที่สุดอย่าลืมว่าการตั้งค่ามาตรฐานคือการทดสอบสมมติฐานตามการทดสอบ ถ้าเราต้องการทราบว่าฮอร์โมนการเจริญเติบโตของพืชทำให้พืชโตเร็วขึ้นหรือไม่บางทีเราอาจกำหนดขนาดเฉลี่ยของมะเขือเทศหลังจากการเจริญเติบโต 6 เดือน จากนั้นเราก็ทำซ้ำ แต่ด้วยฮอร์โมนและได้ขนาดโดยเฉลี่ย สมมติฐานของเราคือ 'ฮอร์โมนไม่ได้ทำงาน' และเราจะทำการทดสอบว่า แต่ถ้าพืชทดสอบมีขนาดใหญ่กว่าโดยเฉลี่ยด้วยความมั่นใจ 99% นั่นหมายความว่า 'จะมีการเปลี่ยนแปลงแบบสุ่มเสมอเนื่องจากพืชและวิธีการชั่งน้ำหนักที่ถูกต้อง แต่ปริมาณสุ่มที่จะอธิบายสิ่งนี้จะเกิดขึ้นน้อยกว่าหนึ่ง เวลาเป็นร้อย "


1

ปัญหานี้มีลักษณะเป็นความสับสนของความน่าจะเป็นก่อนและหลังหรืออาจเป็นเพราะความไม่พอใจที่ไม่รู้ว่าการกระจายตัวของตัวแปรสุ่มบางอย่าง

ปรับอากาศ

n1nXYXYP(X=xY=y)=1/(n(n1))x,yN:={1,,n}xyP(X=x)=1/nP(Y=x)=1/nxN

tP(X=x)=1/nxNxNX=xP(X=x|Y=t)=P(X=xY=t)/P(Y=t)xt1/(n1)x=t0X=xY=tX=xX=xY=tP(X=x)=P(Y=x)=1/nxN

การไม่ จำกัด เงื่อนไขในหลักฐานหมายถึงการเพิกเฉยต่อหลักฐาน อย่างไรก็ตามเราสามารถกำหนดได้เฉพาะสิ่งที่สามารถแสดงได้ในโมเดลความน่าจะเป็น ในตัวอย่างของเราที่มีสองลูกจากโกศเราไม่สามารถกำหนดสภาพอากาศหรือความรู้สึกของเราในวันนี้ ในกรณีที่เรามีเหตุผลที่เชื่อได้ว่าเป็นหลักฐานที่เกี่ยวข้องกับการทดสอบเราต้องเปลี่ยนแบบจำลองของเราก่อนเพื่อให้เราสามารถแสดงหลักฐานนี้ว่าเป็นเหตุการณ์ทางการ

CC=1X<YP(C=1)=1/2tP(C=1|Y=t)=(t1)/(n1)P(C=1|Y=1)=0C=1P(C=1|Y=n)=1C=1P(C=1)=1/2

ช่วงความเชื่อมั่น

X=(X1,,Xn)n(l,u)γXluRnθRP(l(X)θu(X))γ

C(l,u)C=1l(X)θu(X)P(C=1)γ

x=(x1,,xn)RnxiXiiC=1δ:=P(C=1|X=x)01(C=1X=x)((l(x)θu(x))X=x)l(x)θu(x)δ=0l(x)θu(x)X=xδ=1l(x)u(x)xδ{0,1}

P(C=1)γC=1x[l(x),u(x)][l(x),u(x)]θγจะหมายถึงการยอมรับหลักฐานนี้และในขณะเดียวกันก็ไม่สนใจ

เรียนรู้มากขึ้นรู้น้อยลง

δXYxRP(X=x)P(Y=x)P(X=xY=y)x,yR(X,Y)

Y=7XP(X=x)x(x,7)xRxP(X=x)Y=7Y=77P(X=x)X=xP(X=x|Y=7)=P(X=xY=7)/P(Y=7)

YX


0

ถ้าฉันบอกว่าความน่าจะเป็นที่นิกส์ได้คะแนนระหว่าง xbar - 2sd (x) และ xbar + 2sd (x) ประมาณ 0.95 ในบางเกมในอดีตที่ผ่านมานั่นเป็นคำสั่งที่สมเหตุสมผลเนื่องจากมีการแจกแจงบางส่วนเกี่ยวกับคะแนนบาสเกตบอล . หากฉันรวบรวมข้อมูลเกี่ยวกับคะแนนที่ให้ตัวอย่างเกมและคำนวณช่วงเวลานั้นความน่าจะเป็นที่พวกเขาทำคะแนนในช่วงเวลานั้นในวันที่กำหนดในอดีตนั้นมีค่าเป็นศูนย์หรือหนึ่งอย่างชัดเจนและคุณสามารถ google ผลลัพธ์ของเกมเพื่อค้นหา ความคิดเพียงอย่างเดียวของการรักษาความเป็นไปได้ที่ไม่เป็นศูนย์หรือความน่าจะเป็นอย่างหนึ่งต่อผู้ที่มาจากการสุ่มตัวอย่างซ้ำ ๆ และการรับรู้การประมาณช่วงเวลาของตัวอย่างเฉพาะคือจุดมหัศจรรย์ที่มันเกิดขึ้นหรือไม่ได้รับการประมาณช่วงเวลาของตัวอย่างนั้น . ไม่ใช่จุดที่คุณพิมพ์รหัสผ่าน

นี่คือสิ่งที่ Dikran โต้แย้งข้างต้นและฉันโหวตคำตอบของเขาแล้ว จุดที่ตัวอย่างที่เกิดซ้ำนั้นไม่ได้รับการพิจารณาก็คือประเด็นในกระบวนทัศน์ของผู้ที่ไม่น่าจะเป็นไปได้ที่ไม่ต่อเนื่องไม่ใช่เมื่อคุณพิมพ์รหัสผ่านตามตัวอย่างด้านบนหรือเมื่อคุณ google ผลลัพธ์ในตัวอย่างของฉัน นิกส์เกม แต่จุดเมื่อจำนวนตัวอย่างของคุณ = 1


0

การสร้างแบบจำลอง

S=(Ω,Σ,P)EΣP(E)ESS

ขั้นตอนที่ (1) อาจอนุญาตให้เพิ่มอีก ความเหมาะสมของการสร้างแบบจำลองบางครั้งสามารถทดสอบได้โดยการเปรียบเทียบความน่าจะเป็นของเหตุการณ์บางอย่างกับสิ่งที่เราคาดหวังอย่างสังหรณ์ใจ โดยเฉพาะอย่างยิ่งการดูความน่าจะเป็นที่ขอบเขตหรือเงื่อนไขบางอย่างอาจช่วยให้ทราบว่าการสร้างแบบจำลองนั้นเหมาะสมอย่างไร

X1,,XnDist(θ)θR

เครื่องมือประมาณช่วงความเชื่อมั่น

γLRRnP(L(X)θR(X))γX=(X1,,Xn)L(X)R(X)xRnL(x)θR(x)

การตั้งค่า

γ1γ2γ1<γ2ความน่าจะเป็นที่สูงขึ้นของการเป็นตั๋วที่ชนะมากกว่าหนึ่งเมื่อพวกเขาถูกวาด การตั้งค่าเกี่ยวกับการสังเกตที่แตกต่างกัน (ตั๋วสองใบในตัวอย่างนี้) ขึ้นอยู่กับคุณสมบัติความน่าจะเป็นของกระบวนการสุ่มที่สร้างการสังเกตได้ดี โปรดทราบว่าเราไม่ได้กล่าวว่าตั๋วใด ๆ มีโอกาสสูงที่จะเป็นตั๋วที่ชนะ หากเราเคยพูดเช่นนั้นด้วย "ความน่าจะเป็น" ในแง่ภาษาพูดซึ่งอาจหมายถึงอะไรดังนั้นจึงควรหลีกเลี่ยงที่นี่

0.95

ตัวอย่างด้วยการเรียบง่ายก่อน

θP(θ=0)=P(θ=1)=1/2ϑRθ=ϑX1,,XnN(ϑ,1)L,RγϑRP(L(X)ϑR(X)|θ=ϑ)γP(L(X)θR(X))γ

xRn(X1,,Xn)θL(x)R(x)P(L(x)θR(x)|X=x)fμnμσ=1

P(L(x)θR(x)|X=x)={f0(x)f0(x)+f1(x)if L(x)0R(x)<1f1(x)f0(x)+f1(x)if 0<L(x)1R(x)1if L(x)0 and 1R(x)0else
γθL(X)θR(X)γ

θxx{μ0,μ1}={0,1}

P(θ=μ0|X=x)=fμ0(x)fμ0(x)+fμ1(x)

0

หากเราสามารถพูดว่า "ความน่าจะเป็นที่พารามิเตอร์จริงตั้งอยู่ในช่วงความมั่นใจนี้" เราจะไม่คำนึงถึงขนาดของตัวอย่าง ไม่ว่าตัวอย่างจะมีขนาดใหญ่เพียงใดตราบใดที่ค่าเฉลี่ยเท่ากันช่วงเวลาของความมั่นใจก็จะกว้างเท่ากัน แต่เมื่อเราพูดว่า "ถ้าฉันทำซ้ำ 100 ครั้งแล้วฉันจะคาดหวังว่าใน 95 กรณีที่พารามิเตอร์ที่แท้จริงจะอยู่ภายในช่วง" เราจะคำนึงถึงขนาดของขนาดตัวอย่าง . ยิ่งขนาดตัวอย่างใหญ่เท่าใดความแปรปรวนก็จะน้อยลงโดยประมาณ ดังนั้นมันจะไม่แตกต่างกันมากและเมื่อเราทำซ้ำขั้นตอน 100 ครั้งเราไม่จำเป็นต้องมีช่วงเวลาที่มีขนาดใหญ่เพื่อให้แน่ใจว่าใน 95 กรณีนั้นพารามิเตอร์จริงอยู่ในช่วงเวลา


โปรดทราบว่าช่วงความมั่นใจเป็นแนวคิดที่ใช้บ่อย
Michael Chernick
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.