ช่วงเวลาของความมั่นใจคืออะไร


86

ฉันรู้ว่าช่วงความมั่นใจคืออะไรและอย่างไม่เป็นทางการ อย่างไรก็ตามฉันไม่สามารถคาดศีรษะรายละเอียดสำคัญ ๆ ไว้ได้: อ้างอิงจาก Wikipedia:

ช่วงความเชื่อมั่นไม่ได้คาดการณ์ว่ามูลค่าที่แท้จริงของพารามิเตอร์มีความน่าจะเป็นโดยเฉพาะอย่างยิ่งที่จะอยู่ในช่วงความเชื่อมั่นที่ได้รับข้อมูลจริง

ฉันเคยเห็นจุดที่คล้ายกันที่เกิดขึ้นในหลายแห่งบนเว็บไซต์นี้ คำจำกัดความที่ถูกต้องมากขึ้นจาก Wikipedia ก็คือ:

หากช่วงความมั่นใจถูกสร้างขึ้นในการวิเคราะห์ข้อมูลที่แยกจากกันหลายครั้งของการทดลองซ้ำ (และอาจแตกต่างกัน) การทดลองสัดส่วนของช่วงเวลาดังกล่าวที่มีค่าจริงของพารามิเตอร์จะตรงกับระดับความเชื่อมั่นโดยประมาณ

อีกครั้งฉันได้เห็นจุดที่คล้ายกันที่เกิดขึ้นในหลายแห่งบนเว็บไซต์นี้ ฉันไม่เข้าใจ ถ้าภายใต้การทดลองซ้ำส่วนของช่วงความเชื่อมั่นการคำนวณที่มีความจริงพารามิเตอร์คือแล้วว่าน่าจะเป็นที่สามารถอยู่ในช่วงความเชื่อมั่นคำนวณสำหรับการทดลองที่เกิดขึ้นจริงเป็นอะไรอื่นนอกจาก ? ฉันกำลังมองหาคำตอบต่อไปนี้:( 1 - α ) θ ( 1 - α )θ(1α)θ(1α)

  1. ชี้แจงความแตกต่างระหว่างคำจำกัดความที่ไม่ถูกต้องและคำนิยามที่ถูกต้องด้านบน

  2. คำจำกัดความที่เป็นทางการและแม่นยำของช่วงความมั่นใจที่แสดงให้เห็นอย่างชัดเจนว่าเหตุใดคำจำกัดความแรกจึงไม่ถูกต้อง

  3. ตัวอย่างที่ชัดเจนของกรณีที่คำจำกัดความแรกผิดอย่างน่าทึ่งแม้ว่าโมเดลต้นแบบนั้นจะถูกต้อง


4
โพสต์นี้มีการสนทนาที่ดีเกี่ยวกับปัญหาความมั่นใจในช่วงเวลาที่กำหนดไว้สถิติ . stackexchange.com/questions/2356/ ฉันคิดว่าบทความที่อ้างถึงในโพสต์ช่วยให้บางโรงไฟได้อย่างแม่นยำว่าทำไมคำจำกัดความข้างต้นถูกต้องสำหรับช่วงความมั่นใจ บ่อยครั้งที่ดูว่า CIs จำแนกได้อย่างไรว่าสามารถเข้าใจได้ดีขึ้น
ความน่าจะเป็นเชิง

2
ส่วนหนึ่งของฉันปรบมือให้คำถาม (+1) ส่วนที่แข่งขันต้องการชี้ให้เห็นว่า 1. ผู้บริโภคสถิติส่วนใหญ่ผู้ใช้สถิติในทางปฏิบัติ แต่ไม่ใช้หลักปรัชญาเพื่อให้ประเด็นของพวกเขาในการวิจัยทางเคมีหรือการตลาดจะไม่มีวันเข้าใจสิ่งที่เป็นปัญหาและเรามักจะ อยู่ที่การสูญเสียเพื่ออธิบายผลลัพธ์ 2. แม้แต่นักพิถีพิถันบางคนก็สามารถตกหลุมพรางในการทำงบความน่าจะเป็นเช่นที่เกี่ยวกับช่วงความมั่นใจเมื่อพวกเขาไม่ทำงานกับกลุ่มตัวอย่าง ปัญหาที่ใหญ่กว่ามาก
rolando2

3
@Mario สมมติฐานของคุณไม่เป็นความจริง! จากการทดสอบซ้ำ 100 ครั้งเราคาดหวัง 95 ของ CIs (ไม่ใช่ค่าเฉลี่ย) เพื่อให้มีค่าเฉลี่ยจริง (แต่ไม่ทราบ) CI เป็นแบบสุ่ม แต่ค่าเฉลี่ยประชากรจริงไม่ใช่
whuber

6
มีบทความดีๆจากคัมมิง & ไมลลาร์เด็ต (2549)แสดงว่า 95% ของการจำลองหมายถึงจะไม่ตกอยู่ใน CI ดั้งเดิม แต่มีเพียง 83.4% (พวกเขาเรียกค่านี้ว่า 'เปอร์เซนต์การจับ') เหตุผลก็คือว่ามีสองแหล่งที่มาของความแปรปรวน: A) ความแปรปรวนของเดิมหมายถึงรอบmuและ B) muความแปรปรวนของการจำลองแบบหมายถึงรอบ คนส่วนใหญ่ลืมคำตอบ: CI ดั้งเดิมไม่จำเป็นต้องสร้างขึ้นรอบ ๆmu!
เฟลิกซ์ S

2
ผู้อ่านที่สนใจอาจต้องการดูหัวข้อนี้: เพราะเหตุใด 95% CI จึงไม่ได้หมายถึงโอกาส 95% ที่มีค่าเฉลี่ย
gung

คำตอบ:


26

ฉันพบว่าการทดสอบความคิดนี้มีประโยชน์เมื่อคิดถึงช่วงความมั่นใจ นอกจากนี้ยังตอบคำถามของคุณ 3

Letและ{2} พิจารณาสองข้อสังเกตของสละค่าและสอดคล้องกับข้อสังเกตและของและให้และy_2) แล้วเป็นช่วงความเชื่อมั่น 50% (ตั้งแต่ช่วงเวลารวมถึงถ้าหรือ , แต่ละที่มีความน่าจะเป็น )Y = X + a - 1XU(0,1) Yy1y2x1x2Xyl=นาที(y1,y2)Y=X+a12Yy1y2x1x2Xyl=min(y1,y2)[ y l , y u ] a a x 1 < 1yu=max(y1,y2)[yl,yu]aax1>1x1<12<x21x1>12>x214

แต่ถ้าแล้วเรารู้ว่าน่าจะเป็นช่วงเวลาที่มีคือไม่\ความละเอียดอ่อนคือช่วงความมั่นใจของสำหรับพารามิเตอร์หมายความว่าจุดสิ้นสุดของช่วงเวลา (ซึ่งเป็นตัวแปรสุ่ม) อยู่ด้านข้างของพารามิเตอร์ที่มีความน่าจะเป็นก่อนที่คุณจะคำนวณช่วงเวลาไม่ใช่ความน่าจะเป็นของพารามิเตอร์ การโกหกภายในช่วงเวลาคือหลังจากคุณคำนวณช่วงเวลาแล้ว a11yuyl>12a1 z%z%z%12z%z% z%


3
โปรดทราบว่าเกือบจะแน่นอนดังนั้นช่วงเวลา มีพารามิเตอร์มีความน่าจะเป็นศูนย์ ในความเป็นจริงการโต้แย้งของคุณทำงานถ้าสิ่งที่คุณกำลังประเมินเป็น\[ y l , y u ] a θ = a + 1Y>a[yl,yu]aθ=a+12
ทำ

4
ฉันไม่คิดว่าตัวอย่างเช่นนับนี้ถูกต้องเพราะคุณจะรู้ว่าน่าจะเป็นช่วงเวลาที่มีเป็นหนึ่งหลังจากที่ได้เห็นว่าy_u-y_l>มันสมเหตุสมผลอย่างสมบูรณ์แบบที่ความน่าจะเป็นควรเปลี่ยนหลังจากเราได้รับข้อมูลเพิ่มเติม หากสิ่งที่คุณรู้คือช่วงเวลานั้นเป็นช่วงความมั่นใจ 50% ความน่าจะเป็นยังคงอยู่ที่ 1/2 (แม้ว่ามันจะเป็นความน่าจะเป็นแบบเบย์ไม่ใช่แบบประจำเพราะมันใช้กับเหตุการณ์เฉพาะที่ไม่มีความถี่ในการวิ่งนาน)Y U - Y L > 1 / 2θyuyl>1/2
Dikran Marsupial

1
นี่เป็นตัวอย่างที่ดี แต่ฉันไม่เห็นด้วยอย่างยิ่งกับข้อความของคุณเกี่ยวกับความน่าจะเป็นที่จะเปลี่ยนแปลงก่อนและหลังการคำนวณช่วงความมั่นใจ มันไม่มีความหมายและให้ความรู้สึกว่าคณิตศาสตร์จะสนใจสิ่งที่คุณรู้และสิ่งที่คุณทำไม่ได้ มันไม่ได้ !! คุณมักจะมีที่เป็น{2} นอกจากนี้คุณยังมักจะมีที่เป็น1นั่นไม่ใช่ความขัดแย้งหนึ่งคือความน่าจะเป็นแบบไม่มีเงื่อนไขและอีกความน่าจะเป็นแบบมีเงื่อนไข 1P(a[yl,yu]) P(a[yl,yu]121P(a[yl,yu]|yuyl>12)1
fgp

2
@fgp ใช่อาจเป็นถ้อยคำที่ไม่ดีในส่วนของ Taylor ที่พูดถึงการเปลี่ยนแปลงความน่าจะเป็น ไม่มีการเปลี่ยนแปลงความน่าจะเป็น สิ่งที่อาร์กิวเมนต์แสดงคือวิธีที่ง่ายสำหรับสถานการณ์ที่เกิดขึ้นแสดงให้เห็นถึงความเข้าใจผิดของ CIs นำไปสู่ปัญหาเชิงตรรกะ หากคุณเชื่อว่า CI ที่คุณสังเกตเห็นมีความน่าจะเป็น 50% ที่จะถูกต้อง แต่ก็ไม่สามารถที่จะถูกต้องได้คุณจะเข้าใจว่า CI นั้นผิด
จอห์น

36

มีปัญหามากมายเกี่ยวกับช่วงความมั่นใจ แต่เรามาดูที่ใบเสนอราคา ปัญหาอยู่ที่การตีความที่ผิดพลาดมากกว่าที่จะเป็นเรื่องของความถูกต้อง เมื่อมีคนพูดว่า "พารามิเตอร์มีความน่าจะเป็นเป็นพิเศษ" บางสิ่งพวกเขากำลังคิดว่าพารามิเตอร์นั้นเป็นตัวแปรสุ่ม นี่ไม่ใช่มุมมองของโพรซีเดอร์ช่วงความเชื่อมั่น (ดั้งเดิม) ซึ่งตัวแปรสุ่มคือช่วงเวลาเองและพารามิเตอร์ถูกกำหนดไม่ใช่แบบสุ่ม แต่ไม่ทราบ นี่คือเหตุผลที่งบดังกล่าวถูกโจมตีบ่อยครั้ง

ในทางคณิตศาสตร์ถ้าเราปล่อยให้เป็นโพรซีเดอร์ใด ๆ ที่แม็พ dataกับเซ็ตย่อยของพื้นที่พารามิเตอร์และถ้า (ไม่ว่าค่าของพารามิเตอร์อาจเป็นอะไร) การยืนยันกำหนดเหตุการณ์จากนั้น - ตามคำนิยาม - มันมีความน่าจะเป็นสำหรับค่าใด ๆ เป็นไปได้ของ\เมื่อเป็นขั้นตอนช่วงความมั่นใจด้วยความมั่นใจดังนั้นความน่าจะเป็นนี้ควรจะมีค่าน้อยที่สุด (มากกว่าค่าพารามิเตอร์ทั้งหมด) ที่x = ( x ฉัน ) θ θ T ( x ) ( x ) Pr θ ( ( x ) ) θ ที1 - α 1 - αtx=(xi)θθt(x)A(x)Prθ(A(x))θt1α1α. (ขึ้นอยู่กับเกณฑ์นี้เรามักจะเลือกวิธีการที่เพิ่มประสิทธิภาพของคุณสมบัติเพิ่มเติมบางอย่างเช่นการสร้างช่วงความเชื่อมั่นระยะสั้นหรือสมมาตร แต่นั่นเป็นเรื่องที่แยกจากกัน) กฎข้อที่อ่อนแอของคนจำนวนมากนั้นทำให้คำพูดที่สองเหมาะสม อย่างไรก็ตามนั่นไม่ใช่คำจำกัดความของช่วงความมั่นใจ: มันเป็นเพียงทรัพย์สินที่พวกเขามี

ฉันคิดว่าการวิเคราะห์นี้ได้ตอบคำถาม 1 แสดงให้เห็นว่าหลักฐานของคำถาม 2 ไม่ถูกต้องและทำให้คำถาม 3 moot


3
ขอบคุณที่ให้คำตอบสำหรับคำถามที่ยอดเยี่ยม ฉันขอนำการเปรียบเทียบต่อไปนี้มาอภิปรายเพิ่มเติมได้ไหม สมมติว่าฉันพลิกเหรียญที่ยุติธรรมซ้ำแล้วซ้ำอีก จากนั้น0.50 ตอนนี้ฉันพลิกเหรียญหนึ่งครั้ง แต่ไม่แสดงให้คุณเห็นสิ่งที่ฉันพลิกแล้วฉันถามว่า: "ความน่าจะเป็นที่หัวขึ้นคืออะไร" คุณจะตอบคำถามนั้นอย่างไร P(Head)=.50
Wolfgang

3
อีกวิธีหนึ่งในการใช้วลี: สำหรับผู้ที่ไม่ใช่ชาวเบย์ "สิ่ง" เท่านั้นที่สามารถมีความน่าจะเป็นคือเหตุการณ์ที่เป็นไปได้ - ในแง่ของผลลัพธ์ในอนาคตของการทดลองแบบสุ่ม เนื่องจากพารามิเตอร์นั้นมีค่าคงที่ที่แท้จริงเมื่อคุณมีช่วงเวลาที่มีค่าเฉพาะจึงไม่ใช่เหตุการณ์ที่เป็นไปได้อีกต่อไปไม่ว่าพารามิเตอร์นั้นจะรวมอยู่ในช่วงเวลาหรือไม่ เป็นผลให้คุณสามารถมั่นใจในกระบวนการที่สร้างช่วงเวลา แต่ไม่ได้อยู่ในสองตัวเลขที่เฉพาะเจาะจง
caracal

1
@caracal - เพียงแค่อาหารสำหรับความคิดเป็น "พลิกเหรียญ" ทุกอย่างแท้จริง "สุ่ม"? ถ้าคุณพูดว่า "ใช่" คุณก็จะปฏิเสธความคิดที่ว่าเหรียญที่ออกมาจากหัวเป็นหน้าที่ที่กำหนดขึ้น (แต่ซับซ้อน) ของหลายสิ่ง (พูด - ลม, ความสูง, แรงและมุมของการพลิก, น้ำหนักของเหรียญ ฯลฯ เป็นต้น) .) ฉันคิดว่าสิ่งนี้แสดงให้เห็นถึงสองมาตรฐานของ "การสุ่ม" ที่ใช้กับการคิดตาม CI ข้อมูลได้รับการแก้ไข แต่เราไม่แน่ใจเกี่ยวกับค่าของมัน ( ข้อมูล ergo เป็นแบบสุ่ม ) ในขณะที่พารามิเตอร์ได้รับการแก้ไข แต่เราไม่แน่ใจเกี่ยวกับค่าของมันพารามิเตอร์ Ergo ไม่ได้สุ่ม )
ความน่าจะเป็นทาง

4
@ Wolfgang ฉันไม่เห็นว่าตัวอย่างของคุณเกี่ยวข้องกับช่วงความมั่นใจอย่างไร คุณไม่ขออะไรที่เกี่ยวข้องกับพารามิเตอร์การกระจาย สถานการณ์ของคุณเกี่ยวข้องมากที่สุดกับช่วงเวลาการทำนาย ฉันคิดว่าการสนทนาทั้งหมดอาจมีความสนใจในบริบทนั้น แต่มันไม่ได้อยู่ในหัวข้อเกี่ยวกับช่วงความมั่นใจ
whuber

2
@whuber คำถามที่ว่าใครสามารถสร้างข้อความสั่งความน่าจะเป็นประมาณ 95% CI ที่จับพารามิเตอร์ที่ไม่รู้จักจริงนั้นคล้ายกับคำถามที่ว่าใครสามารถสร้างข้อความประกาศความน่าจะเป็นเกี่ยวกับการพลิกที่เฉพาะเจาะจงได้หรือไม่ ในระยะยาว 95% ของ CIs จะจับพารามิเตอร์ ในระยะยาว 50% ของการโยนเป็นหัว เราสามารถพูดได้หรือไม่ว่ามีโอกาส 95% ที่ CI ที่เฉพาะเจาะจงจับพารามิเตอร์ได้ เราสามารถพูดได้ว่ามีโอกาส 50% ที่หัวจะขึ้นก่อนที่จะมอง? ฉันจะบอกว่าใช่ทั้งสอง แต่บางคนอาจไม่เห็นด้วย
Wolfgang

19

ฉันจะไม่เรียกคำจำกัดความของ CIs ว่าผิด แต่ง่ายต่อการตีความผิดเนื่องจากมีความน่าจะเป็นมากกว่าหนึ่งคำนิยาม CIs ขึ้นอยู่กับคำจำกัดความความน่าจะเป็นต่อไปนี้

(1) ความน่าจะเป็นของข้อเสนอ = สัดส่วนระยะยาวของเวลาที่ข้อเสนอถูกสังเกตว่าเป็นจริงเงื่อนไขในกระบวนการสร้างข้อมูล

ดังนั้นเพื่อให้สามารถใช้แนวคิดในการใช้ CI ได้คุณต้องยอมรับคำจำกัดความความน่าจะเป็นนี้ ถ้าคุณทำไม่ได้ช่วงเวลาของคุณไม่ใช่ CI จากมุมมองเชิงทฤษฎี

นี่คือเหตุผลที่คำจำกัดความใช้สัดส่วนคำและไม่ใช่ความน่าจะเป็นคำเพื่อให้ชัดเจนว่ามีการใช้คำจำกัดความของความน่าจะเป็นแบบ "ความถี่ในระยะยาว"

นิยามทางเลือกหลักของความน่าจะเป็น (ญาณวิทยาหรือความน่าจะเป็นเป็นส่วนขยายของตรรกะการอนุมานหรือเบย์) คือ

(2) ความน่าจะเป็นของข้อเสนอ = เหตุผลระดับความเชื่อที่ว่าข้อเสนอนั้นเป็นเรื่องจริงโดยมีเงื่อนไขเกี่ยวกับสถานะของความรู้

ผู้คนมักจะได้คำจำกัดความทั้งสองนี้อย่างสังหรณ์ใจและใช้การตีความใดก็ตามที่เกิดขึ้นเพื่อดึงดูดสัญชาติญาณของพวกเขา สิ่งนี้สามารถนำคุณเข้าสู่สถานการณ์ที่สับสนทุกประเภท (โดยเฉพาะเมื่อคุณเปลี่ยนจากกระบวนทัศน์หนึ่งไปอีกสถานการณ์หนึ่ง)

ที่ทั้งสองวิธีมักจะนำไปสู่ผลลัพธ์เดียวกันหมายความว่าในบางกรณีเรามี:

ระดับเหตุผลของความเชื่อที่ว่าข้อเสนอนั้นเป็นจริงเงื่อนไขตามสถานะของความรู้ = สัดส่วนระยะยาวของเวลาที่ข้อเสนอถูกสังเกตว่าเป็นจริงเงื่อนไขในกระบวนการสร้างข้อมูล

ประเด็นก็คือมันไม่ได้ครอบคลุมทั่วถึงดังนั้นเราจึงไม่สามารถคาดหวังคำจำกัดความที่แตกต่างกันสองคำเพื่อนำไปสู่ผลลัพธ์เดียวกันเสมอ ดังนั้นเว้นแต่ว่าคุณจะหาวิธีแก้ปัญหาแบบเบย์จริง ๆ แล้วพบว่ามันเป็นช่วงเวลาเดียวกันคุณไม่สามารถให้ช่วงเวลาที่กำหนดโดยการตีความ CI เป็นความน่าจะเป็นที่มีค่าจริง และถ้าคุณทำเช่นนั้นช่วงเวลานั้นไม่ใช่ช่วงความเชื่อมั่น แต่เป็นช่วงเวลาที่น่าเชื่อถือ


2
ฉันไม่เห็นว่าทำไมความน่าจะเป็นของข้อเสนอตามคำจำกัดความที่ 1 ควรเป็นจำนวนตรรกยะ สัดส่วนระยะยาวดูเหมือนจะหมายถึงขีด จำกัด ของสัดส่วนของเวลาที่ข้อเสนอนั้นถูกสังเกตว่าเป็นจริง แต่ละสัดส่วนเป็นจำนวนตรรกยะ แต่ขีด จำกัด อาจไม่ใช่ (โชคดีที่วงเล็บนี้ของคุณดูเหมือนว่าวงที่ดีที่สุดกับส่วนที่เหลือของคำตอบของคุณ.)
Did

3
@ ความสามารถในการตอบกลับนี้ดูเหมือนว่าจะทำให้เราออกไปสัมผัสกันในทางที่ไม่สร้างสรรค์มาก ความน่าจะเป็นและสัดส่วนที่เท่ากันนั้นเป็นรูปแบบหนึ่งของความสับสนแบบออนโทโลยีซึ่งคล้ายกับการเปรียบเทียบอุณหภูมิกับระดับของปรอทในเทอร์โมมิเตอร์: อันหนึ่งเป็นโครงสร้างทางทฤษฎีและอีกอันหนึ่งเป็นปรากฏการณ์ทางกายภาพที่ใช้วัด มีการอภิปรายเรื่องนี้ที่บางส่วนเป็นstats.stackexchange.com/questions/1525/...
whuber

@Didier - ถูกต้องจริง ๆ แล้วลำดับของ , ซึ่งเป็นเงื่อนไขเชิงเหตุผลที่มีขีด จำกัด ไม่ลงตัว ฉันได้ลบคำพูดนี้ ขอบคุณที่นำสิ่งนี้มา xn=r2xn1+xn12r
ความน่าจะเป็นที่เป็นไปได้

6
@whuber - ประเด็นเกี่ยวข้องกับการนำขึ้นมาเพราะเป็นความเข้าใจผิดที่แม่นยำนี้ซึ่งนำผู้คนไปตีความ CIs ในทางที่ผิด ความน่าจะเป็นที่สับสนกับ "ระดับความเชื่อตามเหตุผล" ไม่สอดคล้องกับกระบวนทัศน์ที่พบบ่อย นี่คือสิ่งที่เกิดขึ้นเมื่อคุณใช้ CIs หมายถึง "ความน่าจะเป็นของมูลค่าที่แท้จริงอยู่ในช่วงเวลา" ซึ่งเป็นสิ่งที่ @ dsimcha กำลังทำอยู่ในคำถาม
ความน่าจะเป็นที่เป็นไปได้

1
@probability ขอบคุณสำหรับคำอธิบาย ฉันเข้าใจคำตอบของคุณว่าสอดคล้องกับคำนิยามของ "ความน่าจะเป็น = สัดส่วน" ในความเป็นจริงการอ่านอย่างใกล้ชิดยังคงแนะนำว่านี่คือสิ่งที่คุณกำลังพูดในย่อหน้าที่สามแม้ว่าความคิดเห็นของคุณจะแสดงให้เห็นว่าสิ่งนี้เป็นความเข้าใจผิด คุณอาจต้องการชี้แจงประเด็นนี้
whuber

6

RA Fisher มีเกณฑ์สำหรับประโยชน์ของช่วงความเชื่อมั่น: CI ไม่ควรยอมรับ "ชุดย่อยที่ระบุตัวตน" ซึ่งบ่งบอกถึงระดับความมั่นใจที่แตกต่างกัน ในตัวอย่างส่วนใหญ่ (ถ้าไม่ใช่ทั้งหมด) เรามีกรณีที่มีชุดย่อยที่ระบุได้ซึ่งมีความน่าจะเป็นของการครอบคลุมที่แตกต่างกัน

ในกรณีเหล่านี้คุณสามารถใช้ช่วงเวลาเครดิต Bayesian เพื่อระบุความรู้สึกส่วนตัวของตำแหน่งพารามิเตอร์หรือคุณสามารถกำหนดช่วงเวลาที่น่าจะเป็นเพื่อสะท้อนความไม่แน่นอนสัมพัทธ์ในพารามิเตอร์ได้รับข้อมูล

ตัวอย่างเช่นกรณีหนึ่งที่ดูเหมือนว่าไม่มีข้อโต้แย้งที่ค่อนข้างชัดเจนคือช่วงความมั่นใจปกติแบบ 2 ด้านสำหรับค่าเฉลี่ยประชากร สมมติว่าการสุ่มตัวอย่างจากประชากรปกติด้วย std. ที่กำหนด 95% CI ยอมรับว่าไม่มีชุดย่อยที่สามารถระบุได้ซึ่งจะให้ข้อมูลเพิ่มเติมเกี่ยวกับพารามิเตอร์ สิ่งนี้สามารถเห็นได้จากข้อเท็จจริงที่ว่าค่าเฉลี่ยตัวอย่างคือสถิติที่เพียงพอในฟังก์ชันความน่าจะเป็น - นั่นคือฟังก์ชันความน่าจะเป็นอิสระจากค่าตัวอย่างแต่ละค่าเมื่อเราทราบค่าเฉลี่ยตัวอย่าง

เหตุผลที่เรามีความเชื่อมั่นส่วนตัวใด ๆ ใน 95% สมมาตร CI สำหรับค่าเฉลี่ยปกติเกิดขึ้นน้อยกว่าจากความน่าจะเป็นความครอบคลุมที่ระบุไว้และอื่น ๆ จากความจริงที่ว่า 95% CI สมมาตรสำหรับค่าเฉลี่ยปกติคือช่วงเวลา ค่าพารามิเตอร์ภายในช่วงเวลานั้นมีโอกาสสูงกว่าค่าพารามิเตอร์ใด ๆ ที่อยู่นอกช่วงเวลา อย่างไรก็ตามเนื่องจากความน่าจะเป็นไม่ใช่ความน่าจะเป็น (ในแง่ความถูกต้องในระยะยาว) จึงเป็นเกณฑ์ที่เป็นอัตวิสัยมากกว่า (เช่นเดียวกับการใช้แบบเบส์ก่อนและโอกาส) โดยรวมแล้วมีช่วงเวลามากมายสำหรับค่าเฉลี่ยปกติที่มีความน่าจะเป็นครอบคลุม 95% แต่มีเพียง CI แบบสมมาตรเท่านั้นที่มี plausbiltiy ที่ใช้งานง่ายที่เราคาดหวังจากการประมาณช่วงเวลา

ดังนั้นเกณฑ์ของ RA Fisher บ่งบอกว่าความน่าจะเป็นของความครอบคลุมควรเทียบเคียงกับความเชื่อมั่นทางอัตนัยเฉพาะเมื่อมันยอมรับว่าไม่มีส่วนย่อยที่สามารถระบุตัวตนเหล่านี้ได้ หากเซตย่อยมีอยู่ความน่าจะครอบคลุมจะเป็นไปตามเงื่อนไขในค่าจริงของพารามิเตอร์ที่อธิบายถึงชุดย่อย ในการรับช่วงเวลาด้วยระดับความเชื่อมั่นที่ใช้งานง่ายคุณจะต้องกำหนดช่วง estiamte ในสถิติเสริมที่เหมาะสมที่ช่วยระบุชุดย่อย หรือคุณสามารถหันไปใช้แบบจำลองการกระจาย / การผสมซึ่งโดยธรรมชาติจะนำไปสู่การตีความพารามิเตอร์เป็นตัวแปรสุ่ม (หรือสถิติเบย์) หรือคุณสามารถคำนวณความน่าจะเป็นของโปรไฟล์ / เงื่อนไข / ขอบภายใต้กรอบความน่าจะเป็น ไม่ว่าจะด้วยวิธีใดคุณละทิ้งความหวังใด ๆ ที่เกิดขึ้นพร้อมกับความน่าจะเป็นที่ตรวจสอบได้อย่างเป็นกลางว่าถูกต้อง

หวังว่านี่จะช่วยได้


1
(+1) วิธีหนึ่งในการปรับความสมมาตร CI แบบสมมาตรคือการลดความยาวที่คาดไว้ ในที่สุดที่เพิ่งผลักดันตัวตนกลับไปที่ตัวเลือกความยาวเป็นฟังก์ชันการสูญเสียในขั้นตอนการตัดสินใจ: แต่นั่นเป็นอัตนัยประเภท "ดี" (เพราะมันทำให้บทบาทของวัตถุประสงค์การวิเคราะห์ของเราในการเลือกกระบวนการทางสถิติของเรา) มากกว่า "ตัวตนที่ไม่ดี" ซึ่งฟังดูคล้ายกับคำเยินยอ
whuber

5

จากมุมมองเชิงทฤษฎีคำถามที่ 2 และ 3 ตั้งอยู่บนสมมติฐานที่ไม่ถูกต้องซึ่งคำจำกัดความนั้นผิด ดังนั้นฉันจึงเห็นด้วยกับคำตอบของ @ whuber ในส่วนนั้นและ @ whuber คำตอบสำหรับคำถามที่ 1 ไม่ต้องการข้อมูลเพิ่มเติมใด ๆ จากฉัน

อย่างไรก็ตามจากมุมมองเชิงปฏิบัติมากขึ้นช่วงความเชื่อมั่นสามารถกำหนดได้ง่าย (ความน่าจะเป็นของการมีค่าจริง) เมื่อมันเป็นตัวเลขที่เหมือนกันกับช่วงเวลาที่น่าเชื่อถือ Bayesian ขึ้นอยู่กับข้อมูลเดียวกัน (เช่นที่ไม่ใช่ข้อมูลก่อน)

แต่สิ่งนี้ค่อนข้างน่าประหลาดใจสำหรับผู้ต่อต้านชาว Bayesian ที่แข็งกร้าวเพราะในการตรวจสอบเงื่อนไขเพื่อให้การตีความ CI ของเขา / เธอต้องการที่จะให้มันพวกเขาจะต้องทำงานด้วยวิธีการแก้ปัญหาแบบเบส์

ตัวอย่างที่ง่ายที่สุดคือช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยปกติที่มีความแปรปรวนและหลังช่วงเวลาที่เชื่อถือได้2}¯ x ± σ Z α / 2 1 - α ¯ x ± σ Z α / 21αx¯±σZα/21αx¯±σZα/2

ฉันไม่แน่ใจในเงื่อนไขอย่างแน่นอน แต่ฉันรู้ว่าสิ่งต่อไปนี้มีความสำคัญต่อการตีความ CIs ที่เข้าใจง่าย:

1) มีสถิติ Pivot ซึ่งมีการกระจายที่เป็นอิสระจากพารามิเตอร์ (ทำ pivots ที่แน่นอนอยู่นอกการแจกแจงปกติและไคสแควร์?)

2) ไม่มีพารามิเตอร์ที่น่ารำคาญ (ยกเว้นในกรณีของสถิติที่สำคัญซึ่งเป็นหนึ่งในวิธีที่แน่นอนไม่กี่คนที่มีการจัดการกับพารามิเตอร์รำคาญเมื่อทำ CIs)

3) มีสถิติเพียงพอสำหรับพารามิเตอร์ของดอกเบี้ยและช่วงความมั่นใจใช้สถิติที่เพียงพอ

4) การกระจายตัวตัวอย่างของสถิติที่เพียงพอและการกระจายหลังมีความสมมาตรระหว่างสถิติที่เพียงพอและพารามิเตอร์ ในกรณีปกติการกระจายการสุ่มตัวอย่างความสมมาตรอยู่ในในขณะที่{n}})(μ|¯x,σ)N(¯x,σ(x¯|μ,σ)N(μ,σn)(μ|x¯,σ)N(x¯,σn)

เงื่อนไขเหล่านี้มักจะยากที่จะค้นหาและโดยปกติแล้วจะเร็วกว่าในการหาช่วงเวลาของ Bayesian และเปรียบเทียบมัน แบบฝึกหัดที่น่าสนใจอาจลองตอบคำถามว่า "เพราะอะไรคือ CI ของฉันก่อนหน้านี้ด้วย คุณอาจค้นพบข้อสันนิษฐานที่ซ่อนเร้นเกี่ยวกับขั้นตอน CI ของคุณโดยดูที่นี่ก่อน


1
(+1) มีคนเช่นนี้ว่าเป็น "แอนตี้ - เบย์" หรือไม่? :-)
whuber

6
@whuber นี่คือหนึ่ง และนี่คือนักเศรษฐศาสตร์ที่ร่วมมือกับเธอเกี่ยวกับทุนการศึกษาในปรัชญาของสถิติ
Cyan

1
ขอบคุณ! นั่นเป็นหัวข้อที่น่าสนใจอย่างยิ่งในปรัชญาของความน่าจะเป็นและสถิติที่ฉันไม่รู้
whuber

1
คุณเขียนพลาดหรือไม่ x¯±zα/2σnn
qazwsx

3

นี่คือสิ่งที่อาจเข้าใจยาก:

  • ถ้าโดยเฉลี่ย 95% ของช่วงความมั่นใจทั้งหมดจะมีพารามิเตอร์
  • และฉันมีช่วงความมั่นใจหนึ่งช่วง
  • ทำไมความน่าจะเป็นที่ช่วงเวลานี้ไม่รวมพารามิเตอร์ด้วย 95%

ช่วงความมั่นใจเกี่ยวข้องกับขั้นตอนการสุ่มตัวอย่าง หากคุณใช้ตัวอย่างจำนวนมากและคำนวณช่วงความมั่นใจ 95% สำหรับแต่ละตัวอย่างคุณจะพบว่า 95% ของช่วงเวลาเหล่านั้นมีค่าเฉลี่ยประชากร

สิ่งนี้มีประโยชน์สำหรับแผนกคุณภาพอุตสาหกรรม พวกนั้นใช้ตัวอย่างจำนวนมากและตอนนี้พวกเขามีความมั่นใจว่าการประมาณส่วนใหญ่ของพวกเขาจะใกล้เคียงกับความเป็นจริง พวกเขารู้ว่า 95% ของการประมาณการของพวกเขาค่อนข้างดี แต่พวกเขาไม่สามารถพูดได้เกี่ยวกับการประมาณการที่เฉพาะเจาะจง

เปรียบเทียบสิ่งนี้กับลูกเต๋ากลิ้ง: ถ้าคุณจะหมุน 600 (ยุติธรรม) ลูกเต๋าคุณจะขว้าง 6 ชิ้นเท่าไหร่? การคาดเดาที่ดีที่สุดของคุณคือ * 600 = 10016

อย่างไรก็ตามถ้าคุณโยน ONE ตายไปมันไม่มีประโยชน์ที่จะพูดว่า: "มีความน่าจะเป็น 1/6 หรือ 16.6% ที่ตอนนี้ฉันได้โยน 6 ไปแล้ว" ทำไม? เพราะความตายแสดงให้เห็นว่าทั้ง 6 หรือตัวเลขอื่น ๆ คุณได้โยน 6 หรือไม่ ดังนั้นน่าจะเป็น 1 หรือ 0. น่าจะไม่สามารถ{6}16

เมื่อถูกถามก่อนโยนสิ่งที่น่าจะเป็นของการขว้างด้วย 6 กับ ONE จะเป็นไปได้ Bayesian จะตอบว่า " " (จากข้อมูลก่อนหน้านี้: ทุกคนรู้ว่ามี 6 ด้านและมีโอกาสเท่าเทียมกัน ของการตกอยู่ทั้งสองอย่าง), แต่ผู้ใช้บ่อยจะพูดว่า "ไม่มีความคิด" เพราะการใช้บ่อยนั้นมีพื้นฐานมาจากข้อมูลไม่ใช่จากนักบวชหรือข้อมูลภายนอกใด ๆ16

ในทำนองเดียวกันหากคุณมีเพียง 1 ตัวอย่าง (เช่น 1 ช่วงความมั่นใจ) คุณไม่มีทางพูดได้ว่าค่าเฉลี่ยประชากรนั้นอยู่ในช่วงเวลานั้น หมายความว่า (หรือพารามิเตอร์ใด ๆ ) อยู่ในนั้นหรือไม่ ความน่าจะเป็นคือ 1 หรือ 0

นอกจากนี้มันไม่ถูกต้องที่ค่าภายในช่วงความเชื่อมั่นมีแนวโน้มมากกว่าที่อยู่นอกนั้น ฉันทำภาพประกอบเล็ก ๆ ทุกอย่างวัดเป็น° C โปรดจำไว้ว่าน้ำค้างที่ 0 ° C และเดือดที่ 100 ° C

กรณี: ในทะเลสาบน้ำเย็นเราต้องการประมาณอุณหภูมิของน้ำที่ไหลต่ำกว่าน้ำแข็ง เราวัดอุณหภูมิใน 100 ตำแหน่ง นี่คือข้อมูลของฉัน:

  • 0.1 ° C (วัดใน 49 แห่ง)
  • 0.2 ° C (เช่นใน 49 แห่ง)
  • 0 ° C (ใน 1 ตำแหน่งนี่เป็นเพียงน้ำที่จะแช่แข็ง);
  • 95 ° C (ในที่เดียวมีโรงงานที่ทิ้งน้ำร้อนมากในทะเลสาบ) โดยผิดกฎหมาย
  • อุณหภูมิเฉลี่ย: 1.1 ° C;
  • ค่าเบี่ยงเบนมาตรฐาน: 1.5 ° C;
  • 95% -CI: (-0.8 ° C ...... + 3.0 ° C)

อุณหภูมิที่อยู่ในช่วงความเชื่อมั่นนี้ไม่น่าจะสูงไปกว่าอุณหภูมิภายนอก อุณหภูมิเฉลี่ยของน้ำที่ไหลในทะเลสาบนี้ไม่สามารถเย็นกว่า 0 ° C ไม่เช่นนั้นจะไม่ใช่น้ำ แต่เป็นน้ำแข็ง ส่วนหนึ่งของช่วงความมั่นใจนี้ (กล่าวคือส่วนจาก -0.8 ถึง 0) จริง ๆ แล้วมีความน่าจะเป็น0%ที่มีพารามิเตอร์จริง

โดยสรุป: ช่วงความเชื่อมั่นเป็นแนวคิดที่พบบ่อยและดังนั้นจึงขึ้นอยู่กับความคิดของกลุ่มตัวอย่างซ้ำ หากนักวิจัยหลายคนจะนำตัวอย่างจากทะเลสาบนี้และหากนักวิจัยเหล่านั้นทั้งหมดจะคำนวณช่วงความมั่นใจ 95% ของช่วงเวลาเหล่านั้นจะมีพารามิเตอร์ที่แท้จริง แต่สำหรับหนึ่งช่วงเวลาความเชื่อมั่นเดียวมันเป็นไปไม่ได้ที่จะบอกว่ามันมีแนวโน้มว่ามันจะมีพารามิเตอร์จริง


1
อย่าสับสนกับความจริงที่ว่าสถิติบ่อยครั้งไม่ได้วัดความเชื่อกับบุคคลที่มีความเชื่อก่อนหน้าและอัปเดตพวกเขา ความแตกต่างไม่ใช่ว่าคนที่มีนิสัยเป็นคนโง่ที่ไม่มีความรู้นอกข้อมูลหรือไม่ แต่สถิติที่ใช้บ่อยนั้นเป็นตัวกำหนดมาตรการโดยตรงของรัฐความเชื่อ ผู้ใช้บ่อยต้องอัพเดตความเชื่อของตนตามการทดสอบ CIs ฯลฯ มิฉะนั้นระบบทั้งหมดของพวกเขาจะไม่ทำงานเพราะทุกอย่างขึ้นอยู่กับการตัดสินใจ
John

2

โอเคฉันรู้ว่าเมื่อคุณคำนวณช่วงความมั่นใจ 95% สำหรับพารามิเตอร์โดยใช้วิธีการแบบดั้งเดิมบ่อยครั้งก็ไม่ได้หมายความว่ามีความน่าจะเป็น 95% ที่พารามิเตอร์อยู่ภายในช่วงเวลานั้น และยัง ... เมื่อคุณเข้าใกล้ปัญหาจากมุมมองแบบเบย์และคำนวณช่วงเวลาที่น่าเชื่อถือ 95% สำหรับพารามิเตอร์คุณจะได้รับ (สมมติว่าไม่มีข้อมูลก่อนหน้านี้) ในช่วงเวลาเดียวกับที่คุณใช้วิธีแบบดั้งเดิม ดังนั้นถ้าฉันใช้สถิติแบบดั้งเดิมเพื่อคำนวณช่วงความมั่นใจ 95% สำหรับ (พูด) ค่าเฉลี่ยของชุดข้อมูลมันเป็นความจริงที่มีความน่าจะเป็น 95% ที่พารามิเตอร์อยู่ในช่วงเวลานั้น


5
ไม่ว่าคุณจะได้รับผลลัพธ์แบบเดียวกันโดยใช้ช่วงความเชื่อมั่นบ่อยครั้งและช่วงเวลาที่น่าเชื่อถือแบบเบย์นั้นขึ้นอยู่กับปัญหา สิ่งสำคัญในวิชาคณิตศาสตร์และวิทยาศาสตร์คือเมื่อคุณพูดถูกคุณจะต้องถูกด้วยเหตุผลที่ถูกต้อง!
Dikran Marsupial

4
หากคุณ "ใช้สถิติแบบดั้งเดิมเพื่อคำนวณช่วงความมั่นใจ 95% สำหรับ [พารามิเตอร์]" ถ้าคุณให้เหตุผลอย่างสม่ำเสมอมันไม่มีความหมายที่จะอ้างถึง "ความน่าจะเป็นที่พารามิเตอร์ตั้งอยู่ในช่วงเวลานั้น" เมื่อคุณพูดถึงความน่าจะเป็นนั้นคุณได้เปลี่ยนแบบจำลองทางสถิติของสถานการณ์ ในโมเดลใหม่โดยที่พารามิเตอร์เป็นแบบสุ่มมันไม่ถูกต้องในการคำนวณ CI โดยใช้วิธีการที่ใช้บ่อย การได้รับคำตอบที่ถูกต้องด้วยวิธีนี้ในบางสถานการณ์เป็นเรื่องที่น่าสนใจ แต่ไม่ได้แสดงให้เห็นถึงความสับสนทางความคิดที่อยู่ภายใต้
whuber

4
@whuber - หลักฐานของคุณ "... หากคุณให้เหตุผลอย่างสม่ำเสมอ ... " มีผลมาจากทฤษฎีบทเก่าของ Cox ที่ดี มันบอกว่าถ้าคุณให้เหตุผลอย่างสม่ำเสมอวิธีการแก้ปัญหาของคุณจะต้องเทียบเท่ากับคณิตศาสตร์แบบเบย์ ดังนั้นเมื่อได้รับหลักฐานนี้ CI จะต้องเทียบเท่ากับช่วงเวลาที่น่าเชื่อถือและการตีความว่าเป็นความน่าจะเป็นที่ถูกต้อง และในเบย์มันไม่ใช่พารามิเตอร์ที่มีการแจกแจงมันคือความไม่แน่นอนเกี่ยวกับพารามิเตอร์นั้นที่มีการแจกแจง
ความน่าจะเป็นทางการที่

2
... ต่อไป ... ดังนั้นเราจึงสามารถเล่นเกมที่โง่ ๆ ของฉันคือ Bayesian "Prob พารามิเตอร์นั้นอยู่ในช่วงเวลา" ฉันเป็น "prob ที่ช่วงเวลาที่ครอบคลุมพารามิเตอร์" เป็นประจำฉันเป็น Bayesian ... , ฉันเป็นคนถี่ถ้วน, ... , ฉันเป็นคน Bayesian ... , ฉันเป็นคนธรรมดา, ..... ตลอดเวลาที่จำนวนการคำนวณจริงไม่เคยเปลี่ยนแปลง
ความน่าจะเป็นที่จะ

2

คุณจะถามเกี่ยวกับความเชื่อมั่น frequentist คำจำกัดความ (โปรดทราบว่าไม่มีการอ้างอิง 2 ข้อของคุณเป็นคำจำกัดความ! Just just statement ซึ่งทั้งคู่ถูกต้อง) คือ:

หากฉันทำการทดลองนี้ซ้ำหลายครั้งให้รุ่นที่ติดตั้งพร้อมกับค่าพารามิเตอร์นี้ใน 95% ของการทดลองค่าประมาณของพารามิเตอร์จะตกภายในช่วงเวลานี้

ดังนั้นคุณมีโมเดล (สร้างขึ้นโดยใช้ข้อมูลที่คุณสังเกตเห็น) และพารามิเตอร์โดยประมาณ จากนั้นหากคุณสร้างชุดข้อมูลสมมุติตามโมเดลและพารามิเตอร์นี้พารามิเตอร์ที่ประมาณไว้จะอยู่ภายในช่วงความมั่นใจ

ดังนั้นในความเป็นจริงวิธีการที่ใช้กันบ่อยครั้งนี้ใช้โมเดลและพารามิเตอร์ที่ประเมินตามที่ได้รับการแก้ไขตามที่กำหนดและปฏิบัติกับข้อมูลของคุณอย่างไม่แน่นอน - เป็นตัวอย่างแบบสุ่มของข้อมูลอื่น ๆ ที่เป็นไปได้มากมาย

นี้เป็นเรื่องยากมากที่จะแปลความหมายและนี้มักจะถูกนำมาใช้เป็นอาร์กิวเมนต์สำหรับสถิติแบบเบย์ (เป็นซึ่งผมคิดว่าอาจจะเป็นปัญหาบางครั้งเล็ก ๆ น้อย ๆ . สถิติแบบเบย์บนมืออื่น ๆ ที่ต้องใช้ข้อมูลของคุณได้รับการแก้ไขและถือว่าพารามิเตอร์เช่นความไม่แน่นอน. the คชกรรมช่วงเวลาที่มีความน่าเชื่อถืออยู่ จากนั้นใช้งานง่ายตามที่คุณคาดหวัง: ช่วงเวลาที่น่าเชื่อถือแบบเบย์คือช่วงเวลาโดยที่ 95% ของค่าพารามิเตอร์จริงตั้งอยู่

แต่ในทางปฏิบัติหลายคนตีความช่วงเวลาความมั่นใจบ่อยครั้งในแบบเดียวกับช่วงเวลาที่น่าเชื่อถือแบบเบย์และนักสถิติหลายคนไม่คิดว่านี่เป็นปัญหาใหญ่ - แม้ว่าพวกเขาทุกคนรู้ว่ามันไม่ถูกต้อง 100% นอกจากนี้ในทางปฏิบัติความเชื่อมั่น / ช่วงเวลาที่เชื่อถือได้ / เบย์ประจำจะไม่แตกต่างกันมากนักเมื่อใช้เบย์เซอร์ที่ไม่เป็นทางการ


-1 "คำจำกัดความ" ของคุณดูเหมือนจะไม่ถูกต้องอย่างน้อยหนึ่งครั้งในการอ่าน CI ถูกสร้างเพื่อให้ครอบคลุมความจริงพารามิเตอร์ที่มีความน่าจะเป็น1-มันไม่ได้เป็นเงื่อนไขในรูปแบบเฉพาะหรือวิธีการปรับพารามิเตอร์ บางทีฉันอาจกำลังอ่านคำจำกัดความผิด แต่ฉันใช้ "โมเดลที่ติดตั้งพร้อมค่าพารามิเตอร์นี้" เพื่ออ้างถึงการประมาณค่าพารามิเตอร์ปัจจุบันของคุณ หากนั่นไม่ใช่วิธีที่คุณตั้งใจคุณอาจจะอธิบายประเด็นนี้ให้ชัดเจน 1 - α1α1α
whuber

@ โฮเบอร์โอเคฉันรับไปแล้ว แต่ถ้าคุณบอกว่าคำจำกัดความของฉันไม่ถูกต้องโปรดโพสต์คำจำกัดความแบบเต็มของคุณว่า CI คืออะไร
อยากรู้อยากเห็น

ฉันได้ชี้แจงความคิดเห็นของฉันโทมัสเพราะมันเกิดขึ้นกับฉันฉันอาจจะอ่านคำนิยามของคุณในแบบที่คุณไม่ได้ตั้งใจ Kiefer การอนุมานทางสถิติเบื้องต้นเขียนว่า "[T] ผลลัพธ์ของการทดลองคือ ... [S] ใช้ขั้นตอนใช้ในการประมาณและค่าที่แท้จริงของคือ ... [T] ปริมาณเขา .. . หมายเลขเรียกว่าค่าสัมประสิทธิ์ความเชื่อมั่นของกระบวนการ ...เรียกว่าT = [ L , U ] φ ( θ ) θ θ 0 γ T ( θ 0 ) = Pr θ 0 { L ( X ) φ ( θ 0 ) U ( X ) }Xt=[L,U]ϕ(θ)θθ0γt(θ0)=Prθ0{L(X)ϕ(θ0)U(X)}γ¯t=infθΩγt(θ)ttช่วงความเชื่อมั่น "
whuber

@whuber นิยามของคุณไม่สามารถเข้าใจได้จริงๆสำหรับฉันและฉันก็กลัวคนส่วนใหญ่เช่นกัน :) และใช่ฉันหมายถึงการประมาณการในปัจจุบันเนื่องจากบ่อยครั้งที่ได้รับการประมาณพารามิเตอร์ตามที่กำหนดและข้อมูลเป็นแบบสุ่มตรงข้ามกับแบบเบย์
อยากรู้อยากเห็น

3
ฉันคิดว่าปัญหาหลักในคำจำกัดความของคุณอยากรู้อยากเห็นคือ "... มูลค่าโดยประมาณของพารามิเตอร์จะลดลงภายในช่วงเวลา" ไม่ใช่พารามิเตอร์โดยประมาณ แต่เป็นพารามิเตอร์ที่ไม่รู้จักที่แน่นอน และจะไม่ตกอยู่ในช่วงเวลา แต่ช่วงเวลาจะเลื่อนไปมาและ 95% ของเวลาจะจับพารามิเตอร์
John

2

สมมติว่าเราอยู่ในสถานการณ์ที่เรียบง่าย คุณมีพารามิเตอร์ที่ไม่รู้จักและตัวประมาณที่มีความไม่แน่นอนประมาณ 1 (อย่างไม่เป็นทางการ) คุณคิดว่า (อย่างไม่เป็นทางการ)ควรอยู่ในบ่อยที่สุดθTθθ[T1;T+1]

ในการทดลองจริงคุณสังเกตtT=12

มันเป็นเรื่องธรรมดาที่จะถามคำถาม "ด้วยสิ่งที่ฉันเห็น ( ) ความน่าจะเป็นคืออะไร" ศาสตร์:12) ทุกคนถามคำถามนี้โดยธรรมชาติ ทฤษฎีช่วงความมั่นใจควรตอบคำถามนี้อย่างมีเหตุผล แต่มันก็ไม่ได้T=12θ[11;13]P(θ[11;13]|T=12)

สถิติแบบเบย์ตอบคำถามนี้ ในสถิติคชกรรมจริงๆคุณสามารถคำนวณ12) แต่คุณต้องสันนิษฐานก่อนว่าคือการกระจายสำหรับก่อนที่จะทำการทดลองและการสังเกตTตัวอย่างเช่น :P(θ[11;13]|T=12)θT

  • สมมติว่ามีชุดการแจกจ่ายก่อนหน้าในθ[0;30]
  • ทำการทดลองนี้หาT=12
  • ใช้สูตรเบย์:P(θ[11;13]|T=12)=0.94

แต่ในสถิติ frequentist ไม่มีอะไรก่อนและทำให้เหมือนไม่อยู่ แต่นักสถิติพูดอะไรแบบนี้: "ไม่ว่าจะเป็นอะไรความน่าจะเป็นที่คือ " ทางคณิตศาสตร์: "P(θ...|T...)θθ[T1;T+1]0.95θ,P(θ[T1;T+1]|θ)=0.95

ดังนั้น:

  • Bayesian:สำหรับT = 12P(θ[T1;T+1]|T)=0.94T=12
  • ผู้ใช้บ่อย:θ,P(θ[T1;T+1]|θ)=0.95

คำสั่ง Bayesian นั้นเป็นธรรมชาติมากกว่า บ่อยครั้งที่ข้อความที่ใช้บ่อยถูกตีความอย่างผิด ๆ ตามคำแถลงแบบเบย์ (โดยสมองมนุษย์ปกติที่ไม่ได้ฝึกฝนสถิติมานานหลายปี) และจริงๆแล้วหนังสือสถิติหลายเล่มไม่ได้ชี้ชัดมาก

และในทางปฏิบัติ?

ในสถานการณ์ปกติจำนวนมากความจริงก็คือความน่าจะเป็นที่ได้รับจากวิธีการแบบประจำและแบบเบย์อยู่ใกล้มาก ดังนั้นการสร้างความสับสนให้กับคำสั่งประจำของชาวเบย์ทำให้เกิดความสับสนเล็กน้อย แต่ "ปรัชญา" มันแตกต่างกันมาก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.