ช่วงความมั่นใจมีประโยชน์หรือไม่?


11

ในสถิติที่ใช้บ่อยช่วงความมั่นใจ 95% เป็นขั้นตอนการสร้างช่วงเวลาซึ่งหากทำซ้ำจำนวนครั้งไม่สิ้นสุดจะมีพารามิเตอร์ที่แท้จริง 95% ของเวลา ทำไมถึงมีประโยชน์

ช่วงความเชื่อมั่นมักเข้าใจผิด พวกเขาไม่ใช่ช่วงเวลาที่เราสามารถมั่นใจได้ 95% ว่าพารามิเตอร์นั้นอยู่ใน (ยกเว้นว่าคุณกำลังใช้ช่วงความน่าเชื่อถือแบบเบย์ที่คล้ายกัน) ช่วงเวลาความมั่นใจรู้สึกเหมือนเป็นเหยื่อและสลับมาที่ฉัน

กรณีการใช้งานอย่างหนึ่งที่ฉันคิดได้ก็คือกำหนดช่วงของค่าที่เราไม่สามารถปฏิเสธสมมติฐานว่างได้ว่าพารามิเตอร์คือค่านั้น ค่า p จะไม่ให้ข้อมูลนี้ แต่จะดีกว่าไหม โดยไม่ทำให้เข้าใจผิด?

ในระยะสั้น: ทำไมเราต้องมีช่วงความมั่นใจ? เมื่อตีความอย่างถูกต้องมีประโยชน์อย่างไร?



ช่วงความน่าเชื่อถือแบบเบย์นั้นไม่ใช่ช่วงเวลาที่เราสามารถมั่นใจได้ 95% ว่าพารามิเตอร์มีอยู่
Sextus Empiricus

@MartijnWeterings: เว้นแต่คุณจะแน่ใจ 100% ของคุณก่อนหน้านี้
ซีอาน

@ ซีอานที่ทำงานเมื่อพารามิเตอร์นั้นแน่นอน 100% ที่จะถือว่าเป็นตัวแปรสุ่มและการทดลองก็เหมือนกับการสุ่มตัวอย่างจากการแจกแจงความถี่ร่วมP ( θ , x )นั่นคือคุณใช้กฎ Bayes เป็น: P ( θ | x ) = P ( θ , x ) / P ( x )โดยไม่มีความชัดเจน 'ก่อนหน้า' มันไม่เหมือนกันสำหรับพารามิเตอร์ที่พิจารณาว่าจะได้รับการแก้ไข จากนั้นความเชื่อด้านหลังจะทำให้คุณต้อง 'อัพเดท' การกระจายความถี่ร่วมเก่าของXและθθP(θ,x)P(θ|x)=P(θ,x)/P(x)Xθ. มันค่อนข้างไร้สาระที่จะอ้างว่าได้รับการอัปเดต 'ความเชื่อก่อนหน้า' ซึ่งแน่นอน 100%
Sextus Empiricus

คำตอบ:


10

1αθL(x)U(x)

P(L(X)θU(X)|θ)=1αfor all θΘ.

การย้ายออกนอกกรอบความคิดที่พบบ่อยและการทำให้เกิดความแตกต่างเหนือสำหรับการแจกแจงก่อนหน้านี้จะให้ผลลัพธ์ความน่าจะเป็นที่ขอบ (อ่อนกว่า) ที่สอดคล้องกัน:θ

P(L(X)θU(X))=1α.

เมื่อเราแก้ไขขอบเขตของช่วงความมั่นใจโดยแก้ไขข้อมูลเป็นเราจะไม่สนใจคำแถลงความน่าจะเป็นนี้อีกต่อไปเพราะตอนนี้เราได้แก้ไขข้อมูลแล้ว อย่างไรก็ตามถ้าช่วงความเชื่อมั่นได้รับการปฏิบัติเป็นช่วงเวลาแบบสุ่มเราสามารถสร้างข้อความสั่งความน่าจะเป็นนี้ได้เช่นกับความน่าจะเป็นพารามิเตอร์จะอยู่ภายในช่วง (สุ่ม)X=x 1 - อัลฟ่าθ1αθ

ภายในสถิติผู้ใช้บ่อยๆข้อความสั่งความน่าจะเป็นคือข้อความเกี่ยวกับความถี่สัมพัทธ์ของการทดลองซ้ำหลายครั้ง แต่นั่นเป็นความจริงของคำแถลงความน่าจะเป็นทุกอย่างในกระบวนทัศน์ของผู้ใช้บ่อยดังนั้นหากคำคัดค้านของคุณคือคำสั่งความถี่สัมพัทธ์นั่นไม่ใช่คำคัดค้านที่เฉพาะเจาะจงสำหรับช่วงความมั่นใจ หากเราย้ายออกนอกกรอบความคิดแบบบ่อยๆเราสามารถพูดได้อย่างถูกต้องว่าช่วงความเชื่อมั่นนั้นมีพารามิเตอร์เป้าหมายที่มีความน่าจะเป็นที่ต้องการตราบใดที่เราสร้างคำสั่งความน่าจะเป็นแบบนี้เล็กน้อย (นั่นคือ ในความรู้สึกแบบสุ่ม

ฉันไม่รู้เกี่ยวกับคนอื่น แต่ดูเหมือนว่าฉันจะเป็นผลลัพธ์ความน่าจะเป็นที่ทรงพลังและเหตุผลที่สมเหตุสมผลสำหรับช่วงเวลานี้ ฉันเป็นส่วนหนึ่งของวิธีการแบบเบย์เอง แต่ความน่าจะเป็นที่ได้รับการสนับสนุนช่วงความเชื่อมั่น (ในแง่ของการสุ่ม) เป็นผลลัพธ์ที่ทรงพลังที่ไม่ควรดมกลิ่น


1
"การย้ายออกนอกกรอบความคิดที่บ่อย" นั่นไม่ได้เป็นปัญหาใช่มั้ย โดยทั่วไปเราต้องการช่วงเวลาที่มีค่าจริงของพารามิเตอร์ที่น่าสนใจกับความน่าจะเป็นบางอย่าง ไม่มีการวิเคราะห์บ่อยครั้งที่จะให้สิ่งนั้นกับเราและตีความโดยปริยายอีกครั้งว่าเป็นการวิเคราะห์แบบเบย์ทำให้เกิดความเข้าใจผิด ดีกว่าที่จะตอบคำถามโดยตรงผ่านช่วงเวลาที่น่าเชื่อถือแบบเบย์ มีการใช้สำหรับช่วงความมั่นใจที่คุณกำลังทำการ "ทดลอง" ซ้ำ ๆ เช่นการควบคุมคุณภาพ
Dikran Marsupial

มันไม่ได้เป็นเรื่องของการตีความซ้ำโดยปริยายเป็น Bayesian (หลังจะมีเงื่อนไขในข้อมูลที่จะได้รับหลัง) คำตอบเป็นเพียงการแสดง OP ที่เราสามารถสร้างงบความน่าจะเป็นที่มีประโยชน์เกี่ยวกับช่วงความมั่นใจ สำหรับการคัดค้านโดยทั่วไปในกระบวนทัศน์ของผู้ถี่ถ้วนนั้นเป็นสิ่งที่ดีและดี แต่ไม่ใช่การคัดค้านเฉพาะสำหรับช่วงความมั่นใจ
เบ็น - คืนสถานะโมนิก้า

1
ในขณะที่คุณสามารถดูจากงบน่าจะเป็นข้างต้นเราสามารถรับประกันได้ว่า CI มีพารามิเตอร์ที่มีความน่าจะเป็นบางอย่างเพื่อให้ตราบใดที่เราดูที่นี้เบื้องต้น
เบ็น - คืนสถานะโมนิก้า

1
หากคุณย้ายออกจากกระบวนทัศน์ที่พบบ่อย แต่ไม่ได้ย้ายไปยังกรอบการทำงานแบบเบย์กรอบการทำงานคืออะไร ฉันไม่ได้แสดงคำคัดค้านต่อการใช้บ่อยฉันเชื่อว่าคุณควรใช้กรอบที่ตอบคำถามที่คุณต้องการได้โดยตรง ความมั่นใจและช่วงเวลาที่น่าเชื่อถือตอบคำถามต่าง ๆ
Dikran Marsupial

1
@Dikran: คำสั่งความน่าจะเป็นยืนเป็นลายลักษณ์อักษรและเป็นคำสั่งทางคณิตศาสตร์ที่บริสุทธิ์ ฉันไม่เห็นว่าคุณจะคัดค้านเรื่องนี้ได้อย่างไร
เบ็น - Reinstate Monica

5

ฉันเห็นด้วยกับ @Ben ด้านบนและฉันคิดว่าฉันจะให้ตัวอย่างง่ายๆว่าที่ Bayesian เมื่อเทียบกับช่วงเวลา Frequentist จะมีค่าในสถานการณ์เดียวกัน

ลองนึกภาพโรงงานที่มีไลน์ประกอบแบบขนาน มีค่าใช้จ่ายสูงในการหยุดสายและในเวลาเดียวกันพวกเขาต้องการผลิตสินค้าที่มีคุณภาพ พวกเขามีความกังวลเกี่ยวกับทั้งบวกเท็จและเชิงลบเท็จเมื่อเวลาผ่านไป สำหรับโรงงานมันเป็นกระบวนการเฉลี่ย: ทั้งกำลังและการรับประกันการป้องกันเรื่องที่ผิดพลาด ช่วงความเชื่อมั่นเช่นเดียวกับช่วงความอดทนมีความสำคัญต่อโรงงาน อย่างไรก็ตามเครื่องจักรจะออกไปนอกแนวซึ่งก็คือθΘและอุปกรณ์ตรวจจับจะสังเกตเหตุการณ์ที่เกิดขึ้นจริง ผลลัพธ์โดยเฉลี่ยนั้นสำคัญในขณะที่ผลลัพธ์เฉพาะคือรายละเอียดการดำเนินงาน

ฝั่งตรงข้ามของสิ่งนี้คือลูกค้ารายเดียวที่ซื้อผลิตภัณฑ์เดียวหรือผลิตภัณฑ์จำนวนมาก พวกเขาไม่สนใจคุณสมบัติการทำซ้ำของสายการประกอบ พวกเขาสนใจเกี่ยวกับผลิตภัณฑ์หนึ่งที่พวกเขาซื้อ เราลองนึกภาพของลูกค้าเป็นนาซาและพวกเขาต้องการผลิตภัณฑ์เพื่อตอบสนองข้อกำหนดพูดγΓ. พวกเขาไม่สนใจเกี่ยวกับคุณภาพของชิ้นส่วนที่พวกเขาไม่ได้ซื้อ พวกเขาต้องการช่วงเวลาแบบเบย์บางรูปแบบ นอกจากนี้ความล้มเหลวเพียงครั้งเดียวสามารถฆ่านักบินอวกาศจำนวนมากและค่าใช้จ่ายพันล้านดอลลาร์ พวกเขาจำเป็นต้องรู้ว่าทุกส่วนที่ซื้อตรงตามข้อกำหนด ค่าเฉลี่ยจะเป็นอันตรายถึงตาย สำหรับจรวดแซทเทิร์นวีอัตราข้อบกพร่องหนึ่งเปอร์เซ็นต์จะมีชิ้นส่วนที่บกพร่อง 10,000 ชิ้นในระหว่างเที่ยวบิน Apollo พวกเขาต้องการข้อบกพร่อง 0% ในทุกภารกิจ

คุณกังวลเกี่ยวกับการมีช่วงความมั่นใจเมื่อคุณทำงานในพื้นที่ตัวอย่างขณะที่โรงงานกำลังทำอยู่ มันกำลังสร้างพื้นที่ตัวอย่าง คุณกังวลเกี่ยวกับช่วงเวลาที่น่าเชื่อถือเมื่อคุณกำลังทำงานในพื้นที่พารามิเตอร์เช่นลูกค้าจะทำ หากคุณไม่สนใจเกี่ยวกับการสังเกตภายนอกของคุณแสดงว่าคุณเป็นชาวเบย์ หากคุณสนใจตัวอย่างที่ไม่ได้เห็น แต่เห็นได้แสดงว่าคุณเป็นผู้ใช้บ่อย

คุณมีความกังวลกับการหาค่าเฉลี่ยระยะยาวหรือเหตุการณ์เฉพาะหรือไม่?


NASA ซื้อชิ้นส่วนตามช่วงเวลาที่เบย์จริงหรือไม่ ฉันเข้าใจประเด็นของคุณ แต่พวกเขาทำได้จริงหรือ
Aksakal

@ Aksakal ฉันไม่ทราบ แน่นอนว่า Juran ได้เขียนผลงานที่ยอดเยี่ยมเกี่ยวกับการประกันคุณภาพที่ NASA แต่ฉันจำไม่ได้เลยว่าถ้ามีการพูดคุยเกี่ยวกับกระบวนการทดสอบเนื่องจากเป็นเวลากว่าทศวรรษที่ผ่านมาตั้งแต่ฉันอ่าน ฉันรู้ว่า W Edwards Deming ตรงข้ามกับช่วงความมั่นใจในความโปรดปรานของช่วงเวลาที่เชื่อถือได้ แต่อีกครั้งที่ไม่เกี่ยวข้องโดยตรง ฉันเดาและฉันรู้ว่าคนที่จะรู้ แต่มันก็ไม่สะดวกที่จะถามในขณะนี้คือพวกเขาใช้วิธีการ Frequentist เพราะนั่นคือสิ่งที่คนส่วนใหญ่ได้รับการฝึกฝนมาคุณใช้ค้อนที่คุณมี
เดฟแฮร์ริส

มันเป็นกรณีของ "ค้อน" หรือไม่? บางทีมันอาจจะเกี่ยวข้องกับสิ่งต่าง ๆ ในงานวิศวกรรม?
Aksakal

@ Aksakal ฉันไม่มีคุณสมบัติที่จะเข้าใจว่า
เดฟแฮร์ริส

nαH0:γ>ΓxynαxγΓ

4

โปรดทราบว่าตามคำจำกัดความที่เข้มงวดของช่วงความมั่นใจอาจเป็นไปได้ว่ามันไม่มีความหมายอย่างสมบูรณ์นั่นคือไม่ใช่ข้อมูลเกี่ยวกับพารามิเตอร์ของดอกเบี้ย อย่างไรก็ตามในทางปฏิบัติโดยทั่วไปมีความหมายมาก

[0,1]UminUmaxUmin,UmaxUmin<Umax[0.01,0.011]pp

ในขณะที่ช่วงความมั่นใจส่วนใหญ่ถูกสร้างขึ้นในแบบที่มีประโยชน์มากขึ้น ตัวอย่างเช่นถ้าฉันบอกคุณว่ามันถูกสร้างขึ้นโดยใช้ขั้นตอน Wald ช่วงเราก็รู้ว่า

p^ ˙ N(p,se)

sep^p


2

ช่วงความเชื่อมั่นไม่เพียงมีประโยชน์ แต่จำเป็นในบางสาขาเช่นฟิสิกส์ น่าเสียดายที่เสียงส่วนใหญ่ที่เกี่ยวกับ CIs นั้นมาจาก Bayesians ที่ถูกถกเถียงกันในเรื่องการถกเถียงกันจริงกับผู้ถี่ถ้วนซึ่งมักจะอยู่ในบริบทของ "วิทยาศาสตร์" ทางสังคมและสาขาวิชาอื่น ๆ ที่คล้ายวิทยาศาสตร์

สมมติว่าฉันวัดปริมาณในสาขาฟิสิกส์เช่นค่าไฟฟ้า ฉันมักจะจัดหาด้วยการวัดความไม่แน่นอนของค่าซึ่งมักจะเป็นค่าเบี่ยงเบนมาตรฐาน เนื่องจากในข้อผิดพลาดทางฟิสิกส์มักเป็นแบบเกาส์ซึ่งแปลตรงนี้เป็น CI อย่างไรก็ตามเมื่อข้อผิดพลาดไม่ใช่แบบเกาส์มันจะซับซ้อนเล็กน้อยอินทิกรัลบางส่วนจำเป็นต้องได้รับการประเมินและอื่น ๆ ไม่มีอะไรลึกลับเหมือนปกติ

นี่คือการนำเสนอสั้น ๆ เกี่ยวกับ CI ในฟิสิกส์ของอนุภาคและคำจำกัดความ:

คำแถลงเชิงปริมาณเกี่ยวกับส่วนของเวลาที่ช่วงเวลาดังกล่าวจะมีค่าที่แท้จริงของพารามิเตอร์ในการทดลองซ้ำจำนวนมาก

โปรดทราบว่าในทางฟิสิกส์ "การทดลองซ้ำ ๆ " มักจะมีความหมายตามตัวอักษร: โดยถือว่าคุณสามารถทำการทดลองซ้ำในกระดาษได้และจะสังเกตเศษส่วนนั้น ดังนั้น CI จึงมีความหมายที่แท้จริงสำหรับคุณและเป็นเพียงวิธีในการแสดงข้อมูลเกี่ยวกับความไม่แน่นอนของการวัด ไม่ใช่การทดลองทางความคิดไม่ใช่ความคิดส่วนตัวไม่ใช่ของคุณหรือความรู้สึกของฉันเกี่ยวกับความเป็นไปได้ ฯลฯ นั่นคือสิ่งที่คุณสามารถคิดค้นจากการทดลองและสิ่งที่ฉันควรสังเกตเมื่อทำซ้ำการทดลองของคุณ


1

หัวข้อนี้ได้กลายเป็นประเด็นถกเถียงกันบ่อยครั้งในการอภิปรายประจำเบส์และไม่สามารถแก้ไขได้อย่างง่ายดาย คณิตศาสตร์ในทั้งสองวิธีนั้นมีความมั่นคงดังนั้นมันจึงเป็นเรื่องที่ชอบตามหลักปรัชญาเสมอ การตีความความน่าจะเป็นแบบบ่อยๆตามขีด จำกัด ของความถี่สัมพัทธ์ของเหตุการณ์นั้นได้รับการพิสูจน์โดยกฎหมายที่แข็งแกร่งของคนจำนวนมาก ความถี่สัมพัทธ์ของกิจกรรมจะมาบรรจบกันกับความน่าจะเป็นโดยความน่าจะเป็น 1

ช่วงความเชื่อมั่นบ่อยครั้งนั้นยากที่จะตีความมากกว่าช่วงเวลาที่น่าเชื่อถือแบบเบย์ โดยการรักษาปริมาณที่ไม่รู้จักเป็นตัวแปรสุ่ม Bayesians สามารถยืนยันว่าช่วงเวลาหนึ่งมีปริมาณนั้นด้วยความน่าจะเป็นบางส่วน บ่อยครั้งที่ปฏิเสธที่จะรักษาปริมาณบางอย่างเป็นตัวแปรสุ่มและสมการใด ๆ ที่มีค่าคงที่เท่านั้นที่สามารถเป็นจริงหรือเท็จได้ ดังนั้นเมื่อประเมินค่าคงที่ที่ไม่รู้จักผู้ใช้บ่อยต้องผูกด้วยช่วง RANDOM เพื่อให้มีความน่าจะเป็น แทนที่จะมีหนึ่งช่วงเวลาที่มีตัวแปรสุ่มที่มีความน่าจะเป็นบางอย่างวิธีการของนักเล่นสร้างช่วงเวลาที่เป็นไปได้ที่แตกต่างกันจำนวนมากซึ่งบางส่วนมีค่าคงที่ที่ไม่รู้จัก หากความน่าจะเป็นของการครอบคลุมสูงพอสมควรมันเป็นความเชื่อที่ก้าวกระโดดที่สมเหตุสมผลที่จะยืนยันว่าช่วงเวลาหนึ่งมีค่าคงที่ที่ไม่รู้จัก (หมายเหตุไม่ใช่ "

ชาว Bayesian จะชะงักงันด้วยความเชื่อเช่นเดียวกับการหยุดชะงักในการปฏิบัติที่ไม่ทราบจำนวนซึ่งเป็นตัวแปรสุ่ม วิธีการก่อสร้าง Neyman บ่อยครั้งในความเป็นจริงเปิดเผยปัญหาที่น่าอายกับการกระโดดศรัทธา หากไม่มีการป้องกันอย่างแข็งขัน (ดูเฟลด์แมนและลูกพี่ลูกน้อง 1997 ในแนวทางเดียว) ผลลัพธ์ที่เกิดขึ้นได้ยากอาจสร้างช่วงความเชื่อมั่นที่ว่างเปล่าสำหรับพารามิเตอร์การกระจาย การก้าวกระโดดของศรัทธาเช่นนี้จะไม่มีเหตุผลมากนัก! ฉันเคยเห็น Bayesians สองสามคนใช้ตัวอย่างนั้นเพื่อเยาะเย้ยวิธีการของนักเล่นแร่แปรธาตุในขณะที่ผู้เล่นบ่อย ๆ ตอบโต้ด้วย "ดีฉันยังคงได้รับช่วงเวลาที่ถูกต้องเกือบตลอดเวลา ฉันจะชี้ให้เห็นว่าอับจน / เบย์ประจำไม่สำคัญสำหรับคนส่วนใหญ่ที่ใช้วิธีการของพวกเขา

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.