ทำไมคนเราถึงใช้ความมั่นใจแบบสุ่มหรือช่วงเวลาที่เชื่อถือได้


16

เมื่อเร็ว ๆ นี้ฉันกำลังอ่านกระดาษที่รวมการสุ่มในความมั่นใจและช่วงเวลาที่น่าเชื่อถือและฉันสงสัยว่านี่เป็นมาตรฐานหรือไม่และถ้าเป็นเช่นนั้นทำไมมันถึงเป็นสิ่งที่สมเหตุสมผล ไปยังชุดสัญกรณ์สมมติว่าข้อมูลของเราคือและเรามีความสนใจในการสร้างช่วงเวลาสำหรับพารามิเตอร์\ ฉันเคยชินกับช่วงความมั่นใจ / ความน่าเชื่อถือที่ถูกสร้างโดยการสร้างฟังก์ชั่น:θ ΘxXθΘ

fx:Θ{0,1}

และปล่อยให้ช่วงเวลาของเราจะเป็น\}I={θΘ:fx(θ)=1}

นี่คือการสุ่มในแง่ที่ว่ามันขึ้นอยู่กับข้อมูล แต่เงื่อนไขกับข้อมูลมันเป็นเพียงช่วงเวลา กระดาษนี้แทนกำหนด

gx:Θ[0,1]

และยังเป็นคอลเลกชันของตัวแปรสุ่ม IID เครื่องแบบบน[0,1]มันกำหนดช่วงเวลาที่เกี่ยวข้องจะเป็นI = \ {\ theta \ in \ Theta \: \ f_ {x} (\ theta) \ geq U _ {\ theta} \} โปรดทราบว่าสิ่งนี้ขึ้นอยู่กับข้อตกลงแบบสุ่มอย่างมากมายนอกเหนือจากสิ่งที่มาจากข้อมูล [ 0 , 1 ] ฉัน= { θ Θ{Uθ}θΘ[0,1]I={θΘ:fx(θ)Uθ}

ฉันอยากรู้ว่าทำไมคนเราถึงทำสิ่งนี้ ฉันคิดว่า `ผ่อนคลาย 'ความคิดของช่วงเวลาจากฟังก์ชั่นเช่นfxกับฟังก์ชั่นเช่นgxเหมาะสม มันเป็นช่วงของความมั่นใจแบบถ่วงน้ำหนัก ฉันไม่รู้การอ้างอิงใด ๆ สำหรับมัน (และจะขอบคุณพอยน์เตอร์ใด ๆ ) แต่ดูเหมือนว่าค่อนข้างเป็นธรรมชาติ อย่างไรก็ตามฉันไม่สามารถคิดเหตุผลใด ๆ ในการเพิ่มแบบสุ่มเสริม

พอยน์เตอร์ใด ๆ สำหรับวรรณกรรม / เหตุผลในการทำเช่นนี้จะได้รับการชื่นชม!


5
(+1) สิ่งนี้เรียกว่าขั้นตอนแบบสุ่ม มันเป็นส่วนมาตรฐานของการประมาณค่าทางสถิติและกรอบการทดสอบดังนั้นคุณสามารถพึ่งพาตำราเรียนที่เข้มงวดเพื่ออธิบาย แรงจูงใจเพิ่มเติมสำหรับการใช้งานของพวกเขาสามารถพบได้ในวรรณกรรมทฤษฎีเกม
whuber

ขอบคุณสำหรับคำตอบ ฉันรู้หลังจากอ่านความคิดเห็นนี้ว่าเช่นการวางบู๊ตพอดีกับกรอบนี้ แต่ในสถานการณ์นั้นเหตุผลของการสุ่มมีความชัดเจน (คุณไม่สามารถเข้าถึง f, เพียงแค่ g) ในกรณีของผู้เขียนคำนวณอย่างชัดเจนและแล้วมองไปที่{x} แม้ว่าฉันจะมีหนังสือสถิติหลายเล่ม แต่ฉันไม่เห็นสิ่งนี้ทุกที่ ... คุณมีข้อความที่แนะนำหรือไม่ g xfxgx
QQQ

3
ที่จริงแล้ว bootstrapping ไม่ใช่ขั้นตอนการสุ่ม มันเป็นกำหนดขั้นตอนที่มีการคำนวณโดยประมาณจะดำเนินการโดยวิธีการสุ่มแบบ
whuber

คำตอบ:


4

ขั้นตอนการสุ่มถูกนำมาใช้บางครั้งในทางทฤษฎีเพราะมันทำให้ทฤษฎีง่ายขึ้น ในปัญหาสถิติทั่วไปมันไม่สมเหตุสมผลในทางปฏิบัติในขณะที่การตั้งค่าทฤษฎีเกมมันสมเหตุสมผล

เหตุผลเดียวที่ฉันเห็นการใช้ในทางปฏิบัติคือถ้ามันทำให้การคำนวณง่ายขึ้น

ในทางทฤษฎีหนึ่งสามารถโต้เถียงก็ไม่ควรนำมาใช้จากหลักการเศรษฐกิจพอเพียง : ข้อสรุปสถิติควรจะอยู่บนพื้นฐานของการสรุปที่เพียงพอของข้อมูลและการสุ่มแนะนำการพึ่งพาอาศัยกันของภายนอกสุ่ม ซึ่งไม่ได้เป็นส่วนหนึ่งของบทสรุปที่เพียงพอของข้อมูลU

UPDATE  

เพื่อตอบความเห็นของ whuber ด้านล่างโดยอ้างถึงที่นี่: "ทำไมขั้นตอนการสุ่ม" ไม่สมเหตุสมผลในทางปฏิบัติ "? ดังที่คนอื่น ๆ ได้กล่าวไว้ แล้วอะไรคือสิ่งที่แตกต่างกัน (และทำไม่ได้หรือไม่เหมาะสม) เกี่ยวกับการใช้การสุ่มในการวิเคราะห์ข้อมูล?

การสุ่มตัวอย่างของการทดลองเพื่อให้ได้ข้อมูลนั้นถูกทำขึ้นเพื่อจุดประสงค์ส่วนใหญ่เพื่อทำลายโซ่ของเวรกรรม หากและเมื่อใดที่มีประสิทธิภาพเป็นการสนทนาอื่น วัตถุประสงค์ในการใช้การสุ่มเป็นส่วนหนึ่งของการวิเคราะห์คืออะไร? เหตุผลเดียวที่ฉันเคยเห็นคือมันทำให้ทฤษฎีคณิตศาสตร์สมบูรณ์ยิ่งขึ้น! ไม่เป็นไรตราบเท่าที่มันไป ในบริบทของทฤษฎีเกมเมื่อมีปฏิปักษ์เกิดขึ้นจริงการสุ่มความช่วยเหลือของฉันทำให้เขาสับสน ในบริบทการตัดสินใจที่แท้จริง (ขายหรือไม่ขาย?) จะต้องมีการตัดสินใจและหากไม่มีหลักฐานในข้อมูลอาจมีใครสักคนที่สามารถโยนเหรียญได้ แต่ในบริบททางวิทยาศาสตร์ที่คำถามคือสิ่งที่เราสามารถเรียนรู้ได้จากข้อมูลการสุ่มดูเหมือนจะเกิดขึ้น ฉันไม่เห็นข้อได้เปรียบที่แท้จริงจากมัน! หากคุณไม่เห็นด้วยคุณมีข้อโต้แย้งที่สามารถโน้มน้าวให้นักชีววิทยาหรือนักเคมีหรือไม่? (และที่นี่ฉันไม่ได้คิดถึงการจำลองเป็นส่วนหนึ่งของ bootstrap หรือ MCMC)


1
ทำไมขั้นตอนการสุ่ม "ไม่สมเหตุสมผลในทางปฏิบัติ"? เป็นคนอื่นได้ตั้งข้อสังเกตขัดเคืองเป็นอย่างดียินดีที่จะใช้การสุ่มในการก่อสร้างของข้อมูลการทดลองของพวกเขาเช่นการกำหนดแบบสุ่มของการรักษาและการควบคุมดังนั้นสิ่งที่แตกต่างกันดังนั้น (และทำไม่ได้หรือน่ารังเกียจ) เกี่ยวกับการใช้การสุ่มต่อมาในการวิเคราะห์ข้อมูล ?
whuber

1
@kjetil ฉันคิดว่าคุณอาจยังไม่ได้ทำแถลงการณ์ของคุณเกี่ยวกับหลักการความพอเพียงดูเหมือนว่าจะถูกตัดออกกลางประโยค ("บทสรุปทางสถิติควร ... ")
Silverfish

1
(+1) แต่ฉันคิดว่ามันเป็นการขอร้องให้เรียกใช้หลักการความพอเพียงข้อโต้แย้งที่ว่าเมื่อคุณทราบค่าที่สังเกตได้จากสถิติที่เพียงพอการคำนึงถึงแง่มุมอื่น ๆ ของข้อมูลก็เท่ากับการแนะนำแบบสุ่มจากภายนอกUม ดังนั้นใครบางคนเสนอที่จะทำเพียงแค่ว่าจะไม่ให้ผลมะเดื่อสำหรับหลักการความเพียงพอ นอกจากนี้ดูที่ Basu (1978), "การสุ่มในการทดสอบทางสถิติ", รายงานสถิติ FSU M466สำหรับวิธีการสุ่มสองขั้นตอนที่เสนอมาอย่างจริงจัง
Scortchi - Reinstate Monica

1
@whuber: มันเป็นอาร์กิวเมนต์ที่ชัดเจนและมีหลักการว่าการสุ่มในการรับข้อมูลอาจมีประโยชน์ (มันทำลายโซ่สาเหตุ) อะไรคือหลักการที่ใช้ในการสุ่มเป็นส่วนหนึ่งของการวิเคราะห์?
kjetil b halvorsen

1
Kjetil: ช่วยให้คุณบรรลุฟังก์ชั่นความเสี่ยงที่ต้องการแทนที่จะยอมรับฟังก์ชั่นความเสี่ยง (มักอยู่ในรูปของขนาดและกำลังไฟที่ระบุ) ซึ่งไม่ใช่สิ่งที่คุณต้องการ ยิ่งไปกว่านั้นถ้ากระบวนการนั้นมีประโยชน์ในทางทฤษฎีแล้วก็ไม่สามารถคัดค้านการใช้งานในทางปฏิบัติได้นอกจากการทำไม่ได้ (ซึ่งโดยปกติจะไม่ใช่กรณีที่มีขั้นตอนการสุ่ม) ดังนั้นคำถามของคุณควรหันไปที่หัวของมัน: ภาระที่คุณต้องแสดงให้เห็นว่ามีบางอย่างผิดปกติกับการใช้ขั้นตอนแบบสุ่ม คุณจะประสบความสำเร็จได้อย่างไรโดยไม่ขัดแย้งกับตัวคุณเอง?
whuber

3

แนวคิดนี้อ้างถึงการทดสอบ แต่ในมุมมองของการทดสอบและช่วงความเชื่อมั่นจะใช้ตรรกะเดียวกันกับ CIs

โดยพื้นฐานแล้วการทดสอบแบบสุ่มทำให้มั่นใจได้ว่าขนาดของการทดสอบที่กำหนดสามารถรับได้สำหรับการทดลองที่มีค่าไม่ต่อเนื่องเช่นกัน

α=0.05pH0:p=0.5H1:p<0.5n=10

H0k=2ppbinom(2,10,.5)k=1H0

k=2


α

เอาล่ะฉันคิดว่าจะนำเรากลับไปสู่ประวัติศาสตร์ของสถิติเมื่อ RA Fisher ค่อนข้างตัดสินใจโดยพลการที่จะทำงานร่วมกับระดับนัยสำคัญ 5% เพื่อตัดสินว่ามีหลักฐานเบื้องต้นรับประกันการศึกษาต่อไปหรือไม่ อย่างที่เราทราบกันดีว่า 5% นั้นได้ปรับเปลี่ยนไปสู่มาตรฐานทองคำในหลายสาขาแม้ว่าจะไม่มีรากฐานการตัดสินใจที่ดี
Christoph Hanck
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.