เหตุใดข้อมูลที่สังเกตได้ของฟิชเชอร์จึงถูกนำมาใช้อย่างแม่นยำ?


17

ในการตั้งค่าความน่าจะเป็นมาตรฐานสูงสุด (ตัวอย่าง iid จากการกระจายบางอย่างที่มีความหนาแน่นf y ( y | θ 0 )) และในกรณีของรูปแบบที่ระบุอย่างถูกต้องข้อมูลฟิชเชอร์จะได้รับY1,,Ynfy(y|θ0

I(θ)=Eθ0[2θ2lnfy(θ)]

เมื่อความคาดหวังถูกนำมาใช้โดยคำนึงถึงความหนาแน่นที่แท้จริงซึ่งสร้างข้อมูล ฉันได้อ่านแล้วว่าข้อมูลฟิชเชอร์ที่สังเกตได้

J^(θ)=2θ2lnfy(θ)

ถูกใช้เป็นหลักเนื่องจากอินทิกรัลที่เกี่ยวข้องในการคำนวณ (คาดว่า) ข้อมูลฟิชเชอร์อาจไม่สามารถทำได้ในบางกรณี สิ่งที่สร้างความสับสนให้ฉันก็คือแม้ว่าหนึ่งเป็นไปได้คาดหวังจะต้องมีการดำเนินการที่เกี่ยวกับรูปแบบความจริงที่เกี่ยวข้องกับค่าพารามิเตอร์ที่ไม่รู้จัก 0 หากเป็นกรณีที่ปรากฏว่าโดยไม่ทราบว่าθ 0มันเป็นไปไม่ได้ในการคำนวณฉัน มันเป็นเรื่องจริงเหรอ?θ0θ0I

คำตอบ:


13

คุณได้มีสี่ quanties ที่นี่: พารามิเตอร์จริงประมาณการสอดคล้องθข้อมูลที่คาดผม( θ )ที่θและข้อมูลที่สังเกตJ ( θ )ที่θ ปริมาณเหล่านี้เทียบเท่า asymptotically เท่านั้น แต่โดยทั่วไปแล้วจะใช้อย่างไรθ0θ^I(θ)θJ(θ)θ

  1. ข้อมูลที่สังเกตได้ ลู่ในความน่าจะเป็นข้อมูลที่คาดหวัง ผม(θ0)=Eθ0[2

    J(θ0)=1Ni=1N2θ02lnf(yi|θ0)
    เมื่อYเป็นตัวอย่าง IID จาก F(θ0) ที่นี่Eθ0(x)บ่งบอกถึงความคาดหวัง w / R / T กระจายดัชนีโดยθ0:xF(x|θ0)dx การบรรจบกันนี้เกิดขึ้นเนื่องจากกฎจำนวนมากดังนั้นจึงสันนิษฐานว่าYf(
    I(θ0)=Eθ0[2θ02lnf(y|θ0)]
    Yf(θ0)Eθ0(x)θ0xf(x|θ0)dxมีความสำคัญที่นี่Yf(θ0)
  2. เมื่อคุณได้มีการประมาณการθที่ลู่ในความน่าจะเป็นพารามิเตอร์จริงθ 0 (กล่าวคือมีความสอดคล้อง) แล้วคุณสามารถใช้แทนมันทุกที่ที่คุณเห็นθ 0ข้างต้นเป็นหลักเนื่องจากการทำแผนที่ทฤษฎีบทต่อเนื่อง*และทุก ของการบรรจบกันยังคงถือθ^θ0θ0

ที่จริงมันดูเหมือนจะเป็นบิตที่ลึกซึ้ง

สังเกต

ตามที่คุณคาดการณ์ไว้ข้อมูลที่สังเกตได้มักจะทำงานได้ง่ายกว่าเพราะการสร้างความแตกต่างนั้นง่ายกว่าการรวมเข้าด้วยกัน ในบางสถานการณ์ (การแจกแจงแบบปกติ) พวกเขาจะเหมือนกัน

บทความ "การประเมินความแม่นยำของเครื่องมือประมาณความน่าจะเป็นสูงสุด: การสังเกตกับข้อมูลฟิชเชอร์ที่คาดหวัง" โดย Efron และ Hinkley (1978) ทำให้เกิดการโต้เถียงในข้อมูลที่สังเกตได้สำหรับตัวอย่างที่ จำกัด


4

มีการศึกษาแบบจำลองบางอย่างที่สนับสนุนการสังเกตทางทฤษฎีของ Efron & Hinkley (ซึ่งถูกกล่าวถึงในคำตอบของแอนดรูว์) นี่คือสิ่งที่ฉันรู้ว่าทำผิดกฎหมาย: Maldonado, G. และ Greenland, S. (1994) การเปรียบเทียบประสิทธิภาพของช่วงความมั่นใจตามโมเดลเมื่อไม่ทราบรูปแบบโมเดลที่ถูกต้อง ระบาดวิทยา, 5, 171-182 ฉันไม่เห็นการศึกษาใด ๆ ที่ขัดแย้งกัน เป็นที่น่าสนใจแล้วที่แพ็คเกจ GLM มาตรฐานที่ฉันรู้จักใช้ข้อมูลที่คาดหวังเพื่อคำนวณช่วงเวลา Wald แน่นอนว่านี่ไม่ใช่ปัญหาเมื่อ (เช่นเดียวกับใน GLMs เชิงเส้นในพารามิเตอร์ธรรมชาติ) เมทริกซ์ข้อมูลที่สังเกตและคาดว่าจะเท่ากัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.