ให้เป็นข้อมูลที่สังเกตซึ่งสันนิษฐานว่าเป็นสำนึกของลำดับของตัวแปรสุ่ม IIDกับความน่าจะร่วมกันฟังก์ชั่นความหนาแน่นกำหนดด้วยความเคารพต่อมาตรการ Sigma- จำกัด\ความหนาแน่นเรียกว่าความหนาแน่นของData Generating Process (DGP)y1,…,ynY1,…,Ynpeνpe
ในรูปแบบความน่าจะเป็นนักวิจัยของ
คือชุดของฟังก์ชั่นความหนาแน่นของความน่าจะเป็นที่มีการจัดทำดัชนีโดยพารามิเตอร์เวกเตอร์
\สมมติว่าความหนาแน่นแต่ละตัวในเป็นนิยามที่เกี่ยวข้องกับการวัด sigma-finite ทั่วไป (เช่นความหนาแน่นแต่ละครั้งอาจเป็นฟังก์ชันมวลความน่าจะเป็นที่มีพื้นที่ตัวอย่างเดียวกัน )M≡{p(y;θ):θ∈Θ}θMνS
สิ่งสำคัญคือต้องรักษาความหนาแน่นของซึ่งสร้างข้อมูลที่แตกต่างจากแนวคิดแบบจำลองความน่าจะเป็นของข้อมูล ในการรักษาเชิงสถิติแบบคลาสสิกการแยกอย่างระมัดระวังของแนวคิดเหล่านี้อาจถูกละเว้นไม่ทำหรือถูกสันนิษฐานตั้งแต่ต้นว่ามีการระบุแบบจำลองความน่าจะเป็นpe
รูปแบบที่ระบุอย่างถูกต้องเกี่ยวกับถูกกำหนดเป็นแบบจำลองที่ - เกือบทุกที่ เมื่อ
ถูก misspecified ด้วยความเคารพสิ่งนี้สอดคล้องกับกรณีที่ไม่ได้ระบุรูปแบบความน่าจะเป็นอย่างถูกต้องMpepe∈M νMpe
หากระบุรูปแบบความน่าจะเป็นอย่างถูกต้องแสดงว่ามีในพื้นที่พารามิเตอร์เช่นนั้น
- เกือบทุกที่ พารามิเตอร์เวกเตอร์ดังกล่าวเรียกว่า "พารามิเตอร์เวกเตอร์ที่แท้จริง" หากแบบจำลองความน่าจะเป็นได้รับการระบุแล้วแสดงว่าเวกเตอร์พารามิเตอร์จริงไม่มีอยู่จริงθ∗Θpe(y)=p(y;θ∗) ν
ภายในกรอบการทำข้อผิดพลาดของโมเดลสีขาวเป้าหมายคือการหาการประมาณค่าพารามิเตอร์ที่ย่อขนาด
บางพื้นที่ที่มีขนาดกะทัดรัดพารามิเตอร์\สันนิษฐานว่าเป็นที่ไม่ซ้ำกันผืนโลกที่เข้มงวดของมูลค่าที่คาดหวังของในตั้งอยู่ในการตกแต่งภายในของ\ในกรณีนำโชคที่มีการระบุแบบจำลองความน่าจะเป็นอย่างถูกต้องอาจตีความได้ว่าเป็น "ค่าพารามิเตอร์จริง"θ^n ℓ n(θ)≡(1/n)Σ n ฉัน= 1บันทึกP(Yฉัน;θ)Θθ * ℓ nΘΘθ*ℓ^n(θ)≡(1/n)∑ni=1logp(yi;θ)Θθ∗ℓ^nΘΘθ∗
ในกรณีพิเศษที่ระบุรูปแบบความน่าจะเป็นอย่างถูกต้องแล้วเป็นค่าประมาณโอกาสสูงสุดที่คุ้นเคย ถ้าเราไม่ทราบว่ามีความรู้แน่นอนว่ารูปแบบความน่าจะมีการระบุอย่างถูกต้องแล้วเรียกว่าการประเมินความน่าจะเป็นกึ่งสูงสุดและมีเป้าหมายที่จะประเมิน * หากเราได้รับโชคดีและมีการระบุแบบจำลองความน่าจะเป็นอย่างแม่นยำการประมาณค่าความน่าจะเป็นแบบกึ่งอัตโนมัติจะลดลงเป็นกรณีพิเศษให้ประมาณค่าความน่าจะเป็นสูงสุดที่คุ้นเคยและ
จะกลายเป็นค่าพารามิเตอร์จริงθ^n θ nθ*θ*θ^nθ∗θ∗
ความสอดคล้องภายในกรอบงานสีขาว (1982) สอดคล้องกับการบรรจบกับโดยไม่ต้องการให้จำเป็นต้องเป็นพารามิเตอร์เวกเตอร์ที่แท้จริง ภายในกรอบของ White เราจะไม่ประมาณความน่าจะเป็นของเหตุการณ์ที่เซตที่ผลิตโดยδรวมการแจกแจง TRUE P * แต่เรามักจะประเมินการกระจายความน่า P ** ซึ่งเป็นความน่าจะเป็นของเหตุการณ์ที่ชุดที่ผลิตโดยδรวมถึงการกระจายที่ระบุโดยความหนาแน่น
*)θ∗θ∗p(y;θ∗)
ในที่สุดความคิดเห็นบางประการเกี่ยวกับการสะกดคำผิดแบบ มันง่ายในการค้นหาตัวอย่างที่แบบจำลองที่มีการสะกดผิดมีประโยชน์อย่างมากและสามารถคาดการณ์ได้มาก ตัวอย่างเช่นพิจารณาโมเดลการถดถอยแบบไม่เชิงเส้น (หรือแบบเชิงเส้น) ด้วยคำผิดพลาดแบบเกาส์ที่เหลือซึ่งมีความแปรปรวนน้อยมาก แต่ข้อผิดพลาดที่เหลือจริงในสภาพแวดล้อมไม่ใช่แบบเกาส์เซียน
นอกจากนี้ยังง่ายต่อการค้นหาตัวอย่างที่โมเดลที่ระบุอย่างถูกต้องไม่มีประโยชน์และไม่สามารถทำนายได้ ตัวอย่างเช่นลองใช้แบบจำลองการเดินแบบสุ่มเพื่อคาดการณ์ราคาหุ้นซึ่งคาดการณ์ว่าราคาปิดของวันพรุ่งนี้เป็นผลรวมถ่วงน้ำหนักของราคาปิดของวันนี้และเสียงเกาส์เซียนบางส่วนที่มีความแปรปรวนขนาดใหญ่มาก
วัตถุประสงค์ของเฟรมเวิร์กการสะกดผิดโมเดลไม่ได้เพื่อรับรองความถูกต้องของโมเดล แต่เพื่อให้มั่นใจในความน่าเชื่อถือ นั่นคือตรวจสอบให้แน่ใจว่าข้อผิดพลาดการสุ่มตัวอย่างที่เกี่ยวข้องกับการประมาณค่าพารามิเตอร์ของคุณช่วงความเชื่อมั่นการทดสอบสมมติฐานและอื่น ๆ มีการประเมินอย่างถูกต้องแม้จะมีการสะกดผิดรูปแบบไม่มากหรือน้อย การประมาณความเป็นไปได้สูงสุดเสมือนกึ่งกลางปกติที่ asymptotically กับตัวประมาณค่าความแปรปรวนร่วมของเมทริกซ์ความแปรปรวนร่วมซึ่งขึ้นอยู่กับอนุพันธ์อันดับหนึ่งและสองของฟังก์ชันลบบันทึกความน่าจะเป็น ในกรณีพิเศษที่คุณได้รับโชคดีและตัวแบบถูกต้องสูตรทั้งหมดจะลดลงเป็นกรอบทางสถิติแบบดั้งเดิมที่คุ้นเคยซึ่งเป้าหมายคือการประมาณค่าพารามิเตอร์ "จริง"θ∗