RV Foutz และ RC Srivastava ตรวจสอบปัญหาโดยละเอียด 1977 กระดาษของพวกเขา"ประสิทธิภาพของการทดสอบอัตราส่วนเมื่อรูปแบบไม่ถูกต้อง"มีคำสั่งของผลการกระจายในกรณีของ misspecification ควบคู่ไปกับร่างที่สั้นมากของการพิสูจน์ในขณะที่ 1978 กระดาษของพวกเขา"การกระจาย asymptotic อัตราส่วนความเป็นไปได้เมื่อ แบบจำลองไม่ถูกต้อง "มีการพิสูจน์ - แต่หลังถูกพิมพ์ในตัวเขียนแบบโบราณ (ทั้งเอกสารใช้สัญกรณ์เดียวกันแม้ว่าดังนั้นเพื่อให้คุณสามารถรวมพวกเขาในการอ่าน) นอกจากนี้สำหรับบางขั้นตอนของการพิสูจน์พวกเขาอ้างถึงกระดาษโดย KP Roy "บันทึกเกี่ยวกับการแจกแจงแบบไม่มีอาการของอัตราส่วนความน่าจะเป็น" จากปี 1957 ซึ่งไม่ปรากฏว่ามีอยู่ในบรรทัดแม้แต่ประตูรั้ว
ในกรณีที่มีการแจกแจงการสะกดผิดถ้า MLE ยังคงสอดคล้องและเป็นปกติ (ซึ่งไม่ใช่กรณี) asymptotically, LR สถิติดังนี้ asymptotically เชิงเส้นรวมกันเป็นอิสระของไคสแควร์ - asymptotically (แต่ละระดับอิสระ)
−2lnλ→d∑i=1rciχ2i
ที่เมตร เราสามารถเห็น "ความคล้ายคลึงกัน": แทนที่จะเป็นไคสแควร์ที่มีอิสระในระดับh - mเราจะมีไค - สแควร์h - mแต่ละอันที่มีอิสระในระดับหนึ่ง แต่ "การเปรียบเทียบ" หยุดอยู่ที่นั่นเพราะการรวมกันเชิงเส้นของไคสแควร์ไม่มีความหนาแน่นของรูปแบบปิด chi-square ที่ปรับสเกลแต่ละตัวเป็นแกมม่า แต่ด้วยพารามิเตอร์c i ที่แตกต่างกันซึ่งนำไปสู่พารามิเตอร์สเกลที่แตกต่างกันสำหรับแกมม่า - และผลรวมของ gammas ดังกล่าวไม่ได้เป็นแบบปิดแม้ว่าจะสามารถคำนวณค่าได้r=h−mh−mh−mci
สำหรับคงที่เรามีค1 ≥ ค2 ≥ . . c r ≥ 0 , และพวกมันคือค่าลักษณะเฉพาะของเมทริกซ์ ... เมทริกซ์ตัวไหน? การใช้สัญกรณ์ของผู้แต่งตั้งค่าΛให้เป็น Hessian ของบันทึกความน่าจะเป็นและCเป็นผลิตภัณฑ์ชั้นนอกของการไล่ระดับสีของความน่าจะเป็นบันทึก (ในแง่ที่คาดหวัง) ดังนั้นV = Λ - 1 C ( Λ ′ ) - 1คือเมทริกซ์ความแปรปรวนเชิงซ้อน - ความแปรปรวนร่วมของ MLEcic1≥c2≥...cr≥0ΛCV=Λ−1C(Λ′)−1
จากนั้นตั้งค่าจะเป็นR × rบล็อกเส้นทแยงมุมบนของVMr×rV.
Also write Λ in block form
Λ=[Λr×rΛ2Λ′2Λ3]
W=−Λr×r+Λ′2Λ−13Λ2 (W is the negative of the Schur Complement of Λ).
ciMW
[9], the proof can move forward even if we assume that we have a distributional misspecification: as the OP notes, the terms of the variance covariance matrix will be different in the misspecification scenario, but all Wilks does is take derivatives, and identify asymptotically negligible terms. And so he arrives at eq. [9] where we see that the likelihood ratio statistic, if the specification is correct, is just the sum of h−m squared standard normal random variables, and so they are distributed as one chi-square with h−m degrees of freedom: (generic notation)
−2lnλ=∑i=1h−m(n−−√θ^i−θiσi)2→dχ2h−m
But if we have misspecification, then the terms that are used in order to scale the centered and magnified MLE n−−√(θ^−θ) are no longer the terms that will make the variances of each element equal to unity, and so transform each term into a standard normal r.v and the sum into a chi-square.
And they are not, because these terms involve the expected values of the second derivatives of the log-likelihood... but the expected value can only be taken with respect to the true distribution, since the MLE is a function of the data and the data follows the true distribution, while the second derivatives of the log-likelihood are calculated based on the wrong density assumption.
So under misspecification we have something like
−2lnλ=∑i=1h−m(n−−√θ^i−θiai)2
and the best we can do is to manipulate it into
−2lnλ=∑i=1h−mσ2ia2i(n−−√θ^i−θiσi)2=∑i=1h−mσ2ia2iχ21
which is a sum of scaled chi-square r.v.'s, no longer distributed as one chi-square r.v. with h−m degrees of freedom. The reference provided by the OP is indeed a very clear exposition of this more general case that includes Wilks' result as a special case.