คำตอบสั้น ๆ คือ "ใช่คุณทำได้" - แต่คุณควรเปรียบเทียบค่าประมาณความน่าจะเป็นสูงสุด (MLEs) ของ "รุ่นใหญ่" กับตัวแปรทั้งหมดในรุ่นใดรุ่นหนึ่งที่พอดีกับทั้งสองแบบ
นี่เป็นวิธี "แบบกึ่งทางการ" เพื่อให้ได้ทฤษฎีความน่าจะเป็นที่จะตอบคำถามของคุณ
ในตัวอย่างและY 2เป็นตัวแปรประเภทเดียวกัน (เศษส่วน / เปอร์เซ็นต์) ดังนั้นจึงเปรียบเทียบกันได้ ฉันจะสมมติว่าคุณพอดีกับรุ่นเดียวกันกับทั้งสอง ดังนั้นเราจึงมีสองรุ่น:Y1Y2
l o g ( p 1 i
M1: Y1 ฉัน∼ B ฉันn ( n1 ฉัน, p1 ฉัน)
M2:Y2i∼Bฉันn(n2i,p2i)log(p 2 il o g( หน้า1 ฉัน1 - หน้า1 ฉัน) = α1+ β1Xผม
M2: Y2 ฉัน∼ B ฉันn ( n2 ฉัน, p2 ฉัน)
l o g( หน้า2 ฉัน1 - หน้า2 ฉัน) = α2+ β2Xผม
ดังนั้นคุณมีสมมติฐานที่คุณต้องการประเมิน:
H0: β1> β2
{ Y1 ฉัน, วาย2 ฉัน, Xผม}ni = 1
P= Pr ( H0| { Y1 ฉัน, วาย2 ฉัน, Xผม}ni = 1, ผม)
H0
P=∫∞−∞∫∞−∞∫∞−∞∫∞−∞Pr(H0,α1,α2,β1,β2|{Y1i,Y2i,Xi}ni=1,I)dα1dα2dβ1dβ2
สมมติฐานนั้น จำกัด ขอบเขตของการรวมกลุ่มดังนั้นเราจึงมี:
P=∫∞−∞∫∞β2∫∞−∞∫∞−∞Pr(α1,α2,β1,β2|{Y1i,Y2i,Xi}ni=1,I)dα1dα2dβ1dβ2
Because the probability is conditional on the data, it will factor into the two separate posteriors for each model
Pr(α1,β1|{Y1i,Xi,Y2i}ni=1,I)Pr(α2,β2|{Y2i,Xi,Y1i}ni=1,I)
Now because there is no direct links between Y1i and α2,β2, only indirect links through Xi, which is known, it will drop out of the conditioning in the second posterior. same for Y2i in the first posterior.
From standard logistic regression theory, and assuming uniform prior probabilities, the posterior for the parameters is approximately bi-variate normal with mean equal to the MLEs, and variance equal to the information matrix, denoted by V1 and V2 - which do not depend on the parameters, only the MLEs. so you have straight-forward normal integrals with known variance matrix. αj marginalises out with no contribution (as would any other "common variable") and we are left with the usual result (I can post the details of the derivation if you want, but its pretty "standard" stuff):
P=Φ(β^2,MLE−β^1,MLEV1:β,β+V2 : β, β-----------√)
ที่ไหน Φ ( )เป็นเพียง CDF ปกติมาตรฐาน นี่คือการเปรียบเทียบปกติของการทดสอบหมายถึงปกติ แต่โปรดทราบว่าวิธีการนี้ต้องการการใช้ชุดตัวแปรการถดถอยในแต่ละชุด ในกรณีหลายตัวแปรที่มีตัวทำนายหลายตัวหากคุณมีตัวแปรการถดถอยที่แตกต่างกันอินทิกรัลจะมีประสิทธิภาพเท่ากับการทดสอบด้านบน แต่จาก MLEs ของสอง betas จาก "โมเดลขนาดใหญ่" ซึ่งรวมถึงโควาเรียทั้งหมดจากทั้งสองรุ่น