การกระจายข้อผิดพลาดสำหรับการถดถอยเชิงเส้นและโลจิสติก


9

ด้วยข้อมูลอย่างต่อเนื่องการถดถอยเชิงเส้นถือว่าข้อผิดพลาดมีการกระจาย N (0, )Y=β1+β2X2+uσ2

1) เราคิดว่า Var (Y | x) เป็นเช่นเดียวกัน ~ N (0, ) หรือไม่σ2

2) การกระจายข้อผิดพลาดนี้ในการถดถอยโลจิสติกคืออะไร? เมื่อข้อมูลอยู่ในรูปแบบของบันทึก 1 ต่อกรณีที่ "Y" คือ 1 หรือ 0 เป็นข้อผิดพลาดกระจาย Bernoulli (เช่นความแปรปรวนคือ p (1-p)) และเมื่อข้อมูลอยู่ในรูปแบบ # ประสบความสำเร็จจากการทดลอง #of มันถือว่าเป็นทวินาม (เช่นความแปรปรวนคือ np (1-p)) โดยที่ p คือความน่าจะเป็นที่ Y เป็น 1 หรือไม่


2
คุณไม่ถูกต้องสมมติฐานของโมเดลคือเงื่อนไขข้อผิดพลาดมีความเป็นอิสระและมีการแจกแจงแบบเดียวกับการแจกแจงแบบ N (0, σ ) และไม่เกี่ยวข้องกับ COVARIATE Var (Y | x) คืออะไร คุณ จำกัด อยู่ที่ X = x หรือไม่ แบบจำลองสันนิษฐานว่าโควาเรียตมีการสุ่มอย่างใดอย่างหนึ่งหรือดังนั้นเราจึงสันนิษฐานว่าโควาเรียตถูกแก้ไขตามเมทริกซ์การออกแบบ ฉันคิดว่ามันเป็นตัวสุดท้ายและดังนั้น Var (Y | X = x) จึงมีความหมายโดยนัยและไม่จำเป็นต้องสันนิษฐาน 222
Michael R. Chernick

@MichaelChernick ทำไมรูปแบบสมมติว่าได้รับการแก้ไข แน่นอนมันอาจเป็นกรณีที่ได้รับการแก้ไข แต่ก็สามารถสุ่ม ไม่มีอะไรในคำถามที่แสดงถึงฉัน X2
Peter Flom

@ PeterFlom ฉันอ่านคำถามที่การถดถอยเชิงเส้นกับการแจกแจงข้อผิดพลาดนั้นหมายถึง OLS ซึ่งต้องใช้ Xในการแก้ไขและรู้จัก หากใครบางคนมี Deming regression (เช่นข้อผิดพลาดในการถดถอยตัวแปร) มันจะถูกระบุในคำถาม การดูคำตอบที่ Stat ให้ไว้แสดงว่าเขาขัดจังหวะคำถามด้วยเช่นกัน 2
Michael R. Chernick

@Michael ฉันถูกสมมุติว่า X.
B_Miner

คำตอบ:


10

1) ถ้า มีการแจกแจงแบบปกติเช่นแล้วตั้งแต่ไม่ใช่ตัวแปรสุ่มuN(0,σ2)Var(Y|X2)=Var(β1+β2X2)+Var(u)=0+σ2=σ2β1+β2X2

2) ในการถดถอยโลจิสติกมันจะสันนิษฐานว่าข้อผิดพลาดดังต่อไปนี้การกระจายทวินามเป็นที่กล่าวถึงที่นี่ มันจะดีกว่าที่จะเขียนเป็นเนื่องจากความน่าจะเป็นผู้ที่ขึ้นอยู่กับเป็นอ้างอิงที่นี่หรือในการประยุกต์การถดถอยโลจิสติกVar(Yj|Xj)=mj.E[Yj|Xj].(1E[Yj|Xj])=mjπ(Xj).(1π(Xj))Xj


สถิติดังนั้นมันถูกต้องที่จะบอกว่าความแปรปรวนสำหรับข้อผิดพลาดของแต่ละบุคคลที่,, , คือ (1- ) ซึ่งเทียบเท่ากับสิ่งที่คุณแสดงให้เห็นว่ามีการสังเกตมากกว่า 1 ครั้งในข้อมูลที่มีค่าโควาเรียเดียวกัน รูปแบบ (เช่นอื่น = 1 สำหรับทุก j)? eipipimj
B_Miner

2
ใช่ถูกต้องแล้ว หากกับแล้วกับความน่าจะหรือกับความน่าจะเป็น1ดังนั้นมีการกระจายกับค่าเฉลี่ยและความแปรปรวนเท่ากับ(1-p_i) Yi=pi+eiP(Yi=1)=1P(Yi=0)=piei=1pipiei=pi1piei0pi(1pi)
สถิติ

อีกจุดหนึ่งที่นี่สถิติเราต้องสมมติว่า X ได้รับการแก้ไขไม่ใช่แบบสุ่มสำหรับ Var (Y | X) = Var (e) สำหรับทั้งสองกรณีของการถดถอยเชิงเส้นและโลจิสติกถูกต้องหรือไม่
B_Miner

NBกับความน่าจะหรือกับความน่าจะเป็นคือไม่กระจายทวินามสำหรับe_iei=1pipiei=pi1piei
Scortchi - Reinstate Monica

B_Miner:หมายถึงความแปรปรวนของเงื่อนไขบนตัวแปรสุ่มที่ใช้ค่าสังเกตได้ ดังนั้นมันจึงไม่สำคัญว่าตัวทำนายของคุณจะได้รับการแก้ไขโดยการทดลองหรือสังเกตในตัวอย่าง: สิ่งที่ @ สเตทบอกว่าพวกเขาจะไม่ถูกพิจารณาว่าเป็นตัวแปรสุ่มสำหรับจุดประสงค์ของการถดถอยอีกต่อไป Var(Y|X)=Var(Y|X=x)YXx
Scortchi - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.