คุณสมบัติของการถดถอยโลจิสติก


17

เรากำลังทำงานกับการถดถอยแบบโลจิสติกส์และเราได้ตระหนักว่าความน่าจะเป็นโดยประมาณโดยเฉลี่ยเท่ากับสัดส่วนของตัวอย่างในตัวอย่าง นั่นคือค่าเฉลี่ยของค่าติดตั้งเท่ากับค่าเฉลี่ยของตัวอย่าง

ใครช่วยอธิบายเหตุผลให้ฉันหรือให้ข้อมูลอ้างอิงกับฉันที่ฉันสามารถหาการสาธิตนี้ได้?


2
เหตุผลของเรื่องนี้ก็คือการถดถอยโลจิสติกพยายามที่จะบรรลุว่า: การสร้างแบบจำลองการกระจายข้อมูลรวมถึงความน่าจะเป็นก่อนหน้านี้ ("ค่าเฉลี่ย") พฤติกรรมนี้ไม่พึงประสงค์หรือไม่?
bayerj

1
@bayer ความไม่เชิงเส้นของฟังก์ชั่นลิงค์แสดงว่าปรากฏการณ์นี้ลึกกว่าลักษณะของคุณ มีบางสิ่งที่จะแสดงให้เห็นที่นี่
whuber

คุณสมบัตินี้บางครั้งเรียกว่าการปรับเทียบแบบตัวใหญ่เมื่อใช้การถดถอยโลจิสติกเพื่อประเมินความเสี่ยง
julieth

คำตอบ:


26

พฤติกรรมที่คุณสังเกตเป็นกรณี "ทั่วไป" ในการถดถอยโลจิสติก แต่ไม่เป็นความจริงเสมอไป มันยังคงมีอยู่ทั่วไปมากขึ้น (ดูด้านล่าง) มันเป็นผลมาจากการบรรจบกันของข้อเท็จจริงสามประการที่แยกกัน

  1. ทางเลือกของการสร้างแบบจำลองอัตราเดิมพันเป็นฟังก์ชันเชิงเส้นของตัวทำนาย
  2. การใช้โอกาสสูงสุดในการประเมินค่าสัมประสิทธิ์ในแบบจำลองการถดถอยโลจิสติกและ
  3. การรวมคำดักจับในโมเดล

หากไม่มีข้อใดข้อหนึ่งข้างต้นค่าเฉลี่ยความน่าจะเป็นโดยประมาณจะไม่ตรงกับสัดส่วนของความน่าจะเป็นในตัวอย่าง

อย่างไรก็ตาม (เกือบ) ซอฟต์แวร์เชิงสถิติทั้งหมดใช้การประมาณค่าความน่าจะเป็นสูงสุดสำหรับโมเดลดังกล่าวดังนั้นในทางปฏิบัติรายการ 1 และ 2 มักปรากฏอยู่เสมอและรายการ 3 มักปรากฏอยู่ยกเว้นในกรณีพิเศษ

รายละเอียดบางอย่าง

ในกรอบการถดถอยโลจิสติกโดยทั่วไปเราสังเกตผลของการทดลองทวินามอิสระที่มีความน่าจะเป็นฉัน ขอให้ปีฉันจะตอบสนองข้อสังเกต โอกาสทั้งหมดคือ L = n i = 1 p y ฉันฉัน ( 1 - p i ) 1 - y ฉัน = n i = 1 exp ( y i log ( p i / ( 1 - p i)พีผมYผม และเพื่อให้เข้าสู่ระบบความน่าจะเป็น = n Σฉัน= 1 Y ฉันเข้าสู่ระบบ( P ฉัน/ ( 1 - P ฉัน ) ) + n Σฉัน= 1ล็อก( 1 - P ฉัน )

L=Πผม=1nพีผมYผม(1-พีผม)1-Yผม=Πผม=1nประสบการณ์(Yผมเข้าสู่ระบบ(พีผม/(1-พีผม))+เข้าสู่ระบบ(1-พีผม)),
=Σผม=1nYผมเข้าสู่ระบบ(พีผม/(1-พีผม))+Σผม=1nเข้าสู่ระบบ(1-พีผม).

ตอนนี้เรามีเวกเตอร์ของการพยากรณ์สำหรับแต่ละการสังเกตและจากข้อเท็จจริงที่ 1 ข้างต้นโลจิสติก posits แบบการถดถอยที่ บันทึกหน้าฉันxผม สำหรับบางคนที่ไม่รู้จักเวกเตอร์ของพารามิเตอร์β หมายเหตุ: โดยการจัดเรียงนี้เราได้รับที่หน้าฉัน = 1 / ( 1 + E - β T xฉัน )

เข้าสู่ระบบพีผม1-พีผม=βTxผม,
βพีผม=1/(1+อี-βTxผม)

ใช้โอกาสสูงสุดเพื่อให้พอดีกับรูปแบบ (Fact 2) อัตราผลตอบแทนชุดของสมการเพื่อแก้ปัญหาจากการพิจารณา 0 สังเกตว่า /β=0

β=ΣผมYผมxผม-Σผมxผม1+ประสบการณ์(-βTxผม)=ΣผมYผมxผม-Σผมพีผมxผม,
ΣผมYผมxผม=Σผมพี^ผมxผม,
พี^ผม=(1+ประสบการณ์(-β^Txผม))-1

xผมJผมΣผมYผมxผมJ=ΣผมYผม=Σผมพี^ผม

การจำลอง

R

x <- rnorm(100)
p <- 1/(1+exp(-3*x))
y <- runif(100) <= p
mean(y)
# Should be identical to mean(y)
mean( predict( glm(y~x, family="binomial"), type="response" ) )
# Won't be identical (usually) to mean(y)
mean( predict( glm(y~x+0, family="binomial"), type="response") )

กรณีทั่วไป : ตามที่กล่าวถึงข้างต้นคุณสมบัติที่การตอบสนองหมายถึงเท่ากับค่าเฉลี่ยที่คาดการณ์ไว้โดยทั่วไปในชั้นเรียนของตัวแบบเชิงเส้นทั่วไปที่พอดีโดยความเป็นไปได้สูงสุดโดยใช้ฟังก์ชันลิงก์แบบบัญญัติและรวมถึงการสกัดกั้นใน แบบ

อ้างอิง

การอ้างอิงที่ดีสำหรับทฤษฎีที่เกี่ยวข้องมีดังต่อไปนี้

  1. A. Agresti (2002), การวิเคราะห์ข้อมูลอย่างละเอียด , 2nd ed., Wiley
  2. P. McCullagh และ JA Nelder (1989), โมเดลเชิงเส้นทั่วไป , 2nd ed., Chapman & Hall (ข้อความจากผู้แต่งดั้งเดิมของวิธีการทั่วไป)

4
+1 การสาธิตนี้ (เฉพาะกับแบบจำลองการถดถอยโลจิสติกโดยไม่พยายามสรุปให้กับ GLMs ทั้งหมด) ได้รับในMaddala (1983) ตัวแปรที่ขึ้นอยู่กับและคุณภาพ จำกัด ในเศรษฐมิติหน้า 25-26
StasK

@StasK: ขอบคุณสำหรับการอ้างอิงเพิ่มเติมซึ่งฉันไม่คุ้นเคย ไชโย
พระคาร์ดินัล

@ cardinal: ฉันจำไม่ได้ว่า Agresti พูดถึงเรื่องนี้ มีการพูดคุยกันใน McCullagh และ Nelder หรือไม่?
julieth
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.