การถดถอยโลจิสติก Multinomial เทียบกับการถดถอยโลจิสติกไบนารีหนึ่งส่วนที่เหลือ


36

ให้บอกว่าเรามีตัวแปรตามมีหมวดหมู่น้อยและชุดของตัวแปรอิสระ Y

อะไรคือข้อดีของการถดถอยโลจิสติกพหุนามมากกว่าชุดของการถดถอยโลจิสติกไบนารี (เช่นรูปแบบOne-vs-Rest )? โดยชุดของไบนารีโลจิสติกการถดถอยฉันหมายความว่าสำหรับแต่ละประเภทเราสร้างแยกต่างหากแบบการถดถอยโลจิสติกไบนารีที่มีเป้าหมาย = 1 เมื่อY = Y ฉันและ 0 มิฉะนั้นyiYY=yi


3
ในทางคณิตศาสตร์แบบจำลองมัลติโนเมียลโลจิตคือชุดของแบบจำลองเลขฐานสองซึ่งทั้งหมดเปรียบเทียบกับทางเลือกพื้นฐาน แต่เนื่องจากคุณได้ยุบพารามิเตอร์ทั่วไปและอาจรวมค่าอื่น ๆ MNL จะมีประสิทธิภาพอย่างน้อยที่สุด (และอาจมากกว่านั้น) ฉันไม่เห็นเหตุผลที่จะใช้ชุดของแบบจำลองทวินาม
gregmacfarlane

2
@ gmacfarlane: ฉันพยายามจำลองข้อมูลที่ MNL จะดีกว่าชุดของการถดถอยโลจิสติกไบนารี แต่ทุกครั้งโดยเฉลี่ยคุณภาพจะเหมือนกัน ฉันเปรียบเทียบแผนภูมิลิฟท์และหลังจากผลลัพธ์เฉลี่ยจากการจำลองเพียงเล็กน้อยพวกเขาดูเหมือนกันเกือบทั้งหมด บางทีคุณอาจมีความคิดในการสร้างข้อมูลเพื่อให้ MNL ชนะการถดถอยโลจิสติกส์ไบนารี แม้ว่า MNL จะมีข้อได้เปรียบที่ดี แต่คะแนนก็สามารถตีความได้ว่าเป็นความน่าจะเป็น
Tomek Tarczynski

Multinomial Logistic regression เป็นส่วนขยายของการถดถอยแบบไบนารี logit มันถูกใช้เมื่อตัวแปรตามของการศึกษาคือสามขึ้นไปในขณะที่ไบนารี logit จะใช้เมื่อตัวแปรตามของการศึกษาเป็นสอง

ถึงผู้อ่าน: ฉันแนะนำให้เริ่มที่คำตอบของ @ julieth และติดตามด้วยการอ่าน ttnphns ' ฉันคิดว่าอดีตตอบคำถามเดิมโดยตรงมากกว่า แต่บริบทหลังเพิ่มบริบทที่น่าสนใจ ttnphns ยังแสดงคุณสมบัติที่แตกต่างกันซึ่งมีให้ใช้งานได้ทั้งในซอฟต์แวร์ที่ได้รับความนิยมซึ่งอาจเป็นเหตุผลในการใช้คุณสมบัติอื่น (ดูคำสั่งของ gregmacfarlane)
Ben Ogorek

คำตอบ:


21

Y

logP(i)P(not i)=logiti=linear combinationi

logP(i)P(r)=logiti=linear combinationirir

i

P(i)=exp(logiti)exp(logiti)+exp(logitj)++exp(logitr)i,j,,rrexp(logit)=1P(i)=exp(logiti)exp(logiti)+1


Y

แบบจำลองการถดถอยโลจิสติกไบนารี่สามารถติดตั้งได้โดยใช้ขั้นตอนการถดถอยโลจิสติกหรือขั้นตอนการถดถอยโลจิสติก Multinomial แต่ละขั้นตอนมีตัวเลือกไม่พร้อมใช้งานในอื่น ๆ ความแตกต่างทางทฤษฎีที่สำคัญคือขั้นตอนการถดถอยโลจิสติกสร้างการคาดการณ์ทั้งหมด, ส่วนที่เหลือ, สถิติที่มีอิทธิพลและการทดสอบความดีของความพอดีโดยใช้ข้อมูลในแต่ละระดับกรณีโดยไม่คำนึงถึงวิธีการป้อนข้อมูลหรือไม่หรือไม่ มีขนาดเล็กกว่าจำนวนกรณีทั้งหมดในขณะที่ Multinomial Logistic Regression จะรวบรวมกรณีภายในเพื่อสร้างประชากรย่อยที่มีรูปแบบ covariate ที่เหมือนกันสำหรับผู้ทำนายการสร้างการทำนายการตกค้างและการทดสอบความดีที่เหมาะสมของประชากรเหล่านี้

Logistic Regressionจัดเตรียมคุณลักษณะเฉพาะดังต่อไปนี้:

•การทดสอบ Hosmer-Lemeshow ของความดีของแบบสำหรับรุ่น

•การวิเคราะห์แบบขั้นตอน

•ความคมชัดเพื่อกำหนดพารามิเตอร์แบบจำลอง

•จุดตัดทางเลือกสำหรับการจำแนก

•แปลงจำแนก

•โมเดลติดตั้งบนเคสหนึ่งชุดกับชุดเคสที่ถูกจัดไว้

•บันทึกคำทำนายส่วนที่เหลือและสถิติที่มีอิทธิพล

Multinomial Logistic Regression จัดเตรียมคุณลักษณะเฉพาะดังต่อไปนี้:

•การทดสอบเพียร์สันและเบี่ยงเบนไคสแควร์เพื่อความดีของแบบพอดี

•ข้อมูลจำเพาะของประชากรย่อยสำหรับการจัดกลุ่มข้อมูลสำหรับการทดสอบความดีพอดี

•รายชื่อของการนับการนับที่คาดการณ์และส่วนที่เหลือโดยประชากรย่อย

•แก้ไขการประมาณค่าความแปรปรวนของการกระจายตัวมากเกินไป

•เมทริกซ์ความแปรปรวนร่วมของการประมาณพารามิเตอร์

•การทดสอบการรวมกันเชิงเส้นของพารามิเตอร์

•ข้อกำหนดที่ชัดเจนของแบบจำลองที่ซ้อนกัน

•แบบจำลองการถดถอยโลจิสติกแบบมีเงื่อนไขพอดี 1-1 โดยใช้ตัวแปรที่แตกต่าง


ฉันรู้ว่าโมเดลเหล่านี้จะแตกต่างกัน แต่ฉันไม่รู้ว่าอันไหนดีกว่าในสถานการณ์ใด ฉันจะถามคำถามด้วยวิธีอื่น หากคุณได้รับงาน: สำหรับแต่ละคนทำนายความน่าจะเป็นที่ บริษัท โทรศัพท์มือถือบาง บริษัท เป็น บริษัท ที่ชื่นชอบ (สมมติว่าทุกคนมี บริษัท โทรศัพท์มือถือที่ชื่นชอบ) คุณจะใช้วิธีการใดในวิธีใดและข้อดีกว่าวิธีที่สองคืออะไร
Tomek Tarczynski

@Tomek ฉันขยายคำตอบของฉันเล็กน้อย
ttnphns

แม้ว่าฉันคิดว่า @ julieth เป็นคำตอบที่ดีที่สุดสำหรับคำถามดั้งเดิมของ OP แต่ฉันเป็นหนี้คุณสำหรับการแนะนำให้รู้จักกับสมมติฐานทางเลือกอิสระที่ไม่เกี่ยวข้อง คำถามหนึ่งที่ฉันยังมีอยู่ก็คือว่าโลจิสติกส์ที่แยกจากกันจะได้รับมันอย่างแท้จริงหรือไม่ บทความ Wikipedia ที่คุณเชื่อมโยงกับ probit ที่กล่าวถึงและ "nested logit" เพื่ออนุญาตการละเมิด IIA
Ben Ogorek

iriir

13

เนื่องจากชื่อฉันกำลังสมมติว่า "ข้อดีของการถดถอยโลจิสติกหลาย" หมายถึง "การถดถอยพหุนาม" มักจะมีข้อได้เปรียบเมื่อโมเดลนั้นพอดีพร้อมกัน สถานการณ์นี้มีการอธิบายไว้ใน Agresti (การวิเคราะห์ข้อมูลเชิงหมวดหมู่ 2002) pg 273 โดยสรุป (การถอดความ Agresti) คุณคาดว่าการประมาณการจากแบบจำลองร่วมจะแตกต่างจากแบบจำลองแบบแบ่งชั้น โมเดลโลจิสติกที่แยกต่างหากมีแนวโน้มที่จะมีข้อผิดพลาดมาตรฐานที่ใหญ่กว่าถึงแม้ว่ามันจะไม่เลวร้ายนักเมื่อตั้งระดับผลลัพธ์ที่บ่อยที่สุดเป็นระดับการอ้างอิง


ขอบคุณ! ฉันจะพยายามหาหนังสือเล่มนี้โชคร้าย google.books ให้เนื้อหาเท่านั้นจนถึงหน้า 268
Tomek Tarczynski

@TomekTarczynski ฉันสรุปข้อมูลที่เกี่ยวข้องจากย่อหน้าดังนั้นคุณอาจไม่ได้รับข้อมูลเพิ่มเติมใด ๆ ที่เกี่ยวข้องกับคำถามนี้จากการดูหนังสือ (แม้ว่าหนังสือจะดีมากดังนั้นคุณจะได้รับข้อมูลที่ดีอื่น ๆ )
กรกฎาคม

4
อ้างจากหนังสือ Agresti: "การประเมินแยกที่เหมาะสมแตกต่างจากการประเมิน ML สำหรับการติดตั้ง J-1 พร้อมกันพวกเขามีประสิทธิภาพน้อยกว่าและมีแนวโน้มที่จะมีข้อผิดพลาดมาตรฐานขนาดใหญ่อย่างไรก็ตาม Begg และ Grey 1984 แสดงให้เห็นว่าการสูญเสียประสิทธิภาพ เป็นหมวดหมู่ย่อยเมื่อหมวดหมู่การตอบสนองที่มีความชุกสูงสุดคือพื้นฐาน ".
Franck Dernoncourt
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.