การตีความการทำนายอย่างง่ายต่ออัตราต่อรองในการถดถอยโลจิสติก


29

ฉันค่อนข้างใหม่ในการใช้การถดถอยโลจิสติกและสับสนเล็กน้อยโดยความแตกต่างระหว่างการตีความของฉันของค่าต่อไปนี้ซึ่งฉันคิดว่าจะเหมือนกัน:

  • ค่าเบต้าแบบยกกำลัง
  • ทำนายความน่าจะเป็นของผลลัพธ์โดยใช้ค่าเบต้า

นี่คือรุ่นที่เรียบง่ายของรุ่นที่ฉันใช้ซึ่งการขาดสารอาหารและการประกันภัยเป็นทั้งไบนารีและความมั่งคั่งยังคงต่อเนื่อง:

Under.Nutrition ~ insurance + wealth

แบบจำลองของฉัน (จริง) คืนค่าเบต้าเป็นเลขชี้กำลัง 0.8 สำหรับการประกันซึ่งฉันจะตีความว่า:

"ความน่าจะเป็นของการได้รับอาหารไม่เพียงพอสำหรับผู้ประกันตนคือ 0.8 เท่าของความน่าจะเป็นของการได้รับอาหารไม่เพียงพอสำหรับบุคคลที่ไม่มีประกัน"

อย่างไรก็ตามเมื่อฉันคำนวณความแตกต่างของความน่าจะเป็นของแต่ละบุคคลโดยการใส่ค่า 0 และ 1 ลงในตัวแปรประกันภัยและค่าเฉลี่ยของความมั่งคั่งความแตกต่างของการขาดสารอาหารเพียง 0.04 นั่นคือการคำนวณดังนี้:

Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) /
                             (1+exp(β0 + β1*Insurance + β2*wealth))

ฉันจะซาบซึ้งจริง ๆ ถ้ามีใครสามารถอธิบายได้ว่าทำไมค่าเหล่านี้แตกต่างกันและการตีความที่ดีกว่า (โดยเฉพาะสำหรับค่าที่สอง) อาจจะเป็นอย่างไร


การแก้ไขคำชี้แจงเพิ่มเติม
เมื่อฉันเข้าใจแล้วความน่าจะเป็นที่ได้รับการเลี้ยงดูสำหรับบุคคลที่ไม่มีประกัน (ที่ B1 สอดคล้องกับการประกันภัย) คือ:

Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) /
              (1+exp(β0 + β1*0+ β2*wealth))

ในขณะที่ความน่าจะเป็นที่ได้รับการเลี้ยงดูไม่เพียงพอสำหรับผู้ประกันตนคือ:

Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) /
           (1+exp(β0 + β1*1+ β2*wealth))

อัตราต่อรองของการขาดสารอาหารสำหรับผู้ไม่มีประกันเมื่อเทียบกับผู้ประกันตนคือ:

exp(B1)

มีวิธีการแปลระหว่างค่าเหล่านี้ (ทางคณิตศาสตร์) หรือไม่? ฉันยังคงสับสนเล็กน้อยจากสมการนี้ (ซึ่งฉันน่าจะเป็นค่าที่แตกต่างใน RHS):

Prob(Ins) - Prob(Unins) != exp(B)

ในแง่ของคนธรรมดาคำถามคือทำไมไม่ทำประกันบุคคลเปลี่ยนแปลงความน่าจะเป็นของพวกเขาจะถูกบำรุงต่ำกว่าอัตราเดิมพันระบุว่ามันไม่? ในข้อมูลของฉัน Prob (Ins) - Prob (Unins) = .04 โดยที่ค่าเบต้าที่อธิบายเป็น. 8 (ดังนั้นทำไมความแตกต่างจึงไม่เท่ากับ. 2)


2
คำอธิบายที่ยอดเยี่ยมและชัดเจนเหล่านี้สามารถนำไปใช้กับแบบจำลอง / การถดถอยของ log-logistic ได้หรือไม่?

คำตอบ:


50

ฉันเห็นได้ชัดว่า เว้นแต่ 0 ดังนั้นฉันไม่ชัดเจนเกี่ยวกับความสับสนที่อาจเกิดขึ้น สิ่งที่ฉันสามารถพูดได้ก็คือด้านซ้ายมือ (LHS) ของเครื่องหมายเท่ากับ (ไม่ใช่) คืออัตราต่อรองของการขาดสารอาหารในขณะที่ RHS คือความน่าจะเป็นที่ได้รับอาหารไม่เพียงพอ เมื่อตรวจสอบด้วยตัวเองคืออัตราต่อรองนั่นคือปัจจัยคูณที่ช่วยให้คุณย้ายจากอัตราต่อรอง ( ) ไปยังอัตราต่อรอง ( )

exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
exp(β0+β1x)=0exp(β1)xx+1

แจ้งให้เราทราบหากคุณต้องการข้อมูลเพิ่มเติม / แตกต่างกัน

อัปเดต:
ฉันคิดว่านี่เป็นปัญหาส่วนใหญ่ที่ไม่คุ้นเคยกับความน่าจะเป็นและราคาต่อรองและวิธีที่พวกเขาเกี่ยวข้องกัน ไม่มีสิ่งใดที่เข้าใจง่ายมากคุณต้องนั่งลงและทำงานกับมันซักพักแล้วเรียนรู้ที่จะคิดในแง่เหล่านั้น มันไม่ได้เกิดขึ้นกับใครตามธรรมชาติ

ปัญหาคือจำนวนที่แน่นอนนั้นยากมากที่จะตีความด้วยตัวเอง ให้บอกว่าฉันบอกคุณเกี่ยวกับเวลาที่ฉันมีเหรียญและฉันสงสัยว่ามันยุติธรรมหรือไม่ ดังนั้นฉันพลิกมันบางส่วนและได้ 6 หัว นั่นหมายความว่าอย่างไร? 6 มีมากน้อยเกี่ยวกับใช่ไหม มันยากที่จะพูด เพื่อจัดการกับปัญหานี้เราต้องการให้ตัวเลขบริบทบางอย่าง ในกรณีเช่นนี้มีสองทางเลือกที่ชัดเจนสำหรับวิธีการจัดเตรียมบริบทที่ต้องการ: ฉันสามารถให้จำนวนการพลิกทั้งหมดหรือฉันสามารถให้จำนวนหาง ไม่ว่าในกรณีใดคุณมีข้อมูลเพียงพอที่จะใช้ความรู้สึกถึง 6 หัวและคุณสามารถคำนวณค่าอื่น ๆ ได้ถ้าสิ่งที่ฉันบอกคุณไม่ใช่ตัวที่คุณต้องการ Probability คือจำนวนหัวที่หารด้วยจำนวนเหตุการณ์ทั้งหมด อัตราต่อรองคืออัตราส่วนของจำนวนหัวต่อจำนวนไม่ใช่หัว (สังหรณ์ใจเราต้องการที่จะพูดจำนวนหางซึ่งใช้งานได้ในกรณีนี้ แต่ไม่หากมีความเป็นไปได้มากกว่า 2) ด้วยอัตราต่อรองเป็นไปได้ที่จะให้ทั้งสองตัวเลขเช่น 4 ถึง 5 ซึ่งหมายความว่าในระยะยาวสิ่งที่จะเกิดขึ้น 4 ครั้งสำหรับทุก ๆ 5 ครั้งมันจะไม่เกิดขึ้น เมื่ออัตราต่อรองแสดงด้วยวิธีนี้พวกเขาจะเรียกว่า " อัตราต่อรองของลาสเวกัส " อย่างไรก็ตามในสถิติเรามักจะแบ่งและพูดว่าอัตราต่อรองเป็น. 8 แทน (เช่น 4/5 = .8) เพื่อวัตถุประสงค์ในการมาตรฐาน นอกจากนี้เรายังสามารถแปลงระหว่างอัตราต่อรองและความน่าจะเป็น:

probability=odds1+odds                odds=probability1probability
(ด้วยสูตรเหล่านี้อาจเป็นเรื่องยากที่จะรับรู้ว่าอัตราต่อรองคือ LHS ที่ด้านบนและความน่าจะเป็นคือ RHS แต่โปรดจำไว้ว่ามันไม่ใช่เครื่องหมายเท่ากับตรงกลาง) อัตราต่อรองเป็นเพียงอัตราต่อรองของสิ่งที่หารด้วย โอกาสของสิ่งอื่น ในบริบทของการถดถอยโลจิสติกคืออัตราส่วนของอัตราต่อรองสำหรับค่าต่อเนื่องของ covariate ที่เกี่ยวข้องเมื่อทุกอย่างเท่าเทียมกัน exp(β)

สิ่งสำคัญที่ต้องคำนึงถึงจากสมการทั้งหมดนี้คือความน่าจะเป็นอัตราต่อรองและอัตราต่อรองไม่ได้เปรียบในทางตรงไปตรงมา เพียงเพราะความน่าจะเป็นเพิ่มขึ้นเป็น. 04 อย่างมากไม่ได้หมายความว่าอัตราต่อรองหรืออัตราต่อรองควรเป็นอะไรเช่น. 04! นอกจากนี้ความน่าจะเป็นอยู่ในช่วงตั้งแต่ในขณะที่อัตราเดิมพัน ln (ผลลัพธ์จากสมการการถดถอยโลจิสติกดิบ) สามารถอยู่ในช่วงจากและอัตราต่อรองและอัตราต่อรองสามารถอยู่ในช่วงตั้งแต่infty) ส่วนสุดท้ายนี้มีความสำคัญ: เนื่องจากขอบเขตของความน่าจะเป็นที่ถูก จำกัด ความน่าจะเป็นไม่ใช่เชิงเส้นแต่อัตราต่อรองสามารถเป็นเชิงเส้นได้ นั่นคือเป็น (ตัวอย่าง)[0,1](,+)(0,+)wealthการเพิ่มขึ้นคงที่ความน่าจะเป็นของการขาดอาหารจะเพิ่มขึ้นตามจำนวนที่แตกต่างกัน แต่อัตราเดิมพัน ln จะเพิ่มขึ้นตามจำนวนคงที่และอัตราต่อรองจะเพิ่มขึ้นโดยปัจจัยคูณคงที่ สำหรับชุดของค่าที่ระบุในแบบจำลองการถดถอยโลจิสติกของคุณอาจมีบางจุดที่ สำหรับบางและแต่มันจะไม่เท่ากันทุกที่

exp(β0+β1x)exp(β0+β1x)=exp(β0+β1x)1+exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
xx

(แม้ว่ามันจะถูกเขียนในบริบทของคำถามที่แตกต่างกันคำตอบของฉันที่นี่มีข้อมูลมากมายเกี่ยวกับการถดถอยโลจิสติกที่อาจเป็นประโยชน์สำหรับคุณในการทำความเข้าใจ LR และปัญหาที่เกี่ยวข้องอย่างเต็มที่)


ขอบคุณสำหรับการตอบกลับ - ฉันอธิบายความสับสนเพิ่มเติมในการแก้ไขด้านบน
ไมค์

ขอขอบคุณที่สละเวลาเขียนคำอธิบายแบบเต็ม - มีประโยชน์มาก
ไมค์

ยินดีต้อนรับคุณ @ ไมค์นั่นคือสิ่งที่ CV มีไว้ให้
gung - Reinstate Monica

ลิงก์ราคาต่อรองของลาสเวกัสอีกครั้ง: ฉันไม่เคยไปเวกัส แต่มองหาบางราคาที่เสนอโดยไซต์ที่ใช้เวกัสซึ่งพวกเขาเสนอราคาต่อรองแบบเศษส่วน (เมื่อเทียบกับ Moneyline) พวกเขาติดตามระบบอังกฤษ สถิติ "อัตราต่อรองที่โปรดปราน" เช่น "อัตราต่อรองของลาสเวกัส" ที่ลิงก์ของคุณไม่ตรงกับอัตราต่อรองการพนันจริงซึ่ง "9 ต่อ 1" สำหรับเหตุการณ์ที่ไม่น่าเป็นไปได้ไม่ใช่ (เช่น "9 ต่อ 1" หมายถึงนักสถิติ) แหล่งที่มาของความสับสนฉันพยายามที่จะอยู่ที่นี่
Silverfish

@ Silververfish ฉันไม่เคยไปลาสเวกัสมานานแล้ว ฉันจำไม่ได้ว่าพวกเขามักจะระบุราคาต่อรอง อย่างไรก็ตาม '4-5' เรียกว่าอัตราต่อรองที่ลาสเวกั
gung - Reinstate Monica

0

คำตอบนั้นง่ายเมื่อคุณยินดีที่จะรักษาตัวแปรทั้งหมดให้คงที่และเปลี่ยนแปลงหนึ่งตัวแปร อย่างไรก็ตามมันจะซับซ้อนเล็กน้อยในขณะที่ตัวแปรทุกตัวแตกต่างกันไป คุณสามารถดูโพสต์ต่อไปนี้มันอาจช่วยhttp://analyticspro.org/2016/03/02/r-tutorial-multiple-linear-regression/


-1

อัตราต่อรองหรือ = Exp (b) แปลเป็นความน่าจะเป็น A = SQRT (OR) / (SQRT (OR) +1) โดยที่ความน่าจะเป็น A คือความน่าจะเป็นของกิจกรรม A และ OR คืออัตราส่วนของเหตุการณ์ที่เกิดขึ้น A / เปิดเผย / ไม่เปิดเผยโดยการประกันตามคำถามข้างต้น) ฉันต้องใช้เวลาพอสมควรในการแก้ไข; ฉันไม่แน่ใจว่าทำไมสูตรนี้จึงไม่เป็นที่รู้จัก

มีตัวอย่าง สมมติว่ามี 10 คนเข้ามหาวิทยาลัย 7 คนเป็นผู้ชาย ดังนั้นสำหรับผู้ชายทุกคนมันน่าจะเป็น 70% ที่จะได้รับการยอมรับ อัตราต่อรองที่จะยอมรับสำหรับผู้ชายคือ 7/3 = 2.33 และไม่ได้รับการยอมรับ 3/7 = 0.43 อัตราต่อรอง (OR) คือ 2.33 / 0.43 = 5.44 ซึ่งหมายความว่าสำหรับผู้ชาย 5.44 เท่าโอกาสสูงที่จะได้รับการยอมรับมากกว่าสำหรับผู้หญิง มาหาความน่าจะเป็นที่มนุษย์จะยอมรับจาก OR: P = SQRT (5.44) / (SQRT (5.44) +1) = 0.7

อัปเดต สิ่งนี้เป็นจริงเฉพาะในกรณีที่จำนวนชายหรือหญิงเข้ารับการรักษาเท่ากับจำนวนผู้สมัคร กล่าวอีกนัยหนึ่งมันไม่ใช่หรือ เราไม่พบความน่าจะเป็น (หรือการสูญเสีย) ความน่าจะเป็นขึ้นอยู่กับปัจจัยโดยไม่ทราบข้อมูลเพิ่มเติม


ที่ไม่ถูกต้องฉันกลัว: ในตัวอย่างนี้เราสามารถประมาณราคาต่อรอง (และน่าจะเป็น) ว่าคนที่เข้ารับการรักษาในมหาวิทยาลัยเป็นชาย (หรือหญิง) แต่ไม่มีการต่อรองอัตราส่วนโดยไม่ได้รู้วิธีที่ผู้ชายหลายคนและผู้หญิงที่อยู่ในกลุ่มผู้สมัครที่ไม่ถูกต้องฉันกลัว: ในตัวอย่างนี้เราสามารถประมาณราคาต่อรอง (และน่าจะเป็น) ว่าคนที่เข้ารับการรักษาในมหาวิทยาลัยเป็นชาย (หรือหญิง) แต่ไม่มีการต่อรองอัตราส่วนโดยไม่ได้รู้วิธีที่ผู้ชายหลายคนและผู้หญิงที่อยู่ในกลุ่มผู้สมัคร สิ่งที่คุณกำลังเรียกหรือนี่คือในความเป็นจริงเพียงแค่การต่อรองยืด2} 7232
Scortchi - Reinstate Monica

ใช่ถูกต้องแล้วขอบคุณ ฉันพบว่าเราไม่สามารถแปลง OR ที่รู้จักหรือที่เราได้รับเช่นผลลัพธ์การถดถอยโลจิสติกเป็นความน่าจะเป็นที่จะได้รับหรือสูญเสียโดยไม่ทราบข้อมูลเกี่ยวกับความน่าจะเป็นก่อนหน้านี้ ฉันใส่การปรับปรุงลงในคำตอบของฉัน
Niksr
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.