การถดถอยโลจิสติก: การตีความตัวแปรอย่างต่อเนื่อง


11

ฉันมีคำถามสองสามข้อเกี่ยวกับการตีความอัตราส่วนอัตราต่อรองสำหรับตัวแปรต่อเนื่องในการถดถอยโลจิสติก ฉันรู้สึกว่านี่เป็นคำถามพื้นฐานเกี่ยวกับการถดถอยโลจิสติกส์ (และอาจเกี่ยวกับการถดถอยทั่วไป) และถึงแม้ว่าฉันรู้สึกละอายเล็กน้อยที่ไม่รู้คำตอบฉันจะกลืนความภาคภูมิใจและถามพวกเขาเพื่อที่ฉันจะได้รู้ อนาคต!

นี่คือสถานการณ์ของฉัน ... ฉันกำลังดูตัวอย่างของเยาวชนที่ถูกตัดสินซึ่งเป็นส่วนหนึ่งของการทดลองของพวกเขาได้รับการลงทะเบียนในโปรแกรมการฝึกอบรมทักษะการทำงาน / ชีวิต ฉันต้องการเห็นว่าอายุที่พวกเขาได้รับการปล่อยตัวจากโปรแกรมทำนายการจ้างงานหกเดือนหลังการปล่อยตัวจากโปรแกรม

(โปรดทราบว่ามีตัวทำนายอื่น ๆ ในโมเดล แต่ฉันได้ยกเว้นพวกเขาเพราะพวกเขาไม่มีนัยสำคัญทางสถิติและฉันต้องการให้ชัดเจนที่สุดเท่าที่จะทำได้)

ทำนาย: อายุที่ออกจากโปรแกรมการฝึกอบรม (อายุเฉลี่ย = 17.4, SD = 1.2, ช่วง 14.3-20.5)

ผลลัพธ์: ลูกจ้างหรือไม่ (ลูกจ้าง = 1, ไม่ใช่ลูกจ้าง = 0)

ผลลัพธ์: อัตราต่อรอง 3.01 (p <.005) (ฉันไม่รวมความดีของสถิติพอดี ฯลฯ เพราะฉันกำลังหาคำตอบเกี่ยวกับการตีความอัตราส่วนอัตราต่อรองเท่านั้นฉันรู้สึกสบายใจกับการประเมินแบบพอดี CI ของ ฯลฯ )

ใส่ลงไปในคำ: เมื่ออายุเพิ่มขึ้นหนึ่งปีอัตราต่อรองของการจ้างงานเพิ่มขึ้นหกเดือนหลังจำหน่ายเพิ่มขึ้นสามหน่วย

คำถาม:

1) เมื่อฉันพูดว่า "เมื่ออายุเพิ่มขึ้นหนึ่งปี ... " จุดเริ่มต้นของอายุคืออะไร?

อายุเริ่มที่ศูนย์หรือไม่ ตัวอย่างเช่น "เมื่ออายุเพิ่มขึ้นจาก 0 [เช่นอายุต่ำสุดถ้าคุณวางโมเดลนี้ลงบนกราฟ] ... "

อายุเริ่มต้นที่อายุต่ำที่สุดในช่วงอายุในกลุ่มตัวอย่างหรือไม่? ตัวอย่างเช่น“ เมื่ออายุเพิ่มขึ้นจาก 14.3 ... ”

หรือ

อายุเริ่มต้นที่อายุเฉลี่ยของกลุ่มตัวอย่างหรือไม่ ตัวอย่างเช่น“ เมื่ออายุเพิ่มขึ้นจาก 17.4 ... ”,

2) การอยู่ตรงกลางช่วยให้ฉันตีความผลลัพธ์นี้หรือว่ามีประสิทธิภาพในการตีความ y-int เท่านั้น ถ้ามันช่วยได้ฉันกำลังคิดว่าจะทำการจัดกึ่งกลางหรือลบอายุต่ำสุดในช่วงจากช่วงอายุอื่น ๆ ในตัวอย่าง ข้อเสนอแนะใด ๆ

3) ในที่สุดมันก็เหมาะสมที่จะบอกว่าเมื่อเทียบกับเยาวชนอายุ 14 ปีเยาวชนอายุ 17 ปีมีแนวโน้มที่จะได้งานทำมากกว่าเก้าเท่า? ฉันถามเพราะฉันรู้ว่าการถดถอยแบบลอจิสติกถือว่าความสัมพันธ์แบบ sigmoidal และฉันอยากรู้ว่าอัตราการเพิ่มขึ้นของ 3 หน่วยนี้ยังคงสอดคล้องกัน ณ จุดใด ๆ ตามแนวการถดถอยหรือไม่

ขอบคุณมาก!

แอรอน


1
คุณอาจจะสนใจในการนี้
tchakravarty

4
การลบตัวแปร "ที่ไม่มีนัยสำคัญ" เป็นปัญหามาก
Frank Harrell

@ Frankankarrell คุณสามารถอธิบายรายละเอียดว่าทำไมการลบตัวแปรที่ไม่สำคัญนั้นเป็นปัญหาอย่างมากในกรณีนี้
Mark White

เรื่องนี้มีการหารือกันในเว็บไซต์นี้ สั้น ๆ มันซากปรักหักพังข้อผิดพลาดมาตรฐาน P-ค่าความเชื่อมั่นของการรายงานข่าวช่วงเวลาอื่น ๆ
แฟรงก์ Harrell

คำตอบ:


6

1) เนื่องจากเป็นอัตราต่อรองอัตราส่วนมันไม่สำคัญที่คุณเริ่ม อัตราต่อรองสำหรับอายุ 18 ปีเป็น 3 เท่าของอัตราสำหรับอายุ 17 ปี หรือราคาต่อรองสำหรับอายุ 17 ปีเป็น 1/3 ของอายุ 18 ปี สิ่งเดียวกัน หากคุณต้องการได้รับความน่าจะเป็นที่บุคคลของอายุที่เฉพาะเจาะจงจะได้รับการจ้างงานคุณสามารถใช้สูตรกับการประมาณค่าพารามิเตอร์ (ไม่ใช่ ORs) หรือคุณสามารถรับโปรแกรมที่คุณใช้ทำเพื่อคุณ

2) การมีศูนย์กลางอยู่ที่การช่วยเป็นเรื่องของความคิดเห็น ฉันไม่พบแบบจำลองกึ่งกลางที่ชัดเจนขึ้น แต่บางคนก็ทำได้

3) อัตราต่อรองไม่ตรงกับ "มีแนวโน้ม" (แม้ว่าคนจำนวนมากพูดราวกับว่าพวกเขาเป็น) และอัตราต่อรองสำหรับอายุ 17 ปีจะเป็น 27 เท่าของอายุ 14 ปี

ในที่สุดฉันก็จะระมัดระวังเกี่ยวกับโมเดลนี้ ตัวแบบสันนิษฐานว่า OR นั้นเหมือนกันระหว่าง 14 และ 15, 15 และ 16 เป็นต้น มันไม่น่าเป็นไปได้สำหรับฉันตามสิ่งที่ฉันรู้เกี่ยวกับเรื่องนี้


0

อัตราต่อรองโดยเฉลี่ยของการลงทะเบียนในปัญหาการฝึกอบรมสำหรับบุคคลคือ # ครั้งอัตราต่อรองสำหรับบุคคลอื่นที่อายุน้อยกว่าหนึ่งปี / เก่าหลังจากถือตัวแปรคงที่ทั้งหมด

นั่นคือสิ่งที่ฉันต้องทำ


1
คุณช่วยขยายว่าสิ่งนี้จะเพิ่มไปยังคำตอบก่อนหน้าได้หรือไม่?
mdewey
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.