วิธีจัดการกับตัวแปรเด็ดขาดลำดับเป็นตัวแปรอิสระ


18

ฉันใช้โมเดล logit ตัวแปรตามของฉันคือไบนารี 1.very good, 2.good, 3.average, 4.poor and 5.very poorแต่ฉันมีตัวแปรอิสระซึ่งเป็นเด็ดขาดและมีการตอบ: ดังนั้นมันจึงเป็นอันดับ ("เด็ดขาดเชิงปริมาณ") ฉันไม่แน่ใจว่าจะจัดการกับสิ่งนี้อย่างไรในแบบจำลอง gretlฉันใช้

[หมายเหตุจาก @ttnphns: แม้ว่าคำถามจะบอกว่าตัวแบบนั้นเป็น logit (เนื่องจากการพึ่งพานั้นจัดอยู่ในหมวดหมู่) แต่ประเด็นสำคัญ - ตัวแปรอิสระลำดับ- มีความเหมือนกัน ดังนั้นคำถามก็มีความเกี่ยวข้องเท่าเทียมกันกับการพูดการถดถอยเชิงเส้นเช่นกันเช่นเดียวกับการถดถอยแบบโลจิสติกหรือแบบจำลองการบันทึกอื่น ๆ ]


ตัวแปรตามของฉันมีค่า 0 และ 1, ฉันมีตัวแปรอิสระ 6 ตัว, 3 ตัวอยู่ในหมวดหมู่ตัวแปรเหล่านี้มีลักษณะเหมือน "คุณให้คะแนนบริการสุขภาพท้องถิ่นในพื้นที่ของคุณอย่างไรคุณจะให้คะแนนการขนส่งในพื้นที่ของคุณอย่างไร บริการตำรวจในพื้นที่ของคุณคำตอบนั้นดีมากดีปานกลางแย่และแย่มาก
rahmat

@Tim หากตัวแปรตามเป็นไบนารีแล้วไม่จำเป็นต้องมีการถดถอยอันดับใด ๆ ความหมายคือการจัดการตัวทำนายลำดับโดยใช้ตัวแปรตัวบ่งชี้ (จำลอง)
Nick Cox

ขอบคุณทิมถ้าฉันไม่เข้าใจผิดในสิ่งที่คุณพูดคือว่าฉันควรจะสร้างหุ่นจำลองสำหรับทุกหมวดหมู่ ?? ตัวอย่างเช่นฉันมีห้าคำตอบ (ดีมากดีปานกลางแย่และแย่มาก) สำหรับ indep varible หนึ่งดังนั้นฉันควรสร้าง 5 หุ่น
rahmat

คำตอบ:


14

ปัญหาของตัวแปรอิสระอันดับที่ว่าเนื่องจากตามคำจำกัดความช่วงเวลาที่แท้จริงระหว่างระดับของมันไม่เป็นที่รู้จักไม่มีความสัมพันธ์ของประเภทที่เหมาะสม - นอกเหนือจากร่ม "monotonic" - สามารถสันนิษฐาน apriori เราต้องทำอะไรบางอย่างเกี่ยวกับมันเช่น - เพื่อ "คัดกรองหรือรวมตัวแปร" หรือ "ชอบสิ่งที่เพิ่มประสิทธิภาพสูงสุด"

หากคุณยืนยันในการรักษาคะแนน likert ของคุณ IV เป็นลำดับ (แทนช่วงเวลาหรือเล็กน้อย) ฉันมีทางเลือกให้คุณ

  1. ใช้ความแตกต่างพหุนาม Ie เช่นตัวทำนายแต่ละตัวที่ใช้ในแบบจำลองไม่เพียง แต่ป้อนเข้าแบบเชิงเส้น แต่ยังมีกำลังสองและแบบสองมิติ ดังนั้นไม่เพียง แต่เป็นเส้นตรง แต่สามารถสร้างเอฟเฟ็กต์โมโนโทนได้ทั่วไป (เอฟเฟ็กต์เชิงเส้นตรงกับตัวทำนายที่เก็บไว้เป็นสเกล / ช่วงเวลา นอกจากนี้ยังสามารถป้อนข้อมูลจำลองของตัวทำนายแต่ละตัวได้เช่นกันซึ่งจะทดสอบผลกระทบเล็กน้อย / ค่าแฟกทอเรียล ในตอนท้ายของทั้งหมดนั้นคุณรู้ว่าตัวทำนายของคุณทำหน้าที่เป็นตัวประกอบเท่าใดเชิงเส้น covariate และเท่าไหร่ covariate ไม่เชิงเส้น ตัวเลือกนี้ทำได้ง่ายในเกือบทุกการถดถอย (โมเดลเชิงเส้นลอจิสติกและเส้นตรงทั่วไปอื่น ๆ ) มันจะใช้df s ดังนั้นขนาดตัวอย่างควรมีขนาดใหญ่พอ
  2. ใช้การปรับขนาดที่เหมาะสมถดถอย วิธีการนี้จะแปลงตัวทำนายลำดับแบบ monotonically เป็นช่วงเวลาหนึ่งเพื่อเพิ่มผลเชิงเส้นสูงสุดให้กับตัวทำนายและ CATREG (เด็ดขาดถดถอย) เป็นการดำเนินการตามความคิดนี้ใน SPSS ปัญหาหนึ่งของกรณีเฉพาะของคุณคือคุณต้องการโลจิสติกไม่ใช่การถดถอยเชิงเส้น แต่ CATREG ไม่ใช่โมเดล logit ฉันคิดว่าอุปสรรคนี้ค่อนข้างน้อยเนื่องจากการทำนายของคุณเป็นเพียง 2 หมวดหมู่ (ไบนารี): ฉันหมายความว่าคุณยังคงทำ CATREG เพื่อการปรับขนาดที่เหมาะสมจากนั้นทำการถดถอยโลจิสติกขั้นสุดท้าย
  3. โปรดทราบว่าในกรณีง่าย ๆ ของสเกลหนึ่งหรือลำดับ DV และหนึ่งทดสอบIV Jonckheere-Terpstraอันดับหนึ่งอาจเป็นการวิเคราะห์ที่สมเหตุสมผลแทนการถดถอย

อาจมีข้อเสนอแนะอื่น ๆ เช่นกัน สามข้อข้างต้นเป็นสิ่งที่อยู่ในใจของฉันเพียงแค่อ่านคำถามของคุณทันที

ผมขอแนะนำให้คุณไปเยี่ยมชมหัวข้อเหล่านี้: การเชื่อมโยงระหว่างชื่อและขนาดหรือลำดับ ; การเชื่อมโยงระหว่างลำดับและขนาด พวกเขาอาจมีประโยชน์แม้ว่าพวกเขาจะไม่เกี่ยวกับการถดถอยแบบพิเศษ

แต่หัวข้อเหล่านี้เป็นเรื่องเกี่ยวกับการถดถอยโลจิสติกโดยเฉพาะอย่างยิ่ง: คุณต้องดูภายใน: หนึ่ง , สอง , สาม , สี่ , ห้า


(+1) (1) คุณสามารถใช้ความแตกต่างของพหุนามเพียงสองสามข้อแรกหากคุณคิดว่าเพียงพอ (2) การกำหนดตัวพยากรณ์จากการตอบสนองในชุดข้อมูลเดียวกันควรมาพร้อมกับคำเตือนเรื่องสุขภาพ (3) นอกจากนี้คุณยังสามารถลงโทษความแตกต่างระหว่างค่าสัมประสิทธิ์ของระดับที่อยู่ติดกัน - ดูstats.stackexchange.com/q/77796/17230
Scortchi - Reinstate Monica

1
@Scortchi ขอบคุณสำหรับความคิดเห็น เกี่ยวกับ (2) - ใช่โดยเฉพาะอย่างยิ่งแน่นอนว่ามีความน่าเชื่อถือมากขึ้นในการปรับขนาดที่เหมาะสมบนชุดย่อยแยกต่างหากของข้อมูลที่จะทำการถดถอยขั้นสุดท้าย (3) - ขอบคุณฉันจะทำความคุ้นเคยกับมันด้วย
ttnphns

1
อีกทางเลือกหนึ่งคือการใช้แบบจำลอง aditive และเป็นตัวแทนของตัวแปรอิสระลำดับผ่านเส้นโค้ง
kjetil b halvorsen

2
@kjetilbhalvorsen ใช่มันเป็นไปได้ขอบคุณ อย่างไรก็ตามตัวเลือกนี้มีการระบุไว้ในพอยต์ 2 เนื่องจากหนึ่งในวิธีการปรับขนาดที่เหมาะสมที่สุดสำหรับตัวแปรลำดับใช้เส้นโค้ง
ttnphns

7

เพียงเพื่อเพิ่มไปยังคำตอบที่ยอดเยี่ยมอื่น ๆ : วิธีการที่ทันสมัยในการจัดการมันอาจจะผ่านรูปแบบการเติมซึ่งเป็นตัวแทนของตัวแปรอิสระลำดับผ่านทางโค้ง หากคุณค่อนข้างแน่ใจว่าเอฟเฟกต์ของตัวแปรเป็นเสียงโมโนคุณสามารถ จำกัด เสียงเดียวได้ (สำหรับตัวอย่างของเส้นโค้งโมโนโทนที่ใช้งานอยู่ให้ดูที่การค้นหาฟังก์ชันเพื่อให้พอดีกับเส้นโค้งที่มีลักษณะคล้าย sigmoid )

ใน R ถ้าคุณทำให้ตัวทำนายลำดับเป็น "ปัจจัยที่สั่ง" (เช่นโค้ดord <- factor(sample(1:5,20,replace=TRUE),ordered=TRUE) ) จากนั้นในโมเดลเชิงเส้นมันจะแสดงผ่านพหุนามแบบฉากมุมฉาก


4
มันน่าจะขยายได้เล็กน้อยเพื่อรวมรายละเอียดเพิ่มเติมเล็กน้อยว่ามันจะทำงานอย่างไรกับตัวทำนายลำดับ
ttnphns

0

k1k


3
n

1
ขอบคุณทิมและนิค ดังนั้นฉันจะต้องเรียกใช้หุ่นทั้งสี่ในการถดถอย ขวา? ถ้าเป็นเช่นนั้นฉันมีตัวแปรเด็ดขาด 3 ตัวแปรแต่ละตัวมีการตอบสนอง 5 ครั้ง ดังนั้นแบบจำลองของฉันจะมี 12 ตัวแปร ขวา?
rahmat

1
ขอบคุณ @NickCox - ฉันยังใหม่กับโลก CV และชื่นชมการแก้ไขเคารพ
Austin T

1
น่าเสียดายที่คุณยังไม่ได้อธิบายว่าทำไมต้องใช้ตัวแปรจำลองทั้งหมด ฉันไม่รู้สึกว่าคำตอบนี้เป็นอย่างไรในขณะนี้ดูเหมือนเป็นคำตอบของคำถาม
ttnphns

2
ในการสนับสนุนผมไม่คิดว่ามันเป็นกรณีที่มีการเถียงกันว่าตัวชี้วัดนี้เป็นสิ่งจำเป็น ; เป็นเพียงการที่พวกเขาอนุญาตให้มีเอฟเฟกต์ที่หลากหลายในการจับภาพรวมถึงความสัมพันธ์ที่ไม่ใช่แบบโมโนโทนิก
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.