การถดถอยสำหรับตัวแปรอิสระอย่างเด็ดขาดและขึ้นอยู่กับอย่างต่อเนื่อง


20

ฉันเพิ่งรู้ว่าฉันได้ทำงานเสมอปัญหาการถดถอยที่ตัวแปรอิสระเป็นตัวเลขเสมอ ฉันสามารถใช้การถดถอยเชิงเส้นในกรณีที่ตัวแปรอิสระทั้งหมดจัดหมวดหมู่ได้หรือไม่?

คำตอบ:


24

เพียงแค่ความหมายและชัดเจน:

  • ตัวแปรตาม == ผล == " " ในสูตรการถดถอยเช่น yy=β0+β1x1+β2x2+...+βkxk
  • ตัวแปรอิสระ == ตัวทำนาย == หนึ่งใน " xk " ในสูตรการถดถอยเช่นy=β0+β1x1+β2x2+...+βkxk

ดังนั้นในสถานการณ์ส่วนใหญ่ประเภทของการถดถอยเป็น dependend กับชนิดของขึ้นอยู่กับผลหรือ " y " ตัวแปร ตัวอย่างเช่นการถดถอยเชิงเส้นจะใช้เมื่อตัวแปรตามคือต่อเนื่องการถดถอยโลจิสติกเมื่อขึ้นอยู่กับการจัดหมวดหมู่ที่มี 2 หมวดหมู่และ multinomi (n) al การถดถอยเมื่อขึ้นอยู่กับเป็นหมวดหมู่ที่มีมากกว่า 2 หมวด ทำนายที่สามารถเป็นอะไรก็ได้ (เด็ดขาดเล็กน้อยหรือลำดับหรือต่อเนื่องหรือผสม)

(หมายเหตุด้านล่างอาจซ้ำซ้อนสำหรับคุณ แต่ฉันเพิ่มไว้แล้ว)

แต่ไม่ทราบว่าซอฟต์แวร์ส่วนใหญ่คุณจะต้อง recode พยากรณ์เด็ดขาดกับระบบตัวเลขฐานสอง นี่หมายถึงการเข้ารหัสเพศเป็น 0 สำหรับผู้หญิงและ 1 สำหรับเพศชายหรือในทางกลับกัน สำหรับตัวแปรเด็ดขาดที่มีมากกว่า 2 ระดับคุณจะต้องทำการบันทึกใหม่เหล่านี้ลงในตัวแปรจำลองโดยที่คือจำนวนของระดับและหุ่นเหล่านี้มี 0 หรือ 1 เมื่ออยู่ในหมวดหมู่ที่สอดคล้องกัน วิธีนี้แต่ละคน (ตัวอย่าง) ควรแสดงด้วยการมี 1 สำหรับตัวแปรจำลองเขา / เธอเป็นส่วนหนึ่งและ 0 สำหรับคนอื่น ๆ หรือ 0 สำหรับหุ่นทั้งหมดเมื่อเขา / เธอเป็นส่วนหนึ่งของกลุ่มอ้างอิงลิตรL1L


ขอบคุณ ขณะที่ฉันเขียนในชื่อคำถามตัวแปรตามคือต่อเนื่อง ดังนั้นฉันจึงใช้คำตอบของคุณว่า "คุณสามารถใช้การถดถอยเชิงเส้นหากคุณเข้ารหัสแบบจำลอง" โปรดแก้ไขฉันหากฉันผิด
famargar

ใช่นั่นคือสิ่งที่ฉันพูด
IWS

2
ฉันเห็นคุณได้แก้ไขคำถามเพื่อเพิ่มคำถามที่สองและโพสต์ quesiton ที่คล้ายกันที่นี่: stats.stackexchange.com/questions/267137/... นอกจากนี้ฉันจะถามคุณว่าคุณหมายถึงอะไรโดยการทำให้การคาดการณ์ของคุณราบรื่นหรือสิ่งที่คุณหมายถึงโดยการทำนายค่าที่ไม่ต่อเนื่อง AFAIK การถดถอยเชิงเส้นจะให้ค่าเฉลี่ยของการพึ่งพาต่อเนื่องตามตัวแปรตัวทำนายของคุณ (ผ่านสูตรการถดถอย) โปรดอธิบายอย่างละเอียด
IWS

1
ฉันลบคำถามที่สองเมื่อคุณตอบคำถามเดิมอย่างเต็มที่ ที่จะตอบคำถามของคุณถ้าฉันอาหารใหม่ "เหตุการณ์" ( ) กับรูปแบบที่ฉันจะได้รับที่แตกต่างกันค่าที่จะใช้เวลาทุกหนึ่งในสี่ของค่าถดถอย ฉันเดาว่าฉันกำลังบอกว่าถ้าตัวแปรเด็ดขาดเป็นลำดับจริง ๆ ฉันอยากจะแนะนำบางอย่าง (logit?) ทำให้เรียบระหว่างค่า x i n ynxiny
famargar

1
ในกรณีของตัวแปรอันดับหนึ่งเราสามารถเลือกที่จะสมมติว่ามันเป็น "ต่อเนื่องมากพอ" ที่จะใช้มันราวกับว่ามันเป็นตัวทำนายต่อเนื่อง (โดยไม่ได้ใช้หุ่นจำลอง แต่เข้าสู่ตัวแปรเป็นรุ่นที่เป็นตัวเลข) อย่างไรก็ตามหากคุณทำสิ่งนี้และคุณมีเพียงไม่กี่ระดับคุณจะได้เส้นตรง (ซึ่งถือว่าเป็นเส้นตรง) ผ่านจุดสองสามจุดเท่านั้น (โปรดทราบว่าจำนวนระดับมีความสำคัญที่นี่) สเกล Likert เป็นตัวอย่างที่ดีของตัวแปรที่ใช้วิธีนี้ซึ่งสร้างปัญหาอย่างน่าเสียดายในหลายโอกาส
IWS
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.