การถดถอยโลจิสติกพร้อมตัวแปรไบนารีและตัวแปรอิสระ


15

มันเหมาะสมที่จะทำการถดถอยโลจิสติกที่ตัวแปรทั้งสองขึ้นอยู่กับและเป็นอิสระหรือไม่ ตัวอย่างเช่นตัวแปรที่ขึ้นต่อกันคือ 0 และ 1 และตัวทำนายคือตัวแปรที่มีรหัสความคมชัด -1 และ 1?

คำตอบ:


6

ไม่มีเหตุผลที่จะไม่ทำสิ่งนี้ แต่มีสองข้อควรระวัง:

  1. ติดตามอย่างระมัดระวังในระหว่างการวิเคราะห์ซึ่งเป็นที่ ในโครงการขนาดใหญ่สามารถหลงทางได้ง่ายและให้ผลลัพธ์ที่ผิดพลาด

  2. หากคุณเลือกที่จะรายงานการประเมินการถดถอยมากกว่าอัตราส่วนอัตราต่อรองทำให้รูปแบบการเข้ารหัสของคุณชัดเจนในรายงานของคุณดังนั้นผู้อ่านจะไม่สร้าง OR ที่ไม่ถูกต้องด้วยตัวเองโดยสมมติว่าพวกเขาถูกเข้ารหัส 0,1

อาจดูธรรมดา แต่ฉันเคยเห็นปัญหาทั้งสองเรื่องทำให้มันกลายเป็นบทความที่ตีพิมพ์


ดังนั้นจึงควรแยก datafile ออกเป็น 6 กรณีและเรียกใช้การเปรียบเทียบแต่ละรายการในแต่ละชุดข้อมูลด้วยตัวทำนายรหัสแบบบีบอัด?
upabove

ฉันไม่แน่ใจว่าสิ่งที่คุณขอบิตที่สองนี้โดยสุจริต คุณช่วยให้สิ่งที่คุณหวังว่าจะทำให้สำเร็จเป็นจริงได้ไหม?
Fomite

ฉันมีชุดข้อมูลที่มี 3 ระหว่างและ 4 ภายในเงื่อนไขของหัวข้อ ฉันต้องการทดสอบผลกระทบแต่ละอย่าง แต่การถดถอยครั้งเดียวที่มีการโต้ตอบทั้งหมดพลาดข้อมูลจำนวนมากที่ฉันสนใจแทนฉันจะแบ่งข้อมูลตามเงื่อนไขเป็นชุดข้อมูลที่แยกจากกัน การเข้ารหัสโค้ดสำหรับความแตกต่างที่ฉันสนใจ
upabove

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีที่ฉันใช้รหัสความคมชัดดูที่นี่: stats.stackexchange.com/questions/14546/ …
upabove

11

สำหรับความชัดเจน: คำว่า "binary" มักจะสงวนไว้กับการเข้ารหัส 1 vs 0 เท่านั้น คำทั่วไปที่เหมาะสมสำหรับการเข้ารหัส 2 ค่าใด ๆ คือ "dichotomous" แน่นอนว่าการทำนายแบบสองขั้วนั้นยินดีต้อนรับสู่การถดถอยแบบลอจิสติกเช่นเดียวกับการถดถอยเชิงเส้นและเนื่องจากมีเพียง 2 ค่าเท่านั้นจึงไม่แตกต่างกันว่าจะใส่ปัจจัยเหล่านั้นเป็นปัจจัยหรือเป็นตัวแปรร่วม


5

โดยทั่วไปแล้วจะช่วยในการตีความหากคุณเขียนโปรแกรมทำนายผลของคุณ 0-1 แต่นอกเหนือจากนั้น (และเมื่อสังเกตว่าไม่จำเป็น) มันไม่มีอะไรผิดปกติ มีวิธีการอื่น ๆ (ตามตารางฉุกเฉิน) แต่ถ้าฉันจำได้อย่างถูกต้องสิ่งเหล่านี้กลายเป็นสิ่งที่เทียบเท่ากับการถดถอยโลจิสติก (บางรูปแบบ)

ในระยะสั้น: ฉันเห็นเหตุผลที่จะไม่ทำเช่นนี้


ขอบคุณ! และถ้าฉันมีตัวทำนายรหัสที่มีความคมชัด 3 ตัวและฉันเขียนรหัสพวกมันทั้งหมด 0-1 พวกเขาจะไม่เป็นมุมฉาก ตัวอย่างเช่นฉันมี 4 หมวดหมู่และสามรหัสของฉันคือ L1: 1, -1,0,0 L2: 0,1, -1,0, L3: 0,0,1, -1 เป็นปัญหาหรือไม่?
upabove

ตัวอย่าง L-matrix (L1, L2, L3) ของคุณคือความแตกต่างที่ซ้ำกันโดยแต่ละหมวดหมู่จะถูกเปรียบเทียบกับหมวดหมู่ต่อไปนี้ ทั้งตัวทำนายความคมชัดเหล่านี้เป็นแบบฉากและไม่ได้เป็นแบบไบนารี (รหัสเป็น 0-1) ในความเป็นจริงค่าของพวกเขาคือ. 75 เทียบกับ -.25 (ตัวแปรที่ 1), .5 เทียบกับ -.5 (ตัวแปรที่สอง), .25 เทียบกับ -.75 (ตัวแปรที่ 3)
ttnphns

3

นอกจากนี้หากคุณมีตัวทำนายมากกว่าสองตัวก็มีแนวโน้มว่าจะมีปัญหาของความหลากหลายเชิงเส้นแม้กระทั่งสำหรับการโลจิสติกหรือการถดถอยหลายครั้ง อย่างไรก็ตามไม่มีอันตรายใด ๆ ที่จะใช้การถดถอยโลจิสติกกับตัวแปรไบนารีทั้งหมด (เช่นรหัส (0,1))

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.