ในการถดถอยเชิงเส้นแบบหลายครั้งพร้อมตัวถดถอยความสัมพันธ์สูงกลยุทธ์ที่ดีที่สุดที่จะใช้คืออะไร มันเป็นวิธีการที่ถูกต้องตามกฎหมายในการเพิ่มผลิตภัณฑ์ของ regressors สัมพันธ์ทั้งหมดหรือไม่
ในการถดถอยเชิงเส้นแบบหลายครั้งพร้อมตัวถดถอยความสัมพันธ์สูงกลยุทธ์ที่ดีที่สุดที่จะใช้คืออะไร มันเป็นวิธีการที่ถูกต้องตามกฎหมายในการเพิ่มผลิตภัณฑ์ของ regressors สัมพันธ์ทั้งหมดหรือไม่
คำตอบ:
ส่วนประกอบหลักมีเหตุผลมากมาย ... ทางคณิตศาสตร์ อย่างไรก็ตามฉันจะระวังเพียงแค่ใช้เคล็ดลับทางคณิตศาสตร์ในกรณีนี้และหวังว่าฉันไม่จำเป็นต้องคิดถึงปัญหาของฉัน
ฉันขอแนะนำให้ลองคิดดูว่าฉันมีตัวทำนายชนิดใดตัวแปรอิสระคืออะไรทำไมตัวทำนายของฉันถึงมีความสัมพันธ์ไม่ว่าผู้ทำนายของฉันบางคนกำลังวัดความเป็นจริงพื้นฐานเดียวกันหรือไม่ (ถ้าเป็นเช่นนั้นหรือไม่ การวัดเดี่ยวและสิ่งที่นักทำนายของฉันจะดีที่สุดสำหรับเรื่องนี้) สิ่งที่ฉันกำลังวิเคราะห์อยู่ - ถ้าฉันไม่สนใจการอนุมานเพียงแค่การทำนายแล้วฉันก็สามารถทิ้งสิ่งต่าง ๆ ได้ตราบที่อนาคต ค่าของผู้ทำนายคล้ายกับค่าในอดีต
คุณสามารถใช้ส่วนประกอบหลักหรือการถดถอยของสันเขาเพื่อจัดการกับปัญหานี้ ในทางกลับกันถ้าคุณมีตัวแปรสองตัวที่มีความสัมพันธ์กันสูงพอที่จะทำให้เกิดปัญหากับการประมาณค่าพารามิเตอร์คุณก็สามารถปล่อยหนึ่งในสองตัวแปรนี้ได้โดยไม่สูญเสียการทำนายมากนักเพราะตัวแปรทั้งสองมีข้อมูลเดียวกัน . แน่นอนว่าใช้ได้เฉพาะเมื่อปัญหาเกิดขึ้นเนื่องจากที่ปรึกษาที่มีความสัมพันธ์สูงสองคน เมื่อปัญหาเกี่ยวข้องกับตัวแปรมากกว่าสองตัวที่รวมกันเกือบเป็นสี (ทั้งสองอย่างนั้นอาจมีความสัมพันธ์ปานกลางเท่านั้น) คุณอาจต้องใช้วิธีอื่นอย่างใดอย่างหนึ่ง
นี่คือความคิดอื่นที่ได้รับแรงบันดาลใจจากคำตอบของสเตฟาน:
หาก regressors ที่สัมพันธ์กันบางส่วนของคุณมีความสัมพันธ์อย่างมีความหมาย (เช่นมันเป็นหน่วยวัดความฉลาดที่แตกต่างกันเช่นวาจาคณิตศาสตร์ ฯลฯ ) คุณสามารถสร้างตัวแปรเดี่ยวที่วัดตัวแปรเดียวกันโดยใช้หนึ่งในเทคนิคต่อไปนี้:
หาผลรวมของ regressors (เหมาะสมถ้า regressors เป็นองค์ประกอบทั้งหมดเช่นวาจา IQ + math IQ = IQ ทั้งหมด)
ค่าเฉลี่ยของ regressors (เหมาะสมถ้า regressors กำลังวัดโครงสร้างพื้นฐานเดียวกันเช่นขนาดของรองเท้าซ้ายขนาดของรองเท้าขวาเพื่อวัดความยาวของเท้า)
การวิเคราะห์ปัจจัย (เพื่อพิจารณาข้อผิดพลาดในการวัดและเพื่อแยกปัจจัยแฝง)
จากนั้นคุณสามารถปล่อย regressors ที่สัมพันธ์กันทั้งหมดและแทนที่ด้วยตัวแปรเดียวที่เกิดขึ้นจากการวิเคราะห์ข้างต้น
ฉันกำลังจะพูดมากเช่นเดียวกับ Stephan Kolassa ด้านบน (ดังนั้นได้ตอบคำถามของเขา upvoted) ฉันแค่เพิ่มว่าบางครั้งความสัมพันธ์หลากหลายอาจเกิดจากการใช้ตัวแปรมากมายซึ่งมีความสัมพันธ์อย่างมากกับการวัดขนาดและสิ่งต่าง ๆ สามารถปรับปรุงได้โดยใช้ตัวแปรแบบเข้มข้นนั่นคือการหารทุกอย่างด้วยการวัดขนาด เช่นหากหน่วยของคุณเป็นประเทศคุณอาจแบ่งตามประชากรพื้นที่หรือ GNP ขึ้นอยู่กับบริบท
โอ้ - และเพื่อตอบคำถามที่สองของคำถามเดิม: ฉันไม่สามารถนึกถึงสถานการณ์ใด ๆเมื่อเพิ่มผลิตภัณฑ์ของผู้ลงทะเบียนที่มีความเกี่ยวข้องทั้งหมดจะเป็นความคิดที่ดี มันจะช่วยได้อย่างไร มันหมายความว่าอะไร?
ฉันไม่มีความเชี่ยวชาญในเรื่องนี้ แต่ความคิดแรกของฉันคือการเรียกใช้การวิเคราะห์องค์ประกอบหลักในตัวแปรตัวทำนายจากนั้นใช้องค์ประกอบหลักที่เกิดขึ้นเพื่อทำนายตัวแปรตามของคุณ
นี่ไม่ใช่วิธีการรักษา แต่เป็นขั้นตอนในทิศทางที่ถูกต้องแน่นอน