ฟังก์ชัน lm ใน R สามารถพิมพ์ค่าความแปรปรวนร่วมประมาณของสัมประสิทธิ์การถดถอย ข้อมูลนี้ให้อะไรกับเรา? ตอนนี้เราสามารถตีความแบบจำลองได้ดีขึ้นหรือวินิจฉัยปัญหาที่อาจเกิดขึ้นในแบบจำลองได้หรือไม่
ฟังก์ชัน lm ใน R สามารถพิมพ์ค่าความแปรปรวนร่วมประมาณของสัมประสิทธิ์การถดถอย ข้อมูลนี้ให้อะไรกับเรา? ตอนนี้เราสามารถตีความแบบจำลองได้ดีขึ้นหรือวินิจฉัยปัญหาที่อาจเกิดขึ้นในแบบจำลองได้หรือไม่
คำตอบ:
การใช้เมทริกซ์ความแปรปรวนร่วมขั้นพื้นฐานที่สุดคือการหาข้อผิดพลาดมาตรฐานของการประมาณค่าการถดถอย หากนักวิจัยสนใจเฉพาะข้อผิดพลาดมาตรฐานของพารามิเตอร์การถดถอยแต่ละตัวพวกเขาสามารถนำสแควร์รูทของเส้นทแยงมุมมารับข้อผิดพลาดมาตรฐานของแต่ละบุคคลได้
อย่างไรก็ตามบ่อยครั้งที่คุณอาจสนใจการรวมกันเชิงเส้นของพารามิเตอร์การถดถอย ตัวอย่างเช่นถ้าคุณมีตัวแปรตัวบ่งชี้สำหรับกลุ่มที่กำหนดคุณอาจสนใจในค่าเฉลี่ยกลุ่มซึ่งจะเป็น
P
จากนั้นเพื่อค้นหาข้อผิดพลาดมาตรฐานสำหรับค่าเฉลี่ยโดยประมาณของกลุ่มคุณจะมี
,
นอกจากนี้เมทริกซ์ความแปรปรวนร่วม (หรือมากกว่านั้นเมทริกซ์สหสัมพันธ์ซึ่งถูกระบุโดยไม่ซ้ำกันจากเมทริกซ์ความแปรปรวนร่วม แต่ไม่ใช่ในทางกลับกัน) จะมีประโยชน์มากสำหรับการวินิจฉัยแบบจำลองบางอย่าง หากตัวแปรสองตัวมีความสัมพันธ์กันสูงวิธีหนึ่งที่จะคิดเกี่ยวกับมันคือโมเดลกำลังมีปัญหาในการหาว่าตัวแปรใดที่รับผิดชอบผลกระทบ (เพราะสัมพันธ์กันอย่างใกล้ชิด) สิ่งนี้มีประโยชน์สำหรับกรณีที่หลากหลายเช่นการเลือกชุดย่อยของ covariates เพื่อใช้ในแบบจำลองการทำนาย หากตัวแปรสองตัวมีความสัมพันธ์กันสูงคุณอาจต้องการใช้หนึ่งในสองตัวแปรในแบบจำลองการทำนายของคุณ