ฉันกำลังใช้โมเดลเชิงเส้นเชิงเส้นผสม
ฉันใช้แพ็คเกจ "lme4" ใน R
แบบจำลองของฉันอยู่ในรูปแบบ:
model <- lmer(response ~ predictor1 + predictor2 + (1 | random effect))
ก่อนใช้แบบจำลองของฉันฉันตรวจสอบความเป็นไปได้หลายทางระหว่างตัวทำนาย
ฉันทำสิ่งนี้โดย:
ทำดาต้าเฟรมของเครื่องทำนาย
dummy_df <- data.frame(predictor1, predictor2)
ใช้ฟังก์ชัน "cor" เพื่อคำนวณความสัมพันธ์ของ Pearson ระหว่างตัวทำนาย
correl_dummy_df <- round(cor(dummy_df, use = "pair"), 2)
หาก "correl_dummy_df" มากกว่า 0.80 แล้วฉันตัดสินใจว่าตัวทำนาย 1 และทำนาย 2 มีความสัมพันธ์สูงเกินไปและไม่รวมอยู่ในแบบจำลองของฉัน
ในการอ่านหนังสือบางส่วนจะมีวิธีที่เป็นไปได้มากกว่าในการตรวจสอบความหลากหลายของสี
ใครมีคำแนะนำเกี่ยวกับเรื่องนี้หรือไม่?
"Variance Inflation Factor (VIF)" ดูเหมือนเป็นวิธีการที่ถูกต้องวิธีหนึ่ง
สามารถคำนวณ VIF ได้โดยใช้ฟังก์ชั่น "corvif" ในแพ็คเกจ AED (ไม่ใช่ cran) แพคเกจที่สามารถพบได้ที่http://www.highstat.com/book2.htm แพคเกจรองรับหนังสือดังต่อไปนี้:
Zuur, AF, Ieno, EN, Walker, N. , Saveliev, AA & Smith, GM 2009 โมเดลผสมเอฟเฟกต์และส่วนขยายในระบบนิเวศน์พร้อม R, รุ่นที่ 1 สปริงเกอร์นิวยอร์ก
ดูเหมือนว่ากฎทั่วไปของหัวแม่มือคือถ้า VIF เป็น> 5 แล้วความสัมพันธ์ระหว่างกันหลายค่าสูงระหว่างตัวทำนาย
การใช้ VIF นั้นแข็งแกร่งกว่าความสัมพันธ์แบบเพียร์สันอย่างง่าย ๆ หรือไม่?
ปรับปรุง
ฉันพบบล็อกที่น่าสนใจที่:
http://hlplab.wordpress.com/2011/02/24/diagnosing-collinearity-in-lme4/
Blogger มีรหัสที่เป็นประโยชน์ในการคำนวณ VIF สำหรับรุ่นจากแพ็คเกจ lme4
ฉันทดสอบโค้ดแล้วและใช้งานได้ดี ในการวิเคราะห์ที่ตามมาของฉันฉันพบว่า multicollinearity ไม่ใช่ปัญหาสำหรับโมเดลของฉัน (ค่า VIF ทั้งหมด <3) สิ่งนี้น่าสนใจเนื่องจากก่อนหน้านี้ฉันพบความสัมพันธ์เพียร์สันสูงระหว่างผู้ทำนายบางคน
http://highstat.com/Books/BGS/GAMM/RCodeP2/HighstatLibV6.R
AED
แพคเกจได้ถูกยกเลิก ; แทนเพียงsource("http://www.highstat.com/Book2/HighstatLibV6.R")
สำหรับcorvif
ฟังก์ชั่น (2) หวังว่าจะให้คำตอบที่แท้จริง แต่ (a) ฉันเชื่อว่า VIF คำนึงถึงความหลากหลายทางชีวภาพ (เช่นคุณอาจมีตัวทำนายสามตัวซึ่งไม่มีความสัมพันธ์แบบคู่ที่แข็งแกร่ง แต่การรวมเชิงเส้นของ A และ B นั้นสัมพันธ์กับ C มาก ) และ (b) ฉันมีการจองที่ดีเกี่ยวกับภูมิปัญญาของการวางเงื่อนไข collinear; ดู Graham Ecology 2003, ดอย: 10.1890 / 02-3114