ฉันพบข้อมูลอ้างอิงในบทความที่ชอบ:
ตาม Tabachnick & Fidell (1996) ตัวแปรอิสระที่มีความสัมพันธ์แบบ bivariate มากกว่า 0.70 ไม่ควรรวมอยู่ในการวิเคราะห์การถดถอยหลายครั้ง
ปัญหา:ฉันใช้ในการออกแบบการถดถอยหลายตัวมีความสัมพันธ์กับตัวแปร 3 ตัวแปร> .80, VIF ที่ประมาณ. 2 - .3, ความอดทน ~ 4-5 ฉันไม่สามารถยกเว้นตัวแปรใด ๆ (ตัวพยากรณ์และผลลัพธ์ที่สำคัญ) เมื่อฉันถดถอยผลลัพธ์ของตัวทำนาย 2 ตัวที่มีความสัมพันธ์กับ. 80 พวกเขายังคงมีนัยสำคัญแต่ละตัวทำนายความแปรปรวนที่สำคัญแต่ละตัวและตัวแปรสองตัวเดียวกันนี้มีค่าสัมประสิทธิ์สหสัมพันธ์ส่วนใหญ่และกึ่งกลางระหว่าง 10 ตัวแปรทั้งหมด
คำถาม:แบบจำลองของฉันใช้ได้แม้มีสหสัมพันธ์สูงหรือไม่ การอ้างอิงใด ๆ ยินดีอย่างมาก!
ขอบคุณสำหรับคำตอบ!
ฉันไม่ได้ใช้ Tabachnick และ Fidell เป็นแนวทางฉันพบการอ้างอิงนี้ในบทความที่เกี่ยวข้องกับ collinearity สูงในหมู่ผู้ทำนาย
ดังนั้นโดยทั่วไปฉันมีกรณีน้อยเกินไปสำหรับจำนวนของตัวทำนายในโมเดล (ตัวแปรเด็ดขาด, ตัวแปรควบคุมการเข้ารหัสหลอกตา - อายุ, อายุ, เพศ ฯลฯ ) - 13 ตัวแปรสำหรับ 72 กรณี ดัชนีเงื่อนไขคือ ~ 29 พร้อมการควบคุมทั้งหมดในและ ~ 23 ที่ไม่มีพวกเขา (5 ตัวแปร)
ฉันไม่สามารถวางตัวแปรใด ๆ หรือใช้การวิเคราะห์แบบแฟกทอเรียลเพื่อรวมเข้าด้วยกันเพราะในทางทฤษฎีแล้วพวกเขามีเหตุผลในตัวเอง สายเกินไปที่จะรับข้อมูลเพิ่มเติม เนื่องจากฉันกำลังทำการวิเคราะห์ใน SPSS อาจเป็นการดีที่สุดที่จะหาไวยากรณ์สำหรับการถดถอยของสันเขา (แม้ว่าฉันจะไม่ได้ทำสิ่งนี้มาก่อนและการตีความผลลัพธ์จะเป็นเรื่องใหม่สำหรับฉัน)
หากเป็นเรื่องสำคัญเมื่อฉันทำการถดถอยแบบขั้นตอนตัวแปร 2 ตัวที่มีความสัมพันธ์กันสูงจะยังคงเป็นตัวทำนายที่สำคัญของผลลัพธ์
และฉันก็ยังไม่เข้าใจว่าความสัมพันธ์บางส่วนที่สูงสำหรับตัวแปรเหล่านี้มีความสำคัญต่อคำอธิบายว่าทำไมฉันจึงเก็บมันไว้ในแบบจำลอง (ในกรณีที่ไม่สามารถทำการถดถอยได้)
คุณจะพูดว่า "การวินิจฉัยการถดถอย: การระบุข้อมูลที่มีอิทธิพลและแหล่งที่มาของความร่วมมือ / David A. Belsley, Edwin Kuh และ Roy E. Welsch, 1980" จะมีประโยชน์ในการทำความเข้าใจความหลากหลายทางชีวภาพ? หรือการอ้างอิงอื่น ๆ อาจมีประโยชน์หรือไม่