ฉันพบคำถามเดียวกันทั้งหมดและพยายามหาทางผ่าน ดูคำตอบโดยละเอียดของฉันด้านล่าง
ก่อนอื่นฉันพบตัวเลือก 4 ตัวที่สร้างค่า VIF ที่คล้ายกันใน R:
• corvif
คำสั่งจากแพ็คเกจ AED
• vif
คำสั่งจากแพ็คเกจรถ
• vif
คำสั่งจากแพ็คเกจ rms
• vif
คำสั่งจากแพ็คเกจ DAAG
การใช้คำสั่งเหล่านี้กับชุดของตัวทำนายที่ไม่รวมถึงปัจจัย / ตัวแปรเชิงหมวดหมู่หรือคำพหุนามใด ๆ ก็จะแคบไปข้างหน้า ทั้งสามคำสั่งผลิตเอาต์พุตตัวเลขเดียวกันแม้ว่าcorvif
คำสั่งจากแพ็กเกจ AED จะเลเบลผลลัพธ์เป็น GVIF
อย่างไรก็ตามโดยทั่วไป GVIF จะเข้ามาเล่นเพื่อหาปัจจัยและตัวแปรพหุนาม ตัวแปรที่ต้องการค่าสัมประสิทธิ์มากกว่า 1 ค่าดังนั้นโดยทั่วไปแล้วมากกว่า 1 องศาอิสระจะถูกประเมินโดยใช้ GVIF สำหรับเงื่อนไขสัมประสิทธิ์เดียว VIF เท่ากับ GVIF
ดังนั้นคุณอาจใช้กฎมาตรฐานของหัวแม่มือว่า collinearity อาจเป็นปัญหาเช่นเกณฑ์ 3, 5 หรือ 10 อย่างไรก็ตามอาจมีการใช้ความระมัดระวัง (ควร) (ดู: http://www.nkd-group.com/ghdash/mba555/PDF/VIF%20article.pdf )
ในกรณีที่มีค่าสัมประสิทธิ์พหุคูณเช่นตัวทำนายเชิงหมวดหมู่ 4 แพ็กเกจจะสร้างเอาต์พุตที่แตกต่างกัน vif
คำสั่งจากอาร์และแพคเกจ Daag ผลิตค่า VIF ขณะที่อีกสองค่าผลิต GVIF
ให้เราดูค่า VIF จากแพ็คเกจ rms และ DAAG ก่อน:
TNAP ICE RegB RegC RegD RegE
1.994 2.195 3.074 3.435 2.907 2.680
TNAP และ ICE เป็นตัวทำนายอย่างต่อเนื่องและ Reg เป็นตัวแปรเด็ดขาดที่นำเสนอโดย Dummies RegB to RegE ในกรณีนี้ RegA เป็นข้อมูลพื้นฐาน ค่า VIF ทั้งหมดค่อนข้างปานกลางและมักไม่มีอะไรน่ากังวล ปัญหาเกี่ยวกับผลลัพธ์นี้คือมันได้รับผลกระทบจากพื้นฐานของตัวแปรเด็ดขาด เพื่อให้แน่ใจว่าไม่มีค่า VIF สูงกว่าระดับที่ยอมรับได้มันจำเป็นต้องทำการวิเคราะห์ซ้ำนี้สำหรับตัวแปรเด็ดขาดทุกระดับที่เป็นพื้นฐาน ในกรณีนี้ห้าครั้ง
การใช้corvif
คำสั่งจากแพ็คเกจ AED หรือvif
คำสั่งจากแพ็คเกจรถยนต์จะมีการสร้างค่า GVIF:
| GVIF | Df | GVIF^(1/2Df) |
TNAP | 1.993964 | 1 | 1.412078 |
ICE | 2.195035 | 1 | 1.481565 |
Reg | 55.511089 | 5 | 1.494301 |
GVIF ถูกคำนวณสำหรับชุด regressors ที่เกี่ยวข้องเช่น a สำหรับชุด regressors จำลอง สำหรับตัวแปรสองตัวต่อเนื่อง TNAP และ ICE นี้จะเหมือนกับค่า VIF ก่อน สำหรับตัวแปรจัดหมวดหมู่ตอนนี้เราได้รับค่า GVIF ที่สูงมากถึงแม้ว่าค่า VIF สำหรับระดับเดียวของตัวแปรหมวดหมู่จะอยู่ในระดับปานกลางทั้งหมด (ดังที่แสดงด้านบน)
อย่างไรก็ตามการตีความจะแตกต่างกัน สำหรับตัวแปรต่อเนื่องสองตัว (ซึ่งโดยทั่วไปแล้วจะเป็นรากที่สองของค่า VIF / GVIF เนื่องจาก DF = 1) เป็นการเปลี่ยนแปลงสัดส่วนของข้อผิดพลาดมาตรฐานและช่วงความมั่นใจของ ค่าสัมประสิทธิ์ของพวกเขาเนื่องจากระดับของ collinearity ค่าของตัวแปรเด็ดขาดเป็นตัววัดที่คล้ายกันสำหรับการลดความแม่นยำของการประมาณค่าสัมประสิทธิ์เนื่องจากการ collinearity (แม้ว่าจะไม่พร้อมสำหรับการอ้างยังดูhttp: / /socserv2.socsci.mcmaster.ca/jfox/papers/linear-models-problems.pdf )GVIF(1/(2×Df))GVIF(1/(2×Df))
ถ้าเราเพียงแค่ใช้กฎมาตรฐานเดียวกันสำหรับค่าตามที่แนะนำในวรรณกรรมสำหรับ VIF เราก็ต้องdf))}GVIF(1/(2×Df))GVIF(1/(2×Df))
การอ่านโพสต์ในฟอรัมทั้งหมดข้อความสั้น ๆ ในเว็บและเอกสารทางวิทยาศาสตร์ดูเหมือนว่ามีความสับสนเกิดขึ้นบ้าง ในเอกสารที่ได้รับการตรวจสอบโดยเพื่อนฉันพบว่าค่าสำหรับถูกละเว้นและกฎมาตรฐานเดียวกันที่แนะนำสำหรับ VIF นั้นถูกนำไปใช้กับค่า GVIF ในกระดาษอื่นค่า GVIF ที่มีค่าใกล้เคียง 100 ถูกยกเว้นเนื่องจากขนาดเล็กพอสมควร (เนื่องจาก DF สูง) กฎของถูกนำไปใช้ในบางสิ่งพิมพ์ซึ่งจะเท่ากับ VIF เท่ากับ 4 สำหรับตัวแปรสัมประสิทธิ์เดียวGVIF(1/(2×Df))GVIF(1/(2×Df))GVIF2(1/(2×Df))<2