ฉันควรใช้ปัจจัยเงินเฟ้อแปรปรวนใด:หรือ ?


30

ฉันพยายามที่จะตีความปัจจัยเงินเฟ้อแปรปรวนโดยใช้ฟังก์ชั่นในแพคเกจการvif R carฟังก์ชั่นการพิมพ์ทั้งทั่วไปและ{DF})} ตามไฟล์ช่วยเหลือค่าหลังนี้VIFGVIF1/(2df)

หากต้องการปรับสำหรับมิติของความเชื่อมั่นวงรีฟังก์ชันยังพิมพ์ GVIF ^ [1 / (2 * df)] โดยที่ df คือองศาอิสระที่เกี่ยวข้องกับคำนั้น

ฉันไม่เข้าใจความหมายของคำอธิบายนี้ในไฟล์ช่วยเหลือดังนั้นฉันไม่แน่ใจว่าควรใช้หรือ . สำหรับโมเดลของฉันค่าทั้งสองนี้แตกต่างกันมาก (สูงสุดคือ ~ ; สูงสุดคือ ~ )GVIFGVIF1/(2df)GVIF60GVIF1/(2df)3

มีคนช่วยอธิบายให้ฉันฟังหน่อยได้ไหมว่าฉันควรใช้อะไรดีและอะไรคือความหมายโดยการปรับมิติความเชื่อมั่นของวงรี?

คำตอบ:


25

Georges Monette และฉันแนะนำ GVIF ในกระดาษ "การวินิจฉัย collinearity ทั่วไป" JASA 87: 178-183, 1992 ( ลิงก์ ) ดังที่เราอธิบาย GVIF แสดงถึงอัตราส่วนกำลังสองของ hypervolumes ของ ellipsoid ร่วมความเชื่อมั่นสำหรับเซตย่อยของสัมประสิทธิ์ต่อ "ellipsoid" ที่จะได้รับถ้า regressors ในชุดย่อยนี้ไม่สัมพันธ์กับ regressors ในชุดย่อยเสริม ในกรณีที่มีค่าสัมประสิทธิ์เดียวสิ่งนี้เชี่ยวชาญใน VIF ปกติ เพื่อให้ GVIF เทียบเคียงข้ามมิติเราแนะนำให้ใช้ GVIF ^ (1 / (2 * Df)) โดยที่ Df คือจำนวนสัมประสิทธิ์ในชุดย่อย ซึ่งจะช่วยลด GVIF ให้กับการวัดเชิงเส้นและสำหรับ VIF โดยที่ Df = 1 เป็นสัดส่วนกับอัตราเงินเฟ้อเนื่องจาก collinearity ในช่วงความเชื่อมั่นสำหรับสัมประสิทธิ์


3
ยินดีต้อนรับสู่เว็บไซต์ของเรา! เราจะได้รับเกียรติหากคุณจะลงทะเบียนบัญชีของคุณและมาเยี่ยมเป็นครั้งคราว หมายเหตุการทำความสะอาดขนาดเล็กหนึ่งประการ: คุณไม่จำเป็นต้องเซ็นชื่อโพสต์ของคุณพร้อมลิงก์ไปยังหน้าผู้ใช้ของคุณจะถูกเพิ่มโดยอัตโนมัติในทุกคำตอบที่คุณให้
gung - Reinstate Monica

24

ฉันพบคำถามเดียวกันทั้งหมดและพยายามหาทางผ่าน ดูคำตอบโดยละเอียดของฉันด้านล่าง

ก่อนอื่นฉันพบตัวเลือก 4 ตัวที่สร้างค่า VIF ที่คล้ายกันใน R:

corvifคำสั่งจากแพ็คเกจ AED

vifคำสั่งจากแพ็คเกจรถ

vifคำสั่งจากแพ็คเกจ rms

vifคำสั่งจากแพ็คเกจ DAAG

การใช้คำสั่งเหล่านี้กับชุดของตัวทำนายที่ไม่รวมถึงปัจจัย / ตัวแปรเชิงหมวดหมู่หรือคำพหุนามใด ๆ ก็จะแคบไปข้างหน้า ทั้งสามคำสั่งผลิตเอาต์พุตตัวเลขเดียวกันแม้ว่าcorvifคำสั่งจากแพ็กเกจ AED จะเลเบลผลลัพธ์เป็น GVIF

อย่างไรก็ตามโดยทั่วไป GVIF จะเข้ามาเล่นเพื่อหาปัจจัยและตัวแปรพหุนาม ตัวแปรที่ต้องการค่าสัมประสิทธิ์มากกว่า 1 ค่าดังนั้นโดยทั่วไปแล้วมากกว่า 1 องศาอิสระจะถูกประเมินโดยใช้ GVIF สำหรับเงื่อนไขสัมประสิทธิ์เดียว VIF เท่ากับ GVIF

ดังนั้นคุณอาจใช้กฎมาตรฐานของหัวแม่มือว่า collinearity อาจเป็นปัญหาเช่นเกณฑ์ 3, 5 หรือ 10 อย่างไรก็ตามอาจมีการใช้ความระมัดระวัง (ควร) (ดู: http://www.nkd-group.com/ghdash/mba555/PDF/VIF%20article.pdf )

ในกรณีที่มีค่าสัมประสิทธิ์พหุคูณเช่นตัวทำนายเชิงหมวดหมู่ 4 แพ็กเกจจะสร้างเอาต์พุตที่แตกต่างกัน vifคำสั่งจากอาร์และแพคเกจ Daag ผลิตค่า VIF ขณะที่อีกสองค่าผลิต GVIF

ให้เราดูค่า VIF จากแพ็คเกจ rms และ DAAG ก่อน:

TNAP     ICE     RegB    RegC    RegD    RegE

1.994    2.195   3.074   3.435   2.907   2.680

TNAP และ ICE เป็นตัวทำนายอย่างต่อเนื่องและ Reg เป็นตัวแปรเด็ดขาดที่นำเสนอโดย Dummies RegB to RegE ในกรณีนี้ RegA เป็นข้อมูลพื้นฐาน ค่า VIF ทั้งหมดค่อนข้างปานกลางและมักไม่มีอะไรน่ากังวล ปัญหาเกี่ยวกับผลลัพธ์นี้คือมันได้รับผลกระทบจากพื้นฐานของตัวแปรเด็ดขาด เพื่อให้แน่ใจว่าไม่มีค่า VIF สูงกว่าระดับที่ยอมรับได้มันจำเป็นต้องทำการวิเคราะห์ซ้ำนี้สำหรับตัวแปรเด็ดขาดทุกระดับที่เป็นพื้นฐาน ในกรณีนี้ห้าครั้ง

การใช้corvifคำสั่งจากแพ็คเกจ AED หรือvifคำสั่งจากแพ็คเกจรถยนต์จะมีการสร้างค่า GVIF:

     |  GVIF     | Df | GVIF^(1/2Df) |  

TNAP | 1.993964  | 1  | 1.412078     |
ICE  | 2.195035  | 1  | 1.481565     | 
Reg  | 55.511089 | 5  | 1.494301     |

GVIF ถูกคำนวณสำหรับชุด regressors ที่เกี่ยวข้องเช่น a สำหรับชุด regressors จำลอง สำหรับตัวแปรสองตัวต่อเนื่อง TNAP และ ICE นี้จะเหมือนกับค่า VIF ก่อน สำหรับตัวแปรจัดหมวดหมู่ตอนนี้เราได้รับค่า GVIF ที่สูงมากถึงแม้ว่าค่า VIF สำหรับระดับเดียวของตัวแปรหมวดหมู่จะอยู่ในระดับปานกลางทั้งหมด (ดังที่แสดงด้านบน)

อย่างไรก็ตามการตีความจะแตกต่างกัน สำหรับตัวแปรต่อเนื่องสองตัว (ซึ่งโดยทั่วไปแล้วจะเป็นรากที่สองของค่า VIF / GVIF เนื่องจาก DF = 1) เป็นการเปลี่ยนแปลงสัดส่วนของข้อผิดพลาดมาตรฐานและช่วงความมั่นใจของ ค่าสัมประสิทธิ์ของพวกเขาเนื่องจากระดับของ collinearity ค่าของตัวแปรเด็ดขาดเป็นตัววัดที่คล้ายกันสำหรับการลดความแม่นยำของการประมาณค่าสัมประสิทธิ์เนื่องจากการ collinearity (แม้ว่าจะไม่พร้อมสำหรับการอ้างยังดูhttp: / /socserv2.socsci.mcmaster.ca/jfox/papers/linear-models-problems.pdf )GVIF(1/(2×Df))GVIF(1/(2×Df))

ถ้าเราเพียงแค่ใช้กฎมาตรฐานเดียวกันสำหรับค่าตามที่แนะนำในวรรณกรรมสำหรับ VIF เราก็ต้องdf))}GVIF(1/(2×Df))GVIF(1/(2×Df))

การอ่านโพสต์ในฟอรัมทั้งหมดข้อความสั้น ๆ ในเว็บและเอกสารทางวิทยาศาสตร์ดูเหมือนว่ามีความสับสนเกิดขึ้นบ้าง ในเอกสารที่ได้รับการตรวจสอบโดยเพื่อนฉันพบว่าค่าสำหรับถูกละเว้นและกฎมาตรฐานเดียวกันที่แนะนำสำหรับ VIF นั้นถูกนำไปใช้กับค่า GVIF ในกระดาษอื่นค่า GVIF ที่มีค่าใกล้เคียง 100 ถูกยกเว้นเนื่องจากขนาดเล็กพอสมควร (เนื่องจาก DF สูง) กฎของถูกนำไปใช้ในบางสิ่งพิมพ์ซึ่งจะเท่ากับ VIF เท่ากับ 4 สำหรับตัวแปรสัมประสิทธิ์เดียวGVIF(1/(2×Df))GVIF(1/(2×Df))GVIF2(1/(2×Df))<2


ยินดีต้อนรับสู่เว็บไซต์ @JanPhilippS ดูเหมือนว่าคำถามใหม่จะเป็นคำตอบสำหรับคำถามของ OP โปรดใช้ฟิลด์ "คำตอบของคุณ" เพื่อให้คำตอบเท่านั้น หากคุณมีคำถามของคุณเองคลิก[ASK QUESTION]ที่ด้านบนและถามคำถามจากนั้นเราสามารถช่วยคุณได้อย่างถูกต้อง เนื่องจากคุณยังใหม่ที่นี่คุณอาจต้องการเข้าชมทัวร์ของเราซึ่งมีข้อมูลสำหรับผู้ใช้ใหม่
gung - Reinstate Monica

2
มันไม่ใช่คำถามใหม่เลย ค่อนข้างคำตอบโดยละเอียด
Jan Philipp S

1
@JanPhilippS ขอบคุณสำหรับลิงก์ไปยังแหล่งข้อมูลสำหรับการอ่านเพิ่มเติม ฉันคิดว่าโพสต์ของคุณดูเหมือนจะเป็นคำตอบที่มีคุณภาพที่อนุญาตให้สะท้อนถึงสถานการณ์ของประเทศ
timothy.s.lau

6

Fox & Monette (การอ้างอิงดั้งเดิมสำหรับ GVIF, GVIF ^ 1 / 2df) แนะนำให้นำ GVIF ไปใช้กำลัง 1 / 2df ทำให้ค่าของ GVIF เทียบได้กับพารามิเตอร์ที่แตกต่างกัน "เป็นการยากที่จะเอาสแควร์รูทของปัจจัยความแปรปรวน - เงินเฟ้อตามปกติ" (จากคู่หู R และ S-Plus ไปจนถึงการถดถอยแบบประยุกต์โดย John Fox) ใช่แล้วยกกำลังสองและใช้ VIF "กฎแห่งหัวแม่มือ" ตามปกติดูเหมือนจะสมเหตุสมผล

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.