การถดถอยแบบขั้นตอนใน R - ค่า p สำคัญ


12

p-value ที่สำคัญที่ใช้โดยstep()ฟังก์ชันใน R สำหรับการถดถอยแบบขั้นตอนคืออะไร? ฉันคิดว่ามันคือ 0.15 แต่สมมติฐานของฉันถูกต้อง ฉันจะเปลี่ยนค่า p วิกฤตได้อย่างไร


7
ฟังก์ชัน 'ขั้นตอน' ของ R เป็นพื้นฐานของ AIC
Michael M

7
เป็นการดีที่สุดที่จะไม่ใช้รูทีนการเลือกรุ่นตามขั้นตอนเลย จะเข้าใจว่าทำไมมันอาจช่วยให้คุณอ่านคำตอบของฉันที่นี่: อัลกอริทึมสำหรับการเลือกรูปแบบอัตโนมัติ
gung - Reinstate Monica

3
เพิ่มเติมจากความคิดเห็นของ @ MichaelMayer: Descriptionส่วนหนึ่งของหน้าความช่วยเหลือที่จะ?stepกล่าวอย่างครบถ้วน: เลือกแบบจำลองสูตรตาม AIC
Stephan Kolassa

คำตอบ:


27

ตามที่ฉันอธิบายไว้ในความคิดเห็นของฉันในคำถามอื่นของคุณให้stepใช้ AIC แทนค่า p

อย่างไรก็ตามสำหรับตัวแปรเดี่ยวในแต่ละครั้ง AIC จะสอดคล้องกับการใช้ค่า p-0.15 (หรือแม่นยำยิ่งขึ้น 0.1573):

พิจารณาเปรียบเทียบสองรุ่นซึ่งแตกต่างกันด้วยตัวแปรเดียว เรียกรุ่น (รุ่นเล็ก) และM 1 (รุ่นที่ใหญ่กว่า) แล้วปล่อยให้ AIC เป็นAIC 0และAIC 1ตามลำดับM0M1AIC0AIC1

AIC1<AIC02logL0(2logL1)>2

αχ122logL0(2logL1)>Cα

2χ1210.843=0.15715.7%


ดังนั้นคุณจะแก้ไขได้อย่างไร

ง่าย. เปลี่ยนkพารามิเตอร์stepจาก 2 เป็นอย่างอื่น คุณต้องการ 10% แทนเหรอ? ทำให้ 2.7:

qchisq(0.10,1,lower.tail=FALSE)
[1] 2.705543

คุณต้องการ 2.5% หรือไม่ ชุดk=5:

qchisq(0.025,1,lower.tail=FALSE)
[1] 5.023886

และอื่น ๆ


อย่างไรก็ตามถึงแม้จะเป็นการแก้ปัญหาของคุณฉันขอแนะนำให้คุณใส่ใจกับคำตอบของ Frank Harrell ในคำถามอื่นของคุณและเพื่อค้นหาคำตอบจากนักสถิติจำนวนมากเกี่ยวกับคำถามอื่น ๆ ที่เกี่ยวข้องกับการถดถอยแบบขั้นตอนที่นี่ซึ่งคำแนะนำมีแนวโน้มมาก อย่างสม่ำเสมอเพื่อหลีกเลี่ยงขั้นตอนแบบขั้นตอนโดยทั่วไป


คำอธิบายที่ดี คุณรู้หรือไม่ว่าสิ่งนี้จะถือเป็นจริงโดยประมาณสำหรับค่า p ของการทดสอบการถดถอยทั่วไปหรือไม่
Ben Ogorek

α=0.05

(ctd) ... ปัญหาร้ายแรงที่เกิดขึ้นกับ stepwise อื่น ๆ รวมถึงการประเมินแบบเอนเอียงและข้อผิดพลาดมาตรฐานที่น้อยเกินไป
Glen_b -Reinstate Monica

1
ปัญหาที่เกิดขึ้นกับการเลือกแบบจำลองแบบขั้นตอนเป็นระยะ ๆ ฉันสนใจที่จะสรุปกฎ AIC ที่มีขนาดเล็ก => .1573 ค่า p อัตราส่วนความน่าจะเป็นที่คุณอธิบายได้เป็นปกติ แต่ในกิจวัตรประจำวันของ Rm lm การประมาณ / std.err จะถูกเปรียบเทียบกับการแจกแจงแบบ t นี่คือการทดสอบที่แตกต่างกันและฉันสงสัยว่าผลการ. 1573 ของคุณอาจมีค่าประมาณ
Ben Ogorek

2
tk

4

ดังที่ได้กล่าวไว้ข้างต้นstepฟังก์ชั่นใน R จะขึ้นอยู่กับเกณฑ์ AIC แต่ฉันเดาด้วยค่า p คุณหมายถึงอัลฟาที่จะป้อนและอัลฟาที่จะออก สิ่งที่คุณสามารถทำได้คือการใช้ฟังก์ชั่นstepwiseที่เขียนโดยพอลรูบินและสามารถใช้ได้ที่นี่ อย่างที่คุณเห็นว่าคุณมีอาร์กิวเมนต์ของ alpha.to.enter และ alpha.to.leave ที่คุณสามารถเปลี่ยนได้ โปรดทราบว่าฟังก์ชั่นนี้ใช้การทดสอบแบบ F หรือการทดสอบทีเท่ากันเพื่อเลือกรุ่น ยิ่งไปกว่านั้นมันสามารถจัดการไม่เพียง แต่การถดถอยแบบขั้นตอน แต่ยังส่งต่อการเลือกและกำจัดไปข้างหลังเช่นกันถ้าคุณกำหนดข้อโต้แย้งอย่างถูกต้อง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.