เหตุใดค่า p จึงทำให้เข้าใจผิดหลังจากทำการเลือกตามลำดับขั้นตอน


28

ลองพิจารณาตัวอย่างเช่นโมเดลการถดถอยเชิงเส้น ฉันได้ยินมาว่าในการขุดข้อมูลหลังจากทำการเลือกตามขั้นตอนตามเกณฑ์ AIC มันทำให้เข้าใจผิดว่าการดูค่า p เพื่อทดสอบสมมติฐานว่างว่าสัมประสิทธิ์การถดถอยจริงแต่ละตัวมีค่าเป็นศูนย์ ฉันได้ยินมาว่าควรพิจารณาตัวแปรทั้งหมดที่เหลือในตัวแบบว่ามีสัมประสิทธิ์การถดถอยที่แท้จริงแตกต่างจากศูนย์แทน มีใครอธิบายได้ไหม ขอขอบคุณ.



1
ในtheoreticalecology.wordpress.com/2018/05/03/ …ฉันแสดงรหัส R แสดงให้เห็นถึงอัตราเงินเฟ้อประเภทที่ 1 หลังจากการเลือก AIC โปรดทราบว่ามันไม่สำคัญว่ามันจะเป็นแบบขั้นตอนหรือทั่วโลกประเด็นคือการเลือกรุ่นนั้นเป็นการทดสอบหลายครั้ง
Florian Hartig

คำตอบ:


33

หลังจากดำเนินการเลือกแบบขั้นตอนตามเกณฑ์ AIC มันทำให้เข้าใจผิดในการดูค่า p เพื่อทดสอบสมมติฐานว่างว่าแต่ละสัมประสิทธิ์การถดถอยที่แท้จริงเป็นศูนย์

อันที่จริงค่า p แสดงถึงความน่าจะเป็นที่จะเห็นสถิติการทดสอบอย่างน้อยที่สุดเท่าที่คุณมีเมื่อสมมติฐานว่างเป็นจริง ถ้าเป็นจริงค่า p ควรมีการแจกแจงแบบสม่ำเสมอH0

แต่หลังจากการเลือกแบบขั้นตอน (หรือแน่นอนหลังจากความหลากหลายของวิธีการเลือกรูปแบบอื่น ๆ ) ค่า p ของคำเหล่านั้นที่ยังคงอยู่ในแบบจำลองนั้นไม่มีคุณสมบัตินั้นแม้ว่าเราจะรู้ว่าสมมติฐานว่างเปล่านั้นเป็นจริง

สิ่งนี้เกิดขึ้นเพราะเราเลือกตัวแปรที่มีหรือมีแนวโน้มที่จะมีค่า p น้อย ๆ (ขึ้นอยู่กับเกณฑ์ที่แม่นยำที่เราใช้) ซึ่งหมายความว่าค่า p ของตัวแปรที่เหลืออยู่ในแบบจำลองนั้นมักจะเล็กกว่ามากหากเราจะติดตั้งแบบจำลองเดียว โปรดทราบว่าการเลือกจะเลือกรุ่นโดยเฉลี่ยที่ดูเหมือนจะดีกว่าโมเดลจริงถ้าคลาสของโมเดลมีโมเดลจริงหรือหากคลาสของโมเดลยืดหยุ่นเพียงพอที่จะประมาณโมเดลจริงอย่างใกล้ชิด

[นอกจากนี้และด้วยเหตุผลเดียวกันค่าสัมประสิทธิ์ที่เหลืออยู่นั้นมีอคติห่างจากศูนย์และข้อผิดพลาดมาตรฐานของพวกเขานั้นมีอคติต่ำ สิ่งนี้จะส่งผลกระทบต่อช่วงความเชื่อมั่นและการคาดการณ์เช่นกัน - การคาดการณ์ของเราจะแคบเกินไปเช่น]

ในการดูเอฟเฟกต์เหล่านี้เราสามารถทำการถดถอยหลายครั้งโดยที่ค่าสัมประสิทธิ์บางค่าเป็น 0 และบางค่าไม่ได้ดำเนินการตามขั้นตอนแบบขั้นตอนจากนั้นสำหรับแบบจำลองเหล่านั้นที่มีตัวแปรที่มีค่าสัมประสิทธิ์เป็นศูนย์

(ในการจำลองเดียวกันคุณสามารถดูค่าประมาณและส่วนเบี่ยงเบนมาตรฐานสำหรับค่าสัมประสิทธิ์และค้นหาค่าที่ตรงกับค่าสัมประสิทธิ์ที่ไม่เป็นศูนย์ได้เช่นกัน)

กล่าวโดยสรุปไม่เหมาะสมที่จะพิจารณาค่า p ปกติว่ามีความหมาย

ฉันได้ยินมาว่าควรพิจารณาตัวแปรทั้งหมดที่เหลืออยู่ในตัวแบบเป็นสำคัญแทน

สำหรับว่าค่าทั้งหมดในแบบจำลองหลังจากขั้นตอนควรเป็น 'ถือว่ามีความสำคัญ' ฉันไม่แน่ใจว่าขอบเขตที่เป็นวิธีที่มีประโยชน์ในการดู "ความสำคัญ" มีเจตนาที่จะหมายถึงอะไร?


นี่คือผลลัพธ์ของการรัน R stepAICโดยมีการตั้งค่าเริ่มต้นใน 1,000 ตัวอย่างจำลองที่มี n = 100 และตัวแปรตัวเลือกสิบตัว (ไม่มีสิ่งใดที่เกี่ยวข้องกับการตอบสนอง) ในแต่ละกรณีจำนวนคำที่เหลืออยู่ในแบบจำลองจะถูกนับ:

ป้อนคำอธิบายรูปภาพที่นี่

มีเพียง 15.5% เท่านั้นที่เลือกรุ่นที่ถูกต้อง เวลาที่เหลือของแบบจำลองรวมคำศัพท์ที่ไม่แตกต่างจากศูนย์ หากเป็นไปได้จริง ๆ แล้วว่ามีตัวแปรสัมประสิทธิ์เป็นศูนย์ในชุดของตัวแปรที่มีผลบังคับใช้เราน่าจะมีหลายเงื่อนไขที่ค่าสัมประสิทธิ์ที่แท้จริงเป็นศูนย์ในแบบจำลองของเรา ด้วยเหตุนี้จึงไม่ชัดเจนว่าเป็นความคิดที่ดีที่จะพิจารณาว่าทั้งหมดไม่ใช่ศูนย์


ด้วยประโยคที่ว่า "ผมได้ยินว่าควรพิจารณาตัวแปรทั้งหมดที่เหลืออยู่ในรูปแบบเป็นสำคัญแทน" ฉันหมายถึง: "ผมได้ยินว่าควรพิจารณาตัวแปรทั้งหมดที่เหลืออยู่ในรูปแบบที่มีค่าสัมประสิทธิ์การถดถอยจริงที่แตกต่างกันรูปแบบศูนย์แทน"
John M

เอาล่ะ; ฉันได้เพิ่มผลลัพธ์ของการจำลองที่พูดถึงสิ่งนั้น
Glen_b -Reinstate Monica

10
+1 ฉันทำแบบจำลองเดียวกันสุดสัปดาห์นี้เพื่อเตรียมตัวสำหรับชั้นเรียนเกี่ยวกับวิธีการเลือกแบบจำลอง ฉันได้รับรูปแบบผลลัพธ์เดียวกันสำรวจถึงตัวแปรและใช้การสังเกตแบบขั้นตอนต่อไปคือการดูว่าการแก้ไข Bonferroni อาจทำอะไร ... k=33910k
whuber

7
@whuber แน่นอนเห็นว่ามีผลกระทบต่อ Bonferroni จะมี (ในหลายแง่มุมของปัญหา) คือความชอบทันทีของฉันในการทำแบบจำลองข้างต้นเช่นกัน แต่มันไม่ใช่สิ่งที่ผู้คนมักจะทำตามขั้นตอนดังนั้นฉันไม่ได้อยู่ ที่นี่. ฉันยินดีที่จะได้ยินคุณพูดคุยเกี่ยวกับวิธีการเลือกรุ่น ฉันคาดหวังว่าฉันจะเรียนรู้ไม่น้อย
Glen_b -Reinstate Monica

@Glen_b: (อ้างจากคำตอบของคุณ) ซึ่งหมายความว่าค่า p ของตัวแปรที่เหลือในแบบจำลองนั้นมีขนาดเล็กกว่ามากหากเราติดตั้งแบบจำลองเดียวแม้ว่า "ถ้าแบบที่เราพอดีเกิดขึ้น อันที่สร้างข้อมูลไม่ว่าโมเดลจริงจะเป็นโมฆะหรือไม่ " คุณช่วยอธิบายส่วนที่ไฮไลต์หน่อยได้ไหม? เป็นไปได้อย่างไรที่ค่า p จะเล็กลงในโมเดลที่มีข้อกำหนดเหมือนกับกระบวนการสร้างข้อมูล (โมเดลจริง)
shani

8

การเปรียบเทียบอาจช่วยได้ การถดถอยแบบขั้นตอนเมื่อตัวแปรผู้สมัครที่เป็นตัวบ่งชี้ (จำลอง) ตัวแปรที่เป็นตัวแทนของประเภทพิเศษร่วมกัน (ในขณะที่ ANOVA) สอดคล้องตรงกับการเลือกที่จะรวมกลุ่มโดยการหากลุ่มที่มีความแตกต่างน้อยที่สุดโดย -tests หาก ANOVA ดั้งเดิมได้รับการทดสอบกับแต่กลุ่มที่ยุบตัวสุดท้ายจะถูกทดสอบกับโดยที่สถิติที่ได้นั้นจะไม่มีการแจกแจงแบบและ ความน่าจะเป็นบวกที่ผิดพลาดจะไม่สามารถควบคุมได้tFp1,np1Fq1,nq1q<pF

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.