เมื่อใดที่จะวางเทอมจากตัวแบบการถดถอย


20

ใครสามารถให้คำแนะนำถ้าต่อไปนี้ทำให้รู้สึก:

ฉันกำลังจัดการกับตัวแบบเชิงเส้นธรรมดาที่มีตัวทำนาย 4 ตัว ฉันอยู่ในใจทั้งสองว่าจะทิ้งคำที่สำคัญน้อยที่สุดหรือไม่ มันคือมากกว่า 0.05 เล็กน้อย ฉันโต้เถียงในความโปรดปรานของการปล่อยมันไปตามบรรทัดเหล่านี้: คูณการประมาณของคำนี้โดย (ตัวอย่าง) ช่วง interquartile ของข้อมูลตัวอย่างสำหรับตัวแปรนี้ให้ความหมายบางอย่างกับผลทางคลินิกที่ทำให้คำนี้มีรูปแบบโดยรวม . เนื่องจากตัวเลขนี้ต่ำมากโดยประมาณเท่ากับค่าทั่วไปภายในช่วงเวลาที่ตัวแปรสามารถใช้เมื่อทำการวัดในการตั้งค่าทางคลินิกฉันจึงเห็นว่ามันไม่ได้มีนัยสำคัญทางคลินิกและอาจถูกทิ้งเพื่อให้แบบจำลองที่น่าเชื่อถือยิ่งขึ้น แม้ว่าการดร็อปจะเป็นการลดการปรับpเล็กน้อยR2


1
ทำไมคุณถึงมองหารูปแบบที่นิยมมากขึ้น?
Michael Bishop

3
ไม่ใช่ความดีในตัวเองหรือ? วิธีที่ฉันเห็นโมเดลที่มีตัวแปรที่เพิ่มพลังการอธิบายน้อยหรือไม่มีเลยในทางคลินิกนั้นแย่กว่ารุ่นที่เล็กกว่าโดยไม่มีตัวแปรเหล่านั้นแม้ว่าตัวแปรเหล่านั้นจะมีความหมายในเชิงสถิติ
ก็ตาม

ฉันตัดสินใจที่จะเขียนคำตอบ: stats.stackexchange.com/questions/17624/... แต่ในระยะสั้นไม่ฉันไม่คิดว่า parsimony เป็นสิ่งที่ดีในตัวเอง บางครั้งมันมีประโยชน์สำหรับเหตุผลเฉพาะ
Michael Bishop

1
ฉันเห็นด้วยกับไมเคิล ที่ดีที่สุดคือการรวมตัวแปรที่ไม่มีความสามารถในการอธิบายอย่างชัดเจนหากพวกเขาได้รับโอกาสที่จะ "สำคัญ"; คุณใช้เวลาไปกับอิสรภาพแล้ว
Frank Harrell

โปรดทราบว่าตัวคาดคะเนที่ไม่ใช่ผู้ถดถอยที่สำคัญสามารถยังคงมีส่วนร่วมในจำนวนที่ไม่เป็นศูนย์ของความแปรปรวนที่อธิบายไว้ในกรณีของผู้ลงทะเบียนที่มีความสัมพันธ์ - โดยมีอิทธิพลต่อผู้ลงทะเบียนที่สำคัญอื่น ๆ โดยเฉพาะอย่างยิ่งกับผู้ทำนายเพียงสี่คนเท่านั้นหากผู้ลงทะเบียนมีความสัมพันธ์กันฉันจะโต้แย้งในการรักษาแบบจำลองที่ไม่สำคัญในแบบจำลอง
Torvon

คำตอบ:


18

ฉันไม่เคยเข้าใจความปรารถนาที่จะประหยัด การเสาะหา parsimony ทำลายทุกแง่มุมของการอนุมานทางสถิติ (อคติของสัมประสิทธิ์การถดถอยข้อผิดพลาดมาตรฐานช่วงความเชื่อมั่นค่า P) เหตุผลที่ดีในการเก็บรักษาตัวแปรคือการรักษาความถูกต้องของช่วงความเชื่อมั่นและปริมาณอื่น ๆ ลองใช้วิธีนี้: มีการพัฒนาตัวประมาณค่าที่ไม่เอนเอียงสองตัวของความแปรปรวนที่เหลืออยู่ในการถดถอยพหุคูณสามัญ: (1) การประเมินจากตัวแบบ (ขนาดใหญ่) ที่กำหนดไว้ล่วงหน้าและ (2) การประเมินจากตัวแบบลดลง of freedom (GDF) สำหรับองศาการถดถอยอิสระที่ชัดเจน (ลดลง) GDF จะใกล้เคียงกับจำนวนของพารามิเตอร์ตัวเลือกมากกว่าจำนวนของพารามิเตอร์ "นัยสำคัญ" ขั้นสุดท้าย

นี่คือวิธีคิดอีกวิธีหนึ่ง สมมติว่าคุณกำลังทำ ANOVA เพื่อเปรียบเทียบ 5 การรักษารับ 4 df F-test จากนั้นด้วยเหตุผลบางอย่างที่คุณดูความแตกต่างระหว่างการรักษาโดยใช้ t-tests และตัดสินใจที่จะรวมหรือลบบางส่วนของการรักษา (เช่นเดียวกับการเลือกแบบขั้นตอนโดยใช้ P, AIC, BIC, Cp ในตัวแปรจำลอง 4 ตัว) ผลลัพธ์การทดสอบ F ที่มี 1, 2 หรือ 3 df จะทำให้เกิดข้อผิดพลาดประเภท I ที่สูงเกินจริง F-test ดั้งเดิมที่มี 4 df มีการปรับหลายระดับที่สมบูรณ์แบบ


3
+1 Parsimony เป็นสิ่งที่มักจะเหมาะสมในบริบทที่เฉพาะเจาะจงเท่านั้น ไม่มีเหตุผลที่จะเล่นเกมอคติกับความแม่นยำหากคุณมีความแม่นยำพอที่จะทำทั้งสองอย่าง
Fomite

2
+1 สำหรับคำตอบที่ดี แต่ถ้าคุณมีความสัมพันธ์อันหลากหลายและการลบตัวแปรลดมันลงไป? (กรณีนี้ไม่ใช่ในคำถามเดิม แต่มักจะอยู่ในข้อมูลอื่น) แบบจำลองที่เกิดขึ้นมักจะไม่ดีกว่าในทุกวิธี (ลดความแปรปรวนของตัวประมาณค่าสัญญาณของค่าสัมประสิทธิ์มีแนวโน้มที่จะสะท้อนทฤษฎีพื้นฐาน ฯลฯ ) หรือไม่ หากคุณยังคงใช้องศาอิสระ (รุ่นดั้งเดิม) ที่ถูกต้อง
Peter Ellis

4
มันยังดีกว่าที่จะรวมตัวแปรทั้งสอง ราคาเดียวที่คุณจ่ายคือข้อผิดพลาดมาตรฐานที่เพิ่มขึ้นในการประมาณหนึ่งในเอฟเฟกต์ของตัวแปรที่ปรับสำหรับอีกอันหนึ่ง การทดสอบร่วมกันของตัวแปร collinear ทั้งสองนั้นมีประสิทธิภาพมากเนื่องจากพวกมันรวมแรงเข้าด้วยกันมากกว่าที่จะแข่งขันกันเอง นอกจากนี้หากคุณต้องการลบตัวแปรข้อมูลจะไม่สามารถบอกได้ว่าจะลบตัวใด
Frank Harrell

17

คำตอบเหล่านี้เกี่ยวกับการเลือกตัวแปรทั้งหมดคิดว่าค่าใช้จ่ายในการสังเกตตัวแปรคือ 0

และนั่นไม่เป็นความจริง

ในขณะที่ปัญหาของการเลือกตัวแปรสำหรับรูปแบบที่กำหนดอาจหรืออาจไม่เกี่ยวข้องกับการเลือกความหมายสำหรับพฤติกรรมในอนาคตไม่เกี่ยวข้องกับการเลือก

พิจารณาปัญหาของการทำนายว่าผู้กำกับเส้นคนใดจะทำดีที่สุดใน NFL คุณเป็นแมวมอง คุณต้องพิจารณาคุณสมบัติของ linemen ปัจจุบันใน NFL ที่สามารถคาดการณ์ความสำเร็จได้มากที่สุด คุณวัดปริมาณ 500 และเริ่มงานของการเลือกปริมาณที่จะต้องใช้ในอนาคต

คุณควรทำอะไร? คุณควรเก็บทั้งหมด 500 ไว้หรือไม่ ควรกำจัด (เครื่องหมายโหราศาสตร์, วันในสัปดาห์เกิด) หรือไม่?

นี่เป็นคำถามที่สำคัญและไม่ใช่เชิงวิชาการ มีค่าใช้จ่ายในการสังเกตข้อมูลและกรอบของความคุ้มค่าแสดงให้เห็นว่าไม่จำเป็นต้องสังเกตตัวแปรบางตัวในอนาคตเนื่องจากค่าต่ำ


4
+1: จุดสำคัญและน่าสนใจ มันยังแสดงให้เห็นว่าคำถามนั้นไม่สมบูรณ์เพราะมันไม่ได้บ่งบอกถึงวัตถุประสงค์ของแบบจำลอง (ค่าใช้จ่ายจะมีความเกี่ยวข้องน้อยกว่าสำหรับแบบจำลองทางวิทยาศาสตร์ที่พยายามสร้างทฤษฎีอธิบาย แต่จะมาถึงก่อนหน้านี้ในรูปแบบการทำนายที่มีไว้สำหรับการใช้ซ้ำ ๆ )
whuber

6

มีอีกสองเหตุผลที่เป็นไปได้สำหรับการเก็บรักษาตัวแปร: 1) มันมีผลต่อพารามิเตอร์สำหรับตัวแปร OTHER 2) ความจริงที่ว่ามันมีขนาดเล็กมีความน่าสนใจทางการแพทย์ในตัวเอง

หากต้องการดูประมาณ 1 คุณสามารถดูค่าที่ทำนายไว้สำหรับแต่ละคนจากโมเดลที่มีและไม่มีตัวแปรในโมเดล ฉันแนะนำให้ทำ scatterplot ของค่าสองชุดนี้ หากไม่มีความแตกต่างใหญ่นั่นคือเหตุผลที่ขัดแย้งกับเหตุผลนี้

สำหรับ 2 ลองคิดดูว่าทำไมคุณถึงมีตัวแปรนี้ในรายการตัวแปรที่เป็นไปได้ มันขึ้นอยู่กับทฤษฎีหรือไม่ งานวิจัยอื่นพบว่ามีเอฟเฟกต์ขนาดใหญ่หรือไม่?


มี collinearity น้อยมากที่พูดถึงดังนั้นการลบตัวแปรนี้สร้างความแตกต่างน้อยมากกับคนอื่น ๆ นั่นเป็นประเด็นที่น่าสนใจเกี่ยวกับเรื่องนี้ว่าเป็นเรื่องน่าสนใจทางคลินิกถ้ามันมีขนาดเล็ก ข้อมูลมาจากการสำรวจเชิงสำรวจอย่างน้อยในตอนนี้ไม่มีเหตุผลที่จะคาดหวังว่าตัวแปรใดตัวแปรหนึ่งจะมีความสำคัญมากกว่าตัวแปรอื่นใด อย่างไรก็ตามมีความผันผวนในระหว่างวันในตัวแปรนี้ดังนั้นหากพบว่าผลกระทบมีขนาดใกล้เคียงกับความผันผวนนี้ดูเหมือนว่าฉันจะไม่ได้มีความสำคัญทางการแพทย์มากนัก
P Sellaz

ตกลงแล้วดูเหมือนจะเป็นตัวเลือกที่ดีสำหรับการลบ
Peter Flom - Reinstate Monica

@P Sellaz - หาก "ข้อมูลมาจากการสำรวจเชิงสำรวจ" นั่นหมายความว่าผู้เข้าร่วมเลือกด้วยตนเองหรือไม่? ฉันพบว่า @Frank Harrell แสดงความคิดเห็นถึงสิ่งที่ต้องคำนึงถึง แต่ความกังวลเกี่ยวกับความแม่นยำที่เข้มงวดของค่า p ช่วงเวลาความมั่นใจ ฯลฯ จะกลายเป็นสิ่งที่สงสัยหากตัวอย่างถูกเลือกด้วยตนเอง
rolando2

ฉันคิดว่ามันจะกลายเป็นที่สงสัยหากคุณไม่ได้ใช้พวกเขา
Frank Harrell

@FrankHarrel - โปรดอธิบาย: "พวกเขา" =?
rolando2

6

คำแนะนำที่พบบ่อยที่สุดในวันนี้คือการได้รับ AIC ของทั้งสองรุ่นและนำมาใช้กับ AIC ที่ต่ำกว่า ดังนั้นถ้าแบบจำลองเต็มรูปแบบของคุณมี AIC -20 และแบบจำลองที่ไม่มีตัวทำนายที่อ่อนแอที่สุดจะมี AIC> -20 ดังนั้นคุณจะต้องรักษาแบบจำลองทั้งหมดไว้ บางคนอาจแย้งว่าถ้าความแตกต่าง <3 คุณเก็บไว้ที่ง่ายกว่า ฉันชอบคำแนะนำที่คุณสามารถใช้ BIC เพื่อทำลาย "ความสัมพันธ์" เมื่อ AIC อยู่ภายใน 3 ของกันและกัน

หากคุณกำลังใช้ R แล้วคำสั่งที่จะได้รับ AIC คือ AIC...

ฉันมีหนังสือเรียนเกี่ยวกับการสร้างแบบจำลองที่นี่จากต้น 90 ปีที่แนะนำว่าคุณทิ้งการทำนายทั้งหมดของคุณที่ไม่สำคัญ อย่างไรก็ตามนี่หมายความว่าคุณจะไม่ต้องพึ่งพาความซับซ้อนที่ตัวทำนายเพิ่มหรือลบออกจากแบบจำลอง นอกจากนี้ยังเป็นเพียงสำหรับ ANOVA ที่ความสำคัญเป็นเรื่องเกี่ยวกับความแปรปรวนอธิบายมากกว่าขนาดของความลาดชันในแง่ของสิ่งอื่น ๆ ที่ได้รับการอธิบาย คำแนะนำที่ทันสมัยยิ่งขึ้นของการใช้ AIC คำนึงถึงปัจจัยเหล่านี้ มีเหตุผลหลายประการที่ควรรวมตัวทำนายที่ไม่สำคัญแม้ว่ามันจะไม่สำคัญก็ตาม ตัวอย่างเช่นอาจมีปัญหาความสัมพันธ์กับตัวทำนายอื่น ๆ ซึ่งอาจเป็นตัวทำนายที่ค่อนข้างง่าย หากคุณต้องการคำแนะนำที่ง่ายที่สุดไปกับ AIC และใช้ BIC เพื่อทำลายความสัมพันธ์และใช้ 3 ข้อเพื่อเป็นหน้าต่างแห่งความเท่าเทียมกัน


เล็กกว่าดีกว่าในการแทน R ใช่ไหม
Aaron - Reinstate Monica

ขอบคุณสำหรับการตอบกลับของคุณ. ฉันพบว่าความแตกต่างใน AIC ระหว่างสองรุ่นมีเพียง 2
P Sellaz

รุ่นที่มีขนาดเล็กมีขนาดใหญ่กว่าเล็กน้อย AIC และ BIC AIC: AIC ขนาดใหญ่ขนาดเล็ก = -2 BIC: ขนาดใหญ่ขนาดเล็ก BIC- 7.8
P Sellaz

แอรอน .. โอ๊ะ ... ต่ำกว่าคงที่ ...
จอห์น

1
เพื่อล้างบางสิ่งบางอย่างคำเพิ่มเติมนี้เป็นเพียง covariate อื่นและมี collinearity น้อยมาก
P Sellaz

4

คุณใช้โมเดลนี้เพื่ออะไร ความประหยัดเป็นเป้าหมายสำคัญหรือไม่

แบบจำลองทางการเงินที่เป็นที่นิยมมากกว่านั้นเป็นที่ต้องการในบางสถานการณ์ แต่ฉันไม่อยากบอกว่าการใช้ความนิยมทางเพศเป็นสิ่งที่ดีในตัวเอง รูปแบบการหลอกลวงสามารถเข้าใจและสื่อสารได้ง่ายขึ้นและการทำนายความสามารถช่วยป้องกันการปรับตัวเกินขนาดได้ แต่บ่อยครั้งที่ปัญหาเหล่านี้ไม่ใช่ปัญหาสำคัญหรือสามารถแก้ไขได้ด้วยวิธีอื่น

การเข้าใกล้จากทิศทางตรงข้ามรวมถึงคำศัพท์พิเศษในสมการการถดถอยมีประโยชน์บางอย่างแม้ในสถานการณ์ที่คำศัพท์พิเศษนั้นไม่น่าสนใจและมันไม่ได้ปรับปรุงแบบจำลองให้พอดี ... คุณอาจไม่คิดว่ามันจะ เป็นตัวแปรสำคัญในการควบคุม แต่คนอื่นอาจ แน่นอนว่ายังมีเหตุผลสำคัญที่สำคัญอื่น ๆ ที่จะยกเว้นตัวแปรเช่นมันอาจเกิดจากผล


3

จากถ้อยคำของคุณดูเหมือนว่าคุณกำลังจะทิ้งตัวทำนายสุดท้ายเพราะค่าการทำนายนั้นต่ำ การเปลี่ยนแปลงที่สำคัญของตัวทำนายนั้นจะไม่แปลว่าการเปลี่ยนแปลงที่สำคัญของตัวแปรตอบสนอง หากเป็นเช่นนั้นฉันชอบเกณฑ์นี้สำหรับการรวม / วางตัวทำนาย มันมีพื้นฐานมาจากความเป็นจริงที่ใช้งานได้จริงมากกว่า AIC หรือ BIC และผู้ฟังของคุณสามารถอธิบายได้สำหรับการวิจัย


ใช่นั่นคือสิ่งที่ฉันต้องการ
P Sellaz
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.