Howlers เกิดจากการใช้การถดถอยแบบขั้นตอน


20

ฉันตระหนักดีถึงปัญหาของการเลือกตามขั้นตอน / ไปข้างหน้า / ถอยหลังในตัวแบบการถดถอย มีหลายกรณีที่นักวิจัยประนามวิธีและชี้ทางเลือกที่ดีกว่า ฉันอยากรู้ว่ามีเรื่องราวใดบ้างที่มีอยู่ที่การวิเคราะห์ทางสถิติ:

  • ใช้การถดถอยแบบขั้นตอน
  • ทำข้อสรุปที่สำคัญบางประการตามโมเดลสุดท้าย
  • ข้อสรุปนั้นผิดส่งผลลบต่อบุคคลการวิจัยหรือองค์กรของพวกเขา

ความคิดของฉันเกี่ยวกับเรื่องนี้หากวิธีการแบบขั้นตอนไม่ดีแล้วก็ควรจะมีผลตามมาใน "โลกแห่งความจริง" สำหรับการใช้มัน


2
หากคุณไม่พบเรื่องราวดังกล่าวอาจเป็นเพราะการถดถอยแบบขั้นตอนส่วนใหญ่ใช้ในการวิจัยขั้นพื้นฐาน (หรือดังนั้นฉันจึงเข้าใจ) นักวิจัยขั้นพื้นฐานมักจะไม่ประสบปัญหาในการทำผิดตราบใดที่พวกเขาไม่ได้ปลอมข้อมูลหรืออะไรบางอย่าง
ประสาทวิทยา

3
มันใช้บ่อยในอุตสาหกรรมและในห้องเรียน ในการวิจัยผู้เขียนอาจจะไม่เปิดเผยว่าพวกเขาใช้มัน ในอุตสาหกรรมเหตุผลหลักสองประการคือก) ผู้ที่ทำไม่ได้ผ่านการฝึกอบรมด้านการวิจัยเช่นมีระดับปริญญาตรีหรือ b) จบการศึกษามาหลายทศวรรษแล้ว
Aksakal

@ Aksakal ไม่ได้เรียนรู้ที่จะเริ่มต้นด้วย แต่ได้รับผิวแกะอย่างไรก็ตามปัญหาคือไม่ใช่เวลาที่ผ่านไป แบบอย่างฟรีฉัน ฉันได้เรียนวิชาสถิติหนึ่งครั้งในปี 1971 และใช้สถิติเป็นครั้งแรกในสิ่งพิมพ์ประมาณปี 2006
Carl

คำตอบ:


1

มีคำถามมากกว่าหนึ่งคำถามที่ถูกถาม สิ่งที่แคบที่สุดคือขอตัวอย่างว่าเมื่อใดการถดถอยแบบขั้นตอนได้ก่อให้เกิดอันตรายเพราะเป็นขั้นตอนที่ทำน้ำหอม สิ่งนี้เป็นเรื่องจริง แต่สามารถสร้างได้อย่างชัดเจนเฉพาะเมื่อข้อมูลที่ใช้สำหรับการถดถอยแบบขั้นตอนยังได้รับการเผยแพร่และมีคนทำการวิเคราะห์ซ้ำและเผยแพร่การแก้ไขการตรวจสอบโดยผู้ตรวจสอบที่มีการเพิกถอนผู้เขียนหลัก เพื่อให้ข้อกล่าวหาในบริบทอื่น ๆ เสี่ยงต่อการดำเนินการทางกฎหมายและหากเราใช้ชุดข้อมูลอื่นเราอาจสงสัยว่ามีความผิดพลาดเกิดขึ้น แต่ "สถิติไม่เคยพิสูจน์อะไรเลย" และเราจะไม่สามารถพิสูจน์ได้ว่าข้อผิดพลาดนั้นคือ ทำ; "ข้อกังขา".

ตามความเป็นจริงแล้วคนเรามักจะได้รับผลลัพธ์ที่แตกต่างกันไปขึ้นอยู่กับว่าใครจะกำจัดแบบทีละขั้นหรือการสะสมแบบขั้นตอนของสมการการถดถอยซึ่งแนะนำให้เราทราบว่าไม่มีวิธีใดที่ถูกต้องเพียงพอ เห็นได้ชัดว่ามีสิ่งอื่นเกิดขึ้นและนั่นทำให้เรามีคำถามที่กว้างขึ้นและยังถามถึงข้างต้น แต่ในรูปแบบสัญลักษณ์แสดงหัวข้อย่อยซึ่งประกอบด้วย "ปัญหาอะไรกับการถดถอยแบบขั้นตอน แต่อย่างใด? นั่นเป็นคำถามที่มีประโยชน์มากกว่า ผลประโยชน์เพิ่มเติมที่ฉันจะไม่ถูกฟ้องร้องทางกฎหมายสำหรับฉันที่จะตอบมัน

การทำถูกต้องสำหรับ MLR แบบขั้นตอนหมายถึงการใช้ 1) หน่วยที่ถูกต้องทางกายภาพ (ดูด้านล่าง) และ 2) การเปลี่ยนแปลงตัวแปรที่เหมาะสมสำหรับความสัมพันธ์ที่ดีที่สุดและประเภทการกระจายข้อผิดพลาด (สำหรับ homoscedasticity และ physicality) และ 3) ขั้นตอนที่ชาญฉลาดทั้งหมดของพวกเขา , และ 4) หากดำเนินการวินิจฉัยการถดถอยครบถ้วนสมบูรณ์แล้วหนึ่งหลีกเลี่ยงหายไป VIF สูง (collinearity) รวมกันตัวแปรที่มิฉะนั้นจะทำให้เข้าใจผิดแล้วรางวัลคือการถดถอยที่ดีกว่า

ตามที่สัญญาไว้สำหรับ # 1 ด้านบนเราจะสำรวจหน่วยที่ถูกต้องสำหรับระบบทางกายภาพ เนื่องจากผลลัพธ์ที่ดีจากการถดถอยนั้นขึ้นอยู่กับการรักษาตัวแปรที่ถูกต้องเราจำเป็นต้องคำนึงถึงมิติปกติของหน่วยทางกายภาพและสมดุลสมการของเราอย่างเหมาะสม นอกจากนี้สำหรับการใช้งานทางชีวภาพจำเป็นต้องมีความตระหนักและการบัญชีเกี่ยวกับมิติของมาตราส่วนอัลโลเม

GFR=k* * * *W1/4V2/3GFRW1=1443+23GFR


2
สิ่งนี้ดูเหมือนจะอธิบายปัญหาเกี่ยวกับการถดถอยโดยทั่วไปมากกว่าการถดถอยแบบขั้นตอนโดยเฉพาะ
สถิติอุบัติเหตุ

2
ใช่นี่คือแง่มุมของการถดถอยที่ต้องพิจารณาโดยทั่วไป ถ้าฉันเข้าใจอย่างถูกต้องว่าคำถามนั้นมาจากไหนมันเป็นแรงบันดาลใจจากการถดถอยแบบขั้นตอนซึ่งมักจะถูกประณามเพราะชอบใช้ LASSO ซึ่งจะไม่ตอบข้อกังวลของคุณที่นี่
สถิติอุบัติเหตุ

4
ฉันขอขอบคุณความจริงใจและความตั้งใจของคุณในเรื่องนี้คาร์ล ฉันจะไม่ปฏิเสธว่าการลงคะแนนมีปัญหา วิธีที่มีประสิทธิภาพวิธีเดียวที่ฉันรู้ในการเปลี่ยนการลงคะแนนในโพสต์คือการเปลี่ยนคำตอบไม่ว่าจะเป็นการปรับปรุงทางเทคนิคขยายหรือเพื่อสื่อสารความคิดเห็นที่แตกต่างออกไป - และถึงแม้จะไม่มีการรับประกันว่าจะได้รับคำตอบที่ต้องการ (หรือแม้แต่การตอบสนองใด ๆ เลย!) บางครั้งความพยายามในการทำความเข้าใจอย่างถี่ถ้วนที่ทำความเข้าใจกับผู้ลงคะแนนจะทำให้เกิดข้อมูลที่จะช่วยให้ทุกคนชื่นชมและพยายามยกระดับโพสต์
whuber

3
@Carl ฉันคิดว่าถ้าคุณได้รับ downvotes ปกติสิ่งแรกที่ต้องทำคือการพิจารณาว่าคุณจะปรับปรุงโพสต์ของคุณอย่างไร (และบ่อยครั้งที่คุณมีความคิดเห็นภายใต้พวกเขาที่แนะนำการปรับปรุง) การพูดเพื่อตัวเองแม้ในที่ที่ฉันไม่เห็นด้วยกับผู้แสดงความคิดเห็นปรากฎว่าพวกเขามักจะหยิบยกประเด็นที่นำไปสู่คำตอบที่ดีกว่าอยู่ดี ฉันจะบอกว่าฉันสังเกตเห็นปัญหาเป็นประจำกับคำตอบของคุณที่เกือบจะทำให้ฉันต้องลงคะแนนตัวเอง ที่ฉันมีเวลาทำฉันพยายามแสดงความคิดเห็น
Glen_b -Reinstate Monica

3
โปรดทราบว่าปัญหาหลายอย่างของการถดถอยแบบขั้นตอน - เช่นปัญหาเกี่ยวกับการประเมินความเอนเอียงจาก 0, ข้อผิดพลาดมาตรฐานเอนเอียงไปที่ 0, อัตราความผิดพลาดประเภทที่ 1 ระบุน้อยกว่าจริงมากและปัญหาอื่น ๆ ยังคงมีอยู่ - เป็นปัญหากับการปรับให้เหมาะสมเกือบทุกรูปแบบ (บทที่ 4 ของกลยุทธ์การสร้างแบบจำลองการถดถอยของ Frank Harrell เป็นการอ้างอิงที่มีประโยชน์) การหดตัว / การทำให้เป็นปกติสามารถลดปัญหาเหล่านี้ได้ (โดยเฉพาะอย่างยิ่งแนวโน้มของการเลือกที่จะประเมินอคติภายนอก) และการประเมินนอกตัวอย่างเป็นเครื่องมือสำคัญสำหรับพวกเขาหลายคน
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.