คุณจะเลือกตัวแปรในตัวแบบการถดถอยได้อย่างไร?


12

วิธีการดั้งเดิมในการเลือกตัวแปรคือการค้นหาตัวแปรที่มีส่วนร่วมมากที่สุดในการทำนายการตอบสนองใหม่ เมื่อเร็ว ๆ นี้ฉันได้เรียนรู้ทางเลือกนี้ ในการสร้างแบบจำลองตัวแปรที่กำหนดผลกระทบของการรักษา - ตัวอย่างเช่นในการทดลองทางคลินิกของยา - ตัวแปรถูกกล่าวถึงว่ามีปฏิสัมพันธ์ในเชิงคุณภาพกับการรักษาถ้าปล่อยให้สิ่งอื่นคงที่การเปลี่ยนแปลงในตัวแปรนั้นสามารถสร้างการเปลี่ยนแปลงที่การรักษามีประสิทธิภาพมากที่สุด ตัวแปรเหล่านี้ไม่ได้เป็นตัวทำนายผลที่แข็งแกร่งเสมอไป แต่อาจมีความสำคัญสำหรับแพทย์เมื่อตัดสินใจเลือกการรักษาสำหรับผู้ป่วยแต่ละราย ในวิทยานิพนธ์ปริญญาเอกของเธอ Lacey Gunter พัฒนาวิธีการเลือกตัวแปรการโต้ตอบเชิงคุณภาพที่อาจพลาดโดยอัลกอริธึมที่เลือกการทำนาย เมื่อเร็ว ๆ นี้ฉันได้ทำงานกับเธอในการขยายวิธีการเหล่านี้ไปยังรุ่นอื่น ๆ รวมถึงการถดถอยโลจิสติกและโมเดลการถดถอยอันตรายตามสัดส่วนของ Cox

ฉันมีสองคำถาม:

  1. คุณคิดอย่างไรเกี่ยวกับคุณค่าของวิธีการใหม่เหล่านี้
  2. ในกรณีของวิธีการแบบดั้งเดิมคุณชอบวิธีการแบบไหน? เกณฑ์เช่น AIC, BIC, Mallows Cp, F สำหรับการทดสอบการป้อนหรือการลดตัวแปรในแบบขั้นตอนไปข้างหน้าและข้างหลัง ...

บทความแรกในเรื่องนี้ออกมาใน Gunter, L. , Zhu, J และ Murphy, SA (2009) เลือกตัวแปรสำหรับการปฏิสัมพันธ์เชิงคุณภาพ ระเบียบวิธีทางสถิติ ดอย: 10, 1016 / j.stamet.2009.05.003

บทความต่อไปปรากฏใน Gunter, L., Zhu, J. และ Murphy, SA (2011) เลือกตัวแปรของการมีปฏิสัมพันธ์ในเชิงคุณภาพยาเฉพาะบุคคลขณะที่การควบคุมอัตราความผิดพลาด familywise วารสารสถิติชีวเวชภัณฑ์ 21, 1063-1078

รายการถัดไปปรากฏในฉบับพิเศษเกี่ยวกับการเลือกตัวแปร Gunter, L. , Chernick, MR และ Sun, J. (2011) วิธีการที่ง่ายสำหรับการเลือกตัวแปรในการถดถอยด้วยความเคารพในการเลือกการรักษา วารสารสถิติปากีสถานและการวิจัยการดำเนินงาน 7: 363-380

คุณสามารถค้นหาเอกสารได้ที่เว็บไซต์วารสาร คุณอาจจะต้องซื้อบทความ ฉันอาจมีไฟล์ pdf สำหรับบทความเหล่านี้ ลาเซย์กับฉันเพิ่งทำเอกสารในหัวข้อนี้เสร็จสิ้นซึ่งจะถูกเผยแพร่เป็น SpringerBrief ในปลายปีนี้


11
บางทีฉันอาจไม่ปฏิบัติตาม - หากมีเหตุผลเบื้องต้นที่ต้องสงสัยว่ามีการปรับเปลี่ยนเอฟเฟกต์ดังนั้นวิธีการใหม่เหล่านี้แตกต่างจากวิธีการอย่างไรรวมถึงเงื่อนไขการโต้ตอบในรายการตัวแปร "ตัวเลือก" สำหรับการเลือกแบบจำลอง
มาโคร

6
(1) ดูเหมือนว่าหายไปหนึ่งบรรทัดหรือมากกว่าในคำถามนี้ ฉันเดาว่ามันอาจจะ "ต่อเนื่องไปข้างหน้าและข้างหลัง" ... เช่นการค้นหาตัวเลือก+ รุ่น + ตัวแปร +นำเสนอ 145 กระทู้ในตอนนี้ การ จำกัด การค้นหานั้นอาจตอบคำถามที่สอง (3) เพื่อความสะดวกในการตอบคำถามแรกคุณสามารถให้ลิงค์หรือการอ้างอิงที่ชัดเจนกับงานวิจัยนี้ได้หรือไม่?
whuber

2
นี่เป็นเรื่องของการรวมตัวแปรที่มีปฏิสัมพันธ์กับการรักษา แต่มันเป็นปฏิสัมพันธ์เชิงคุณภาพไม่ใช่แค่การมีปฏิสัมพันธ์ที่เรียบง่าย ในการโต้ตอบสองบรรทัดจะต้องไม่ขนานกัน ในการโต้ตอบเชิงคุณภาพพวกเขาจะต้องข้ามในช่วงเวลาที่กำหนดตัวแปร ดังนั้นความคิดคือการหาตัวแปรที่มีปฏิสัมพันธ์ในเชิงคุณภาพ สิ่งนี้แตกต่างจากการเลือกตัวแปรและเงื่อนไขการโต้ตอบที่ปรับปรุงความเหมาะสมหรือการทำนาย
Michael R. Chernick

3
ขอบคุณที่สละโอกาสตอบ Michael อาจเป็นจุดสำคัญที่จะนำมาเป็นเว็บไซต์นี้ไม่ได้เป็นเว็บไซต์การสนทนา แต่เป็นเว็บไซต์ถาม ด้วยวิธีการสื่อสารที่แตกต่างกันเล็กน้อย คำถามที่พบบ่อยครอบคลุมในรายละเอียดบางอย่าง บางครั้งเกลียวอาจหายไปบ้าง แต่จริง ๆ แล้วมันหายากน่าแปลกใจที่ฉันพบเมื่อหนึ่งได้รับประสบการณ์เพิ่มเติมเล็กน้อยกับรูปแบบทั่วไปของสิ่งต่าง ๆ ไชโย
พระคาร์ดินัล

6
ไมเคิลใช่ระบบ SE ใช้เวลาทำความคุ้นเคยและไม่สมบูรณ์แบบ แต่มันก็สมเหตุสมผลและก็สอดคล้องกัน สิ่งหนึ่งที่เรามุ่งหวังคือการปรับปรุงอย่างต่อเนื่อง: สามารถปรับเปลี่ยนคำถาม (และคำตอบ) จากรายการเซิร์ฟเวอร์และกระดานข่าวได้ คาดว่าจะเป็นเช่นนี้ ในท้ายที่สุดเราต้องการให้เธรดเริ่มต้นด้วยคำถามที่สมบูรณ์และได้รับการกล่าวถึงอย่างดีที่ตั้งอยู่บนตัวของมันเองโดยไม่มีการอ้างอิงถึงเธรดความคิดเห็น จากนั้นควรดำเนินการต่อด้วยคำตอบตามบัญญัติของบัญญัติหนึ่งข้อหรือมากกว่านั้น ด้วยความคิดในอุดมคตินี้คำแนะนำของ @ cardinal อาจทำให้คุณเข้าใจได้ง่ายขึ้น
whuber

คำตอบ:


2
  1. ดู Gelman และ Hill, การวิเคราะห์ข้อมูลโดยใช้ Regression และ Multilevel / Hierarchical Model pg 69 พวกเขามีส่วนในการเลือกแบบจำลอง เธอใช้วิธีการตั้งคำถามซึ่งใช้ได้ดี แต่ในบทความของเธอเธอต้องการพิสูจน์ว่าทำไมเธอถึงรวมถึงสิ่งที่เธอทำในแบบจำลอง เช่นเดียวกับที่คุณพูดว่า "ตัวแปรเหล่านี้ไม่ใช่ตัวทำนายผลที่แข็งแกร่งเสมอไป แต่อาจมีความสำคัญสำหรับแพทย์เมื่อตัดสินใจเลือกการรักษาสำหรับผู้ป่วยแต่ละราย" ดังนั้นตราบใดที่เธอให้เหตุผลว่าทำไมควรรวมตัวทำนายเหล่านี้ไว้ด้วย สำหรับฉันเป็นการส่วนตัวฉันชอบวิธีการเหล่านี้ ดังนั้นนี่คือคำตอบของฉันถึง 2
  2. แบบขั้นตอนไปข้างหน้าและข้างหลังฉันคิดว่าเป็นกล่องดำ เมื่อคุณใช้แบบจำลองผ่านทั้งสามคุณจะไม่มาถึงตัวทำนายเดียวกัน ดังนั้นในแง่ของการใช้ฉันจะไม่มีคำตอบที่ชัดเจน AIC หรือ BIC ไม่เป็นไรที่จะใช้เพื่อเปรียบเทียบแบบจำลอง
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.