การถดถอยแบบหลายครั้งสามารถ“ ควบคุม” ตัวแปรได้อย่างไร


45

เราทุกคนคุ้นเคยกับการศึกษาเชิงสังเกตการณ์ที่พยายามสร้างการเชื่อมโยงเชิงสาเหตุระหว่างตัวทำนาย X แบบไม่มีการสุ่มกับผลลัพธ์โดยรวมถึงผู้ที่อาจเกิดขึ้นได้ทั้งหมดในรูปแบบการถดถอยหลายแบบ ด้วยเหตุนี้“ การควบคุมเพื่อ” ผู้รบกวนทุกคนการโต้แย้งจึงทำให้เราแยกผลของตัวทำนายผลประโยชน์

ฉันกำลังพัฒนาความรู้สึกไม่สบายที่เพิ่มขึ้นด้วยความคิดนี้โดยส่วนใหญ่อ้างอิงจากคำพูดที่ไม่ได้ทำโดยอาจารย์ของชั้นเรียนสถิติของฉัน พวกเขาตกอยู่ในประเภทหลักสองสาม:

1. คุณสามารถควบคุมค่าความแปรปรวนร่วมที่คุณคิดและวัดได้เท่านั้น
นี่เป็นสิ่งที่ชัดเจน แต่ฉันสงสัยว่าจริงๆแล้วมันอันตรายที่สุดและไม่สามารถเอาชนะได้ทั้งหมด

2. วิธีการได้นำไปสู่ข้อผิดพลาดที่น่าเกลียดในอดีต

ยกตัวอย่างเช่นPetitti & Freedman (2005)อภิปรายว่าการศึกษาเชิงสังเกตการณ์ที่ปรับค่าทางสถิติมานานหลายทศวรรษได้ผลสรุปที่ไม่ถูกต้องเกี่ยวกับผลของการบำบัดทดแทนฮอร์โมนต่อความเสี่ยงของโรคหัวใจ ภายหลัง RCTs พบผลกระทบที่ตรงกันข้ามเกือบ

3. ความสัมพันธ์ของตัวทำนายผลสามารถทำงานได้อย่างแปลกประหลาดเมื่อคุณควบคุมผู้ร่วมทุน

Yu-Kang Tu, Gunnell, & Gilthorpe (2008) หารือเกี่ยวกับอาการที่แตกต่างกันบางอย่างรวมถึงความขัดแย้งของลอร์ด, ความขัดแย้งของซิมป์สันและตัวแปรต้าน

4. เป็นการยากสำหรับแบบจำลองเดียว (การถดถอยแบบหลายจุด) เพื่อปรับให้เพียงพอสำหรับ covariates และแบบจำลองความสัมพันธ์ของผลลัพธ์ของตัวทำนายพร้อมกัน

ฉันเคยได้ยินเรื่องนี้เป็นเหตุผลสำหรับความเหนือกว่าของวิธีการเช่นคะแนนความชอบและการแบ่งชั้นของผู้สับสน แต่ฉันไม่แน่ใจว่าฉันเข้าใจจริงๆ

5. แบบจำลองของ ANCOVA กำหนดให้ค่าความแปรปรวนร่วมและตัวทำนายความสนใจเป็นอิสระ

แน่นอนว่าเราปรับสำหรับคนสับสนเพราะแม่นยำเพราะสัมพันธ์กับตัวทำนายความสนใจดังนั้นดูเหมือนว่าแบบจำลองจะไม่ประสบความสำเร็จในกรณีที่แน่นอนเมื่อเราต้องการมันมากที่สุด อาร์กิวเมนต์ไปที่การปรับที่เหมาะสมสำหรับการลดเสียงรบกวนในการทดลองแบบสุ่มเท่านั้น Miller & Chapman, 2001ให้รีวิวที่ยอดเยี่ยม

ดังนั้นคำถามของฉันคือ:

  1. ปัญหาเหล่านี้ร้ายแรงเพียงใดและอย่างอื่นที่ฉันอาจไม่รู้
  2. ฉันจะกลัวแค่ไหนเมื่อฉันเห็นการศึกษาที่ว่า "ควบคุมทุกสิ่ง"

(ฉันหวังว่าคำถามนี้จะไม่ไกลเกินกว่าขอบเขตการอภิปรายและเชิญคำแนะนำสำหรับการปรับปรุงได้อย่างมีความสุข)

แก้ไข : ฉันเพิ่มจุด 5 หลังจากค้นหาการอ้างอิงใหม่


1
สำหรับคำถามที่ 2 ฉันคิดว่า 'การควบคุมเพื่อทุกสิ่ง' เป็นข้อกำหนดโดยทั่วไป ฉันมีปัญหาในการคิดสถานการณ์ที่ระบุโมเดลพารามิเตอร์อย่างถูกต้อง แบบจำลองทำให้ความเป็นจริงง่ายขึ้นและนั่นคือสิ่งที่ศิลปะของการศึกษาประเภทนี้ตั้งอยู่ ผู้วิจัยต้องตัดสินใจว่าอะไรคืออะไรและไม่สำคัญในแบบจำลอง
Kirk

4
ด้วยคำถามนี้คุณทำให้ฉันเป็นแฟน
rolando2

1
ฉันคิดว่านี่เป็นจุดที่ดีมาก แต่ฉันคิดว่าคำตอบอยู่นอกเขตข้อมูลสถิติอย่างเคร่งครัด ดังนั้นผลลัพธ์ทางสถิติใด ๆ ที่มีค่ายิ่งกว่านั้นหาก 1) จำลองข้อมูลแล้ว 2) ปฏิบัติได้จริงเป็นต้นนอกจากนี้ยังเห็นเกณฑ์ MAGICและการโต้แย้งทั่วไปที่ Abelson ทำ
Peter Flom - Reinstate Monica

1
จุด # 5 เป็นเท็จอย่างแน่นอน กระดาษ Miller & Chapman ผิดพลาดเต็มหยุด
Jake Westfall

1
@ half-pass ไม่แน่ใจว่าสิ่งอื่นที่จะพูดเกี่ยวกับเรื่องนี้นอกเหนือจากที่อ้างว่ากลางของกระดาษ - นั่นคือที่ทำนายโฟกัส X และ covariate C จะต้อง uncorrelated - ไม่เป็นความจริง โปรดสังเกตว่า ANCOVA เป็นเพียงรูปแบบการถดถอยดังนั้นการใช้เหตุผลแบบเดียวกันนี้จะทำให้การใช้งานหลายอย่างในโลกจริงของการถดถอยหลายครั้งเหมือนกัน! ฉันมีการสนทนา Twitter เกี่ยวกับกระดาษที่น่ากลัวนี้หลายเดือนที่ผ่านมา: twitter.com/CookieSci/status/902298218494644228
Jake Westfall

คำตอบ:


4

บางทีอาจเป็นคำตอบที่ยอมรับกันอย่างกว้างขวางและไม่ใช่ทางสถิติซึ่งเป็นข้อสันนิษฐานอะไรบ้างที่เราจำเป็นต้องเรียกร้องเพื่อให้ได้มาซึ่งการควบคุมที่แท้จริงสำหรับผู้ร่วมทุน

ที่สามารถทำได้ด้วยแคว้นยูเดียไข่มุกกราฟสาเหตุและทำแคลคูลัส

ดู http://ftp.cs.ucla.edu/pub/stat_ser/r402.pdf รวมถึงเนื้อหาอื่น ๆ บนเว็บไซต์ของเขา

ขณะนี้ในฐานะนักสถิติเรารู้ว่าแบบจำลองทั้งหมดเป็นเท็จและคำถามเชิงสถิติที่แท้จริงคือข้อสมมุติที่ระบุว่ามีแนวโน้มว่าจะไม่ผิดเกินไปเพื่อให้คำตอบของเรานั้นโอเคโดยประมาณ เพิร์ลเป็นตระหนักถึงเรื่องนี้และไม่หารือเกี่ยวกับมันในการทำงานของเขา แต่อาจจะไม่ชัดเจนและมักจะมากพอที่จะหลีกเลี่ยงการflustratingสถิติจำนวนมากที่มีการเรียกร้องของเขาที่จะมีคำตอบ (ซึ่งผมเชื่อว่าเขาไม่ให้สิ่งที่สมมติฐานหนึ่งไม่จำเป็นที่จะต้องให้? )

(ปัจจุบัน ASA เสนอรางวัลสำหรับการสอนอุปกรณ์เพื่อรวมวิธีการเหล่านี้ในหลักสูตรสถิติดูที่นี่ )


อ้างอิงถึงการแสดงกราฟิกที่สวยงามขอบคุณ
half-pass

0

ตอบคำถาม 1:

  • ขนาดของความรุนแรงจะประเมินได้ดีที่สุดในลักษณะบริบท (เช่นควรพิจารณาปัจจัยทั้งหมดที่มีผลต่อความถูกต้อง)
  • ไม่ควรประเมินขนาดของความรุนแรงในลักษณะที่เป็นหมวดหมู่ ตัวอย่างคือความคิดของลำดับชั้นของการอนุมานสำหรับการออกแบบการศึกษา (เช่นรายงานผู้ป่วยต่ำสุดและ RCT เป็นหมวดหมู่สูงสุด) รูปแบบนี้มีการสอนบ่อยครั้งในโรงเรียนแพทย์ซึ่งเป็นวิธีแก้ปัญหาที่ง่ายต่อการระบุหลักฐานคุณภาพสูง ปัญหาของการคิดแบบนี้ก็คือมันเป็นอัลกอริทึมและกำหนดมากเกินไปในความเป็นจริงคำตอบคือตัวเองบ่อนทำลาย เมื่อสิ่งนี้เกิดขึ้นคุณสามารถพลาดวิธีที่ RCT ที่ออกแบบมาไม่ดีสามารถให้ผลลัพธ์ที่แย่กว่าการศึกษาเชิงสังเกตการณ์ที่ออกแบบมาอย่างดี
  • ดูง่ายต่อการอ่านทบทวนสำหรับการอภิปรายเต็มรูปแบบของจุดดังกล่าวจากมุมมองของนักระบาดวิทยา(รอ ธ แมน 2014)

ตอบคำถาม 2:

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.