เราจำเป็นต้องรวม“ ตัวทำนายที่เกี่ยวข้องทั้งหมดหรือไม่”


15

สมมติฐานพื้นฐานของการใช้แบบจำลองการถดถอยสำหรับการอนุมานคือ "ตัวทำนายที่เกี่ยวข้องทั้งหมด" ได้รวมอยู่ในสมการทำนาย เหตุผลก็คือความล้มเหลวในการรวมปัจจัยที่สำคัญในโลกแห่งความจริงนำไปสู่ค่าสัมประสิทธิ์ความเอนเอียงและการอนุมานที่ไม่ถูกต้อง

แต่ในการปฏิบัติงานวิจัยฉันไม่เคยเห็นใครเลยรวมทั้งสิ่งที่คล้ายคลึงกับ "ตัวทำนายที่เกี่ยวข้องทั้งหมด" ปรากฏการณ์หลายอย่างมีสาเหตุสำคัญมากมายและมันคงเป็นเรื่องยากมากที่จะรวมพวกเขาทั้งหมดเข้าด้วยกัน ตัวอย่างนอกข้อมือคือการสร้างแบบจำลองภาวะซึมเศร้าเป็นผลลัพธ์: ไม่มีใครสร้างอะไรที่ใกล้เคียงกับแบบจำลองซึ่งรวมถึง "ตัวแปรที่เกี่ยวข้องทั้งหมด": เช่นประวัติผู้ปกครองลักษณะบุคลิกภาพการสนับสนุนทางสังคมรายได้ปฏิสัมพันธ์ของพวกเขา ฯลฯ ฯลฯ ...

ยิ่งไปกว่านั้นการติดตั้งแบบจำลองที่ซับซ้อนเช่นนี้จะนำไปสู่การประมาณค่าที่ไม่เสถียรสูงเว้นแต่ว่ามีตัวอย่างขนาดใหญ่

คำถามของฉันง่ายมาก: สมมติฐาน / คำแนะนำในการ "รวมตัวทำนายที่เกี่ยวข้องทั้งหมด" เป็นเพียงแค่สิ่งที่เรา "พูด" แต่ไม่เคยหมายความว่าจริงหรือ? ถ้าไม่เช่นนั้นทำไมเราจึงให้คำแนะนำในการสร้างแบบจำลองจริง?

และนี่หมายความว่าสัมประสิทธิ์ส่วนใหญ่อาจทำให้เข้าใจผิด? (เช่นการศึกษาปัจจัยบุคลิกภาพและภาวะซึมเศร้าที่ใช้ตัวทำนายหลายตัวเท่านั้น) พูดอีกอย่างคือปัญหาใหญ่แค่ไหนสำหรับข้อสรุปของวิทยาศาสตร์ของเรา?


6
ข้อโต้แย้งนี้ทำให้เกิดความวุ่นวายในด้านจิตวิทยาเศรษฐศาสตร์และสังคมศาสตร์ตลอดศตวรรษที่ 19 นักวิทยาศาสตร์ให้เหตุผลว่าวิธีการทางสถิตินั้นไม่เหมาะสมสำหรับคนและระบบสังคมเพราะคนนั้นมีความหลากหลายและซับซ้อนเกินไป ในปลายศตวรรษที่ยูทิลิตี้ชนะปรัชญา: แม้ว่าเราจะไม่รวมตัวทำนายทั้งหมด แต่เราก็ยังสามารถเรียนรู้ได้มากมาย มีปัญญาในการรวมของ "ที่เกี่ยวข้อง" ในวลีชื่อเรื่อง
whuber

คำตอบ:


18

คุณพูดถูก - เราแทบจะไม่เหมือนจริงในการพูดว่า "ตัวทำนายที่เกี่ยวข้องทั้งหมด" ในทางปฏิบัติเราสามารถจะพอใจกับการรวมตัวพยากรณ์ที่อธิบายถึงแหล่งที่มาสำคัญของการเปลี่ยนแปลงในYในกรณีพิเศษที่ใช้การอนุมานเกี่ยวกับปัจจัยเสี่ยงหรือการรักษาในการศึกษาเชิงสังเกตสิ่งนี้ไม่ค่อยดีพอ สำหรับสิ่งนั้นการปรับเพื่อความสับสนจะต้องมีความก้าวร้าวสูงรวมถึงตัวแปรที่อาจเกี่ยวข้องกับผลลัพธ์และอาจเกี่ยวข้องกับทางเลือกการรักษาหรือปัจจัยเสี่ยงที่คุณพยายามเผยแพร่Y

เป็นที่สนใจว่าด้วยโมเดลเชิงเส้นปกติละเว้น covariates โดยเฉพาะอย่างยิ่งถ้ามุมฉากกับ covariates รวมสามารถคิดเป็นเพียงการขยายคำผิดพลาด ในโมเดลที่ไม่ใช่เชิงเส้น (โลจิสติกส์ Cox และอื่น ๆ ) การละเว้นตัวแปรสามารถตั้งค่าผลกระทบของตัวแปรทั้งหมดที่รวมอยู่ในโมเดล (เนื่องจากการไม่ยุบของอัตราส่วนอัตราต่อรองเป็นต้น)


ขอบคุณสำหรับข้อมูลที่เป็นประโยชน์ นอกเหนือจากการประเมินผลการรักษาฉันต้องการถามเพิ่มเติมเกี่ยวกับผลกระทบเชิงปฏิบัติของปัญหานี้ หากคุณตรวจสอบกระดาษและมีการคาดคะเนสิ่งที่สำคัญอย่างชัดเจนนั่นอาจเป็นเหตุให้ถูกปฏิเสธ? ฉันถามสิ่งนี้เพราะก.) ฉันไม่เคยได้ยินเกี่ยวกับสิ่งที่เกิดขึ้นและ b.) นักสังคมศาสตร์มักจะรวมเฉพาะนักทำนายที่พวกเขาต้องการทราบเพิ่มเติมเกี่ยวกับ (เช่นหัวข้อของการศึกษา) และละเลยปัจจัย "รู้จัก" ( ขึ้นอยู่กับความจำเป็นในการวัดที่มีประสิทธิภาพมากขึ้น)
ATJ

ตัวอย่างเช่นไม่ใช่เรื่องแปลกที่จะเห็นตัวแบบตัวแปรแฝงที่มีเพียงตัวทำนาย SINGLE สำหรับตัวแปรภายนอก สิ่งนี้พูดถึงช่องว่างระหว่างสาขาสถิติและการดำเนินการในหัวข้อจริงหรือไม่?
ATJ

6
มันอาจจะเป็น สำหรับคำถามก่อนหน้านี้สำหรับการปฏิเสธจะรวมถึงการละเว้นตัวแปรสำคัญซึ่งการรวมไว้จะทำให้การตีความที่แตกต่างกันของตัวแปรที่รวมอยู่หรือจะเปลี่ยนรูปแบบอย่างมาก ฉันเคยอ่านบทความเกี่ยวกับความเสี่ยงของโรคมะเร็งปอดที่มีเพียงว่ามีผู้สูบบุหรี่หรือไม่และผู้เขียนไม่ได้พยายามประเมินขนาดของการสูบบุหรี่ (เช่นแพ็คปี) ฉันแนะนำให้ปฏิเสธทันที
Frank Harrell

9

ใช่คุณต้องรวม "ตัวแปรที่เกี่ยวข้อง" ทั้งหมด แต่คุณต้องฉลาดด้วย คุณต้องคิดหาวิธีสร้างการทดลองที่จะแยกผลกระทบของปรากฏการณ์ของคุณออกจากสิ่งที่ไม่เกี่ยวข้องซึ่งมีอยู่มากมายในโลกแห่งความเป็นจริง (ตรงข้ามกับห้องวิจัย) ก่อนที่คุณจะเข้าสู่สถิติคุณต้องทำการยกระดับหนักในโดเมนของคุณไม่ใช่ในสถิติ

ฉันไม่แนะนำให้คุณเหยียดหยามเกี่ยวกับการรวมตัวแปรที่เกี่ยวข้องทั้งหมดเพราะมันไม่ใช่แค่เป้าหมายอันสูงส่ง แต่ยังเพราะมันเป็นไปได้บ่อยครั้ง เราไม่พูดอย่างนี้เพียงเพื่อบอกว่ามัน เราหมายถึงมันจริงๆ ในความเป็นจริงการออกแบบการทดลองและการศึกษาที่สามารถรวมตัวแปรที่เกี่ยวข้องทั้งหมดเป็นสิ่งที่ทำให้วิทยาศาสตร์น่าสนใจจริง ๆ และแตกต่างจาก "การทดลอง" ของเครื่องจักรกลหม้อไอน้ำ

เพื่อกระตุ้นให้ฉันใช้คำสั่งฉันจะให้ตัวอย่างของวิธีกาลิเลโอศึกษาความเร่ง นี่คือคำอธิบายของการทดลองจริงของเขา (จากหน้าเว็บนี้ ):

ชิ้นส่วนที่ทำด้วยไม้หรือเศษไม้ที่มีความยาวประมาณ 12 ศอกกว้างครึ่งศอกและมีความกว้างสามนิ้ว บนขอบของมันถูกตัดช่องกว้างมากกว่าหนึ่งนิ้วในความกว้าง; การทำร่องนี้ให้ตรงเรียบเนียนและขัดมันและวางมันไว้ด้วยแผ่นหนังและก็ราบรื่นและขัดเงาที่สุดเท่าที่จะทำได้เรากลิ้งลูกบอลสีบรอนซ์ที่แข็งเรียบและกลมมาก เมื่อวางกระดานนี้ในตำแหน่งที่ลาดชันโดยการยกปลายด้านหนึ่งบางส่วนหนึ่งหรือสองศอกเหนืออีกด้านหนึ่งเราก็กลิ้งลูกบอลดังที่ฉันเพิ่งพูดไปตามช่องทางสังเกตในลักษณะที่จะอธิบายในปัจจุบันเวลาที่ต้องการ เพื่อให้โคตร เราทำการทดลองนี้ซ้ำหลายครั้งเพื่อวัดเวลาด้วยความแม่นยำเช่นการเบี่ยงเบนระหว่างการสังเกตสองครั้งไม่เกินหนึ่งในสิบของจังหวะการเต้นของชีพจร หลังจากทำการดำเนินการนี้และมั่นใจในความน่าเชื่อถือของตนเองแล้วตอนนี้เราได้ทำการกลิ้งลูกบอลเพียงหนึ่งในสี่ของความยาวของช่อง และเมื่อเราวัดเวลาการสืบเชื้อสายของมันเราพบว่ามันแม่นยำครึ่งหนึ่งของอดีต ต่อไปเราลองใช้ระยะทางอื่นเปรียบเทียบเวลาสำหรับความยาวทั้งหมดกับครึ่งหรือสองในสามหรือสามในสี่หรือสำหรับเศษส่วนใด ๆ ในการทดลองดังกล่าวทำซ้ำเต็มร้อยครั้งเรามักพบว่าช่องว่างที่เคลื่อนที่ข้ามกันเป็นสี่เหลี่ยมกำลังสองและนี่เป็นความจริงสำหรับความโน้มเอียงทั้งหมดของระนาบคือของช่องซึ่งเรากลิ้งไป ลูกบอล. นอกจากนี้เรายังสังเกตเห็นว่าเวลาของการสืบเชื้อสายสำหรับความโน้มเอียงต่าง ๆ ของระนาบนั้นมีความสัมพันธ์กันอย่างแม่นยำในอัตราส่วนที่เราจะได้เห็นในภายหลัง

สำหรับการวัดเวลาเราใช้เรือน้ำขนาดใหญ่วางในตำแหน่งที่ยกระดับ ที่ด้านล่างของเรือลำนี้ถูกบัดกรีท่อขนาดเล็กให้น้ำเจ็ทบาง ๆ ที่เราเก็บรวบรวมในแก้วเล็ก ๆ ในช่วงเวลาของการสืบเชื้อสายแต่ละไม่ว่าจะเป็นความยาวทั้งหมดของช่องหรือส่วนหนึ่งของความยาว; น้ำที่เก็บได้นั้นจะถูกชั่งหลังจากแต่ละโคตรบนสมดุลที่แม่นยำมาก ความแตกต่างและอัตราส่วนของตุ้มน้ำหนักเหล่านี้ทำให้เรามีความแตกต่างและอัตราส่วนของเวลาและสิ่งนี้ด้วยความแม่นยำเช่นนั้นถึงแม้ว่าการดำเนินการซ้ำหลายครั้งหลายครั้งไม่มีผลลัพธ์ที่คลาดเคลื่อน

ดังนั้นรูปแบบของกาลิเลโอก็คือ

d=ก.เสื้อ2,
ที่ไหน d ระยะทางที่เดินทาง ก. - การเร่งความเร็วและ เสื้อ- เวลา เขาจะกลิ้งลูกบอลที่ระยะไกลd0=1 และกำหนดเวลาพื้นฐาน เสื้อ0. เขาดำเนินการวัด 100 ครั้งที่แตกต่างกันdผม วัดครั้ง เสื้อผม. จากนั้นเขาก็คำนวณd0/dผม และ เสื้อ02/เสื้อผม2. ถ้าแบบจำลองของเขาถูกต้องคุณก็จะมี
d0dผม=เสื้อ02เสื้อผม2
.

ใส่ใจกับวิธีที่เขาวัดเวลา มันหยาบคายมากจนทำให้ฉันนึกถึงว่าสมัยนี้วิทยาศาสตร์ที่ผิดธรรมชาติสามารถวัดตัวแปรของพวกเขาคิดอย่างไรกับ "ความพึงพอใจของลูกค้า" หรือ "ยูทิลิตี้" เขากล่าวว่าข้อผิดพลาดในการวัดอยู่ภายในสิบหน่วยเวลา btw

เขารวมตัวแปรที่เกี่ยวข้องทั้งหมดหรือไม่ ใช่เขาทำ. ทีนี้คุณต้องเข้าใจว่าแรงดึงดูดของร่างกายทุกคนต่างกัน ดังนั้นในทางทฤษฎีในการคำนวณแรงที่แน่นอนบนลูกบอลคุณจะต้องเพิ่มทุกส่วนของจักรวาลในสมการ ยิ่งกว่านั้นที่สำคัญกว่านั้นเขาไม่ได้รวมความต้านทานพื้นผิวการลากอากาศโมเมนตัมเชิงมุมเป็นต้นสิ่งเหล่านี้ส่งผลกระทบต่อการวัดของเขาหรือไม่? ใช่. อย่างไรก็ตามพวกเขาไม่เกี่ยวข้องกับสิ่งที่เขากำลังศึกษาเพราะเขาสามารถลดหรือกำจัดผลกระทบของพวกเขาโดยการแยกผลกระทบของทรัพย์สินที่เขากำลังศึกษา

ทีนี้คุณจะบอกว่าสัมประสิทธิ์ของเขา (อย่างแม่นยำ 2 สำหรับ เสื้อ2) ทำให้เข้าใจผิดเพราะเขา "ไม่ได้ควบคุมความดันอากาศและการเปลี่ยนแปลงของอุณหภูมิระหว่างการทดลอง"? ไม่เลยแม้จะมีปัญหาและข้อ จำกัด ทั้งหมดเขาก็สามารถสร้างกฎการเคลื่อนที่หลักได้อย่างถูกต้องซึ่งยังคงอยู่ในปัจจุบันด้วยความแม่นยำที่บ้า! เขาสามารถทำสิ่งนี้ให้สำเร็จได้โดยไม่ต้องมีชุดข้อมูลทางสถิติและคอมพิวเตอร์เพราะเขาได้ออกแบบการทดลองที่ยอดเยี่ยมในลักษณะที่ว่าส่วนทางสถิตินั้นดูเล็กน้อยและไม่เกี่ยวข้องเลย นั่นเป็นสถานการณ์ความคิดที่คุณต้องการ


อะไรที่เกี่ยวกับวิธีการวัดเวลาของเขา การตั้งค่าจะมีอัตราเฉพาะที่น้ำจะออกจากเรือขนาดใหญ่และเข้าสู่ถ้วย; สมมติว่าเรือมีน้ำปริมาณมากอัตรานั้นจะเปลี่ยนไปเล็กน้อย ที่สำคัญกว่านั้นจะคงที่ตลอดการทดสอบ จริงๆแล้วมันเป็นวิธีการที่ยอดเยี่ยมมากเพราะพวกเขาไม่ได้มีนาฬิกาจับเวลาและตัวจับเวลาอัตโนมัติที่สวยงามในตอนนั้น
JAB

@JAB มันเป็นเพียงการเปรียบเทียบเพื่อหยุดดูหรือวิธีการที่ทันสมัยในการวัดเวลาแน่นอน คุณพูดถูกว่าสวยหรูมากเมื่อเทียบกับยุคสมัยของกาลิเลโอ อย่างไรก็ตามจุดที่ฉันทำก็คือแม้ความแม่นยำต่ำ (1/10 ของช่วงเวลา) ก็ยังเพียงพอที่จะสังเกตความสัมพันธ์ระหว่างเวลาและระยะทาง
อักษะกัล

@JAB ซึ่งเป็นหนึ่งในตัวอย่างที่ชื่นชอบของวิธีการวัดที่ไร้สาระในวิชาฟิสิกส์คือในวิธีการค้นพบของเขา Cherenkov รังสี เขานั่งในห้องมืดจนกว่าดวงตาของเขาจะปรับเป็นความมืดจากนั้นเขาก็จะเปิดหรือปิดรูด้วยแสงที่มาจากมันจนกว่าแสงจะหายไป เขาต้องการบันทึกว่ามีรูเปิดเท่าใดเพื่อตรวจสอบระดับรังสี เห็นได้ชัดว่าตามนุษย์สามารถตรวจจับความแตกต่างของแสงที่วัดได้ในโฟตอนจำนวนหนึ่ง! กระดาษมีความยาว 3 หน้า
Aksakal

6

สำหรับสมมติฐานของตัวแบบการถดถอยที่จะเก็บไว้อย่างสมบูรณ์จะต้องรวมตัวทำนายที่เกี่ยวข้องทั้งหมด แต่ไม่มีข้อสันนิษฐานในการวิเคราะห์ทางสถิติใด ๆ ที่เก็บไว้ได้อย่างสมบูรณ์แบบและการฝึกฝนเชิงสถิติส่วนใหญ่ตั้งอยู่บนพื้นฐานของ "Close Enough"

ด้วยการออกแบบการทดลองและการสุ่มที่เหมาะสมผลของคำศัพท์ที่ไม่รวมอยู่ในแบบจำลองนั้นมักจะถูกละเว้น (สันนิษฐานว่าเท่ากับโอกาสของการสุ่ม) แต่การถดถอยมักใช้เมื่อการสุ่มเต็มรูปแบบไม่สามารถอธิบายตัวแปรที่เป็นไปได้ทั้งหมดที่ไม่รวมอยู่ในโมเดลดังนั้นคำถามของคุณจึงมีความสำคัญ

แบบจำลองการถดถอยทุกแบบที่เคยเหมาะสมอาจหายไปบางตัวทำนายที่มีศักยภาพ แต่ "ฉันไม่รู้" หากไม่มีคำชี้แจงเพิ่มเติมใด ๆ จะไม่อนุญาตให้นักสถิติการทำงานยังคงทำงานต่อไปดังนั้นเราจึงพยายามทำให้ดีที่สุด ระหว่างสมมติฐานและความเป็นจริงจะมีผลต่อผลลัพธ์ของเรา ในบางกรณีความแตกต่างจากสมมติฐานสร้างความแตกต่างน้อยมากและเราไม่ได้กังวลมากเกี่ยวกับความแตกต่าง แต่ในกรณีอื่น ๆ มันอาจจะร้ายแรงมาก

ทางเลือกหนึ่งเมื่อคุณรู้ว่าอาจมีตัวทำนายที่ไม่รวมอยู่ในรูปแบบที่เกี่ยวข้องจะทำการวิเคราะห์ความไว วิธีนี้วัดความเป็นไปได้ที่จะเกิดความลำเอียงบนพื้นฐานของความสัมพันธ์ที่อาจเกิดขึ้นกับตัวแปรที่ไม่วัด กระดาษแผ่นนี้:

Lin, DY และ Psaty, BM และ Kronmal, RA (1998): การประเมินความอ่อนไหวของผลลัพธ์การถดถอยสำหรับผู้ที่ไม่ได้วัดในการศึกษาแบบสังเกต Biometrics, 54 (3), Sep, pp. 948-963

ให้เครื่องมือบางอย่าง (และตัวอย่าง) ของการวิเคราะห์ความไว

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.