Andrew Gelman หนึ่งในบล็อกโพสต์ล่าสุดของเขาพูดว่า:
ฉันไม่คิดว่าการต่อต้านหรือผลที่อาจเกิดขึ้นเป็นสิ่งจำเป็นสำหรับความขัดแย้งของซิมป์สัน ฉันพูดแบบนี้เพราะเราสามารถตั้งค่าความขัดแย้งของซิมป์สันด้วยตัวแปรที่ไม่สามารถจัดการได้หรือการจัดการที่ไม่ได้สนใจโดยตรง
ความขัดแย้งของซิมป์สันเป็นส่วนหนึ่งของปัญหาทั่วไปที่โคย์การถดถอยเปลี่ยนแปลงหากคุณเพิ่มตัวทำนายมากขึ้นการพลิกสัญญาณไม่จำเป็นจริงๆ
นี่คือตัวอย่างที่ฉันใช้ในการสอนที่แสดงทั้งสองประเด็น:
ฉันสามารถใช้การถดถอยเพื่อทำนายรายได้จากเพศและส่วนสูง ฉันพบว่า coef ของเพศคือ$ 10,000 (เช่นการเปรียบเทียบชายและหญิงที่มีความสูงเท่ากันโดยเฉลี่ยแล้วผู้ชายจะเพิ่มอีก$ 10,000) และค่าสัมประสิทธิ์ของความสูงคือ$ 500 (เช่นการเปรียบเทียบผู้ชายสองคนหรือผู้หญิงสองคน ความสูงที่แตกต่างกันโดยเฉลี่ยคนที่สูงกว่าจะทำเงินได้สูงกว่า$ 500 ต่อนิ้ว)
ฉันจะแปลความหมายเหล่านี้ได้อย่างไร ฉันรู้สึกว่า coef of height นั้นง่ายต่อการตีความ (มันเป็นเรื่องง่ายที่จะจินตนาการเปรียบเทียบคนสองคนที่มีเพศเดียวกันกับความสูงที่แตกต่างกัน) แน่นอนว่ามันผิด“ ผิด” ที่จะถอยกลับที่ความสูงโดยไม่ควบคุมเพศ ความแตกต่างระหว่างคนที่สั้นและสูงสามารถ“ อธิบาย” ได้โดยการเป็นความแตกต่างระหว่างผู้ชายกับผู้หญิง แต่การมีเพศสัมพันธ์ในโมเดลด้านบนนั้นยากที่จะตีความ: ทำไมเปรียบเทียบผู้ชายกับผู้หญิงที่สูง 66 นิ้ว? นั่นจะเป็นการเปรียบเทียบชายร่างเตี้ยกับผู้หญิงสูง เหตุผลทั้งหมดนี้ดูเหมือนว่ามีสาเหตุเชิงลบ แต่ฉันไม่คิดว่ามันสมเหตุสมผลที่จะใช้ผลลัพธ์ที่เป็นไปได้
ฉันไตร่ตรองมากกว่านั้น (และแสดงความคิดเห็นในโพสต์) และคิดว่ามีบางสิ่งที่จะเข้าใจได้ชัดเจนยิ่งขึ้นที่นี่
จนกว่าส่วนในการตีความของเพศมันก็โอเค แต่ฉันไม่เห็นสิ่งที่เป็นปัญหาที่อยู่เบื้องหลังการเปรียบเทียบชายสั้นและผู้หญิงสูง นี่คือประเด็นของฉัน: ในความเป็นจริงมันสมเหตุสมผลดีกว่า (จากสมมติฐานที่ว่าผู้ชายสูงโดยเฉลี่ย) คุณไม่สามารถเปรียบเทียบ 'ชายร่างเตี้ย' และผู้หญิง 'สั้น' ด้วยเหตุผลเดียวกันได้ว่าความแตกต่างของรายได้นั้นถูกอธิบายในบางส่วนด้วยความแตกต่างของความสูง กันไปสำหรับผู้ชายสูงและผู้หญิงสูงและอื่น ๆ อีกมากสำหรับผู้หญิงสั้นและชายสูง (ซึ่งเป็นคำถามที่ไกลออกไปดังนั้นที่จะพูด) ดังนั้นโดยทั่วไปผลกระทบของความสูงจะถูกตัดออกเฉพาะในกรณีที่มีการเปรียบเทียบชายสั้นและหญิงสูง (ซึ่งจะช่วยในการตีความค่าสัมประสิทธิ์ต่อเพศ) มันไม่ส่งเสียงระฆังตามแนวคิดพื้นฐานที่คล้ายกันที่อยู่เบื้องหลังโมเดลการจับคู่ยอดนิยมใช่หรือไม่
แนวคิดเบื้องหลังความขัดแย้งของ Simpson คือผลกระทบของประชากรอาจแตกต่างจากเอฟเฟ็กต์กลุ่มย่อยอย่างชาญฉลาด นี่คือความรู้สึกบางอย่างที่เกี่ยวข้องกับประเด็นที่ 2 ของเขาและความจริงที่ว่าเขายอมรับว่าไม่ควรควบคุมความสูงเพียงอย่างเดียว แต่ฉันไม่สามารถเกี่ยวข้องกับการโต้เถียงเรื่องค่าสัมประสิทธิ์ของเพศ
บางทีคุณอาจจะสามารถแสดงออกได้ชัดเจนยิ่งขึ้น? หรือแสดงความคิดเห็นในความเข้าใจของฉัน?