ทำความเข้าใจกับความขัดแย้งของซิมป์สัน: ตัวอย่างของแอนดรูว์เจลแมนด้วยการลดรายได้เกี่ยวกับเรื่องเพศและส่วนสูง


22

Andrew Gelman หนึ่งในบล็อกโพสต์ล่าสุดของเขาพูดว่า:

  1. ฉันไม่คิดว่าการต่อต้านหรือผลที่อาจเกิดขึ้นเป็นสิ่งจำเป็นสำหรับความขัดแย้งของซิมป์สัน ฉันพูดแบบนี้เพราะเราสามารถตั้งค่าความขัดแย้งของซิมป์สันด้วยตัวแปรที่ไม่สามารถจัดการได้หรือการจัดการที่ไม่ได้สนใจโดยตรง

  2. ความขัดแย้งของซิมป์สันเป็นส่วนหนึ่งของปัญหาทั่วไปที่โคย์การถดถอยเปลี่ยนแปลงหากคุณเพิ่มตัวทำนายมากขึ้นการพลิกสัญญาณไม่จำเป็นจริงๆ

นี่คือตัวอย่างที่ฉันใช้ในการสอนที่แสดงทั้งสองประเด็น:

ฉันสามารถใช้การถดถอยเพื่อทำนายรายได้จากเพศและส่วนสูง ฉันพบว่า coef ของเพศคือ$ 10,000 (เช่นการเปรียบเทียบชายและหญิงที่มีความสูงเท่ากันโดยเฉลี่ยแล้วผู้ชายจะเพิ่มอีก$ 10,000) และค่าสัมประสิทธิ์ของความสูงคือ$ 500 (เช่นการเปรียบเทียบผู้ชายสองคนหรือผู้หญิงสองคน ความสูงที่แตกต่างกันโดยเฉลี่ยคนที่สูงกว่าจะทำเงินได้สูงกว่า$ 500 ต่อนิ้ว)

ฉันจะแปลความหมายเหล่านี้ได้อย่างไร ฉันรู้สึกว่า coef of height นั้นง่ายต่อการตีความ (มันเป็นเรื่องง่ายที่จะจินตนาการเปรียบเทียบคนสองคนที่มีเพศเดียวกันกับความสูงที่แตกต่างกัน) แน่นอนว่ามันผิด“ ผิด” ที่จะถอยกลับที่ความสูงโดยไม่ควบคุมเพศ ความแตกต่างระหว่างคนที่สั้นและสูงสามารถ“ อธิบาย” ได้โดยการเป็นความแตกต่างระหว่างผู้ชายกับผู้หญิง แต่การมีเพศสัมพันธ์ในโมเดลด้านบนนั้นยากที่จะตีความ: ทำไมเปรียบเทียบผู้ชายกับผู้หญิงที่สูง 66 นิ้ว? นั่นจะเป็นการเปรียบเทียบชายร่างเตี้ยกับผู้หญิงสูง เหตุผลทั้งหมดนี้ดูเหมือนว่ามีสาเหตุเชิงลบ แต่ฉันไม่คิดว่ามันสมเหตุสมผลที่จะใช้ผลลัพธ์ที่เป็นไปได้

ฉันไตร่ตรองมากกว่านั้น (และแสดงความคิดเห็นในโพสต์) และคิดว่ามีบางสิ่งที่จะเข้าใจได้ชัดเจนยิ่งขึ้นที่นี่

จนกว่าส่วนในการตีความของเพศมันก็โอเค แต่ฉันไม่เห็นสิ่งที่เป็นปัญหาที่อยู่เบื้องหลังการเปรียบเทียบชายสั้นและผู้หญิงสูง นี่คือประเด็นของฉัน: ในความเป็นจริงมันสมเหตุสมผลดีกว่า (จากสมมติฐานที่ว่าผู้ชายสูงโดยเฉลี่ย) คุณไม่สามารถเปรียบเทียบ 'ชายร่างเตี้ย' และผู้หญิง 'สั้น' ด้วยเหตุผลเดียวกันได้ว่าความแตกต่างของรายได้นั้นถูกอธิบายในบางส่วนด้วยความแตกต่างของความสูง กันไปสำหรับผู้ชายสูงและผู้หญิงสูงและอื่น ๆ อีกมากสำหรับผู้หญิงสั้นและชายสูง (ซึ่งเป็นคำถามที่ไกลออกไปดังนั้นที่จะพูด) ดังนั้นโดยทั่วไปผลกระทบของความสูงจะถูกตัดออกเฉพาะในกรณีที่มีการเปรียบเทียบชายสั้นและหญิงสูง (ซึ่งจะช่วยในการตีความค่าสัมประสิทธิ์ต่อเพศ) มันไม่ส่งเสียงระฆังตามแนวคิดพื้นฐานที่คล้ายกันที่อยู่เบื้องหลังโมเดลการจับคู่ยอดนิยมใช่หรือไม่

แนวคิดเบื้องหลังความขัดแย้งของ Simpson คือผลกระทบของประชากรอาจแตกต่างจากเอฟเฟ็กต์กลุ่มย่อยอย่างชาญฉลาด นี่คือความรู้สึกบางอย่างที่เกี่ยวข้องกับประเด็นที่ 2 ของเขาและความจริงที่ว่าเขายอมรับว่าไม่ควรควบคุมความสูงเพียงอย่างเดียว แต่ฉันไม่สามารถเกี่ยวข้องกับการโต้เถียงเรื่องค่าสัมประสิทธิ์ของเพศ

บางทีคุณอาจจะสามารถแสดงออกได้ชัดเจนยิ่งขึ้น? หรือแสดงความคิดเห็นในความเข้าใจของฉัน?


การตรวจสอบความถูกต้องไขว้ดูที่เซ็ตย่อยแบบสุ่มของประชากร, พยายามให้มีความเหมาะสมน้อยที่สุด, และการวางนัยทั่วไปที่ดีที่สุด
EngrStudent - Reinstate Monica

1
หากฉันเข้าใจข้อกังวลของคุณอย่างถูกต้องฉันคิดว่าคุณอาจได้รับประโยชน์จากการดูความขัดแย้งของพระเจ้าด้วย @article {lord67, ผู้แต่ง = {Lord, FM}, title = {ความขัดแย้งในการตีความการเปรียบเทียบกลุ่ม}, journal = {Psychological Bulletin}, ปี = {1967}, เล่ม = {68}, หน้า = {304- -305}, คำหลัก = {เปลี่ยนแปลงคะแนน}} @article {lord69, ผู้แต่ง = {Lord, FM}, ชื่อ = {การปรับทางสถิติเมื่อเปรียบเทียบกลุ่มที่มีอยู่แล้ว}, วารสาร = {Psychological Bulletin}, ปี = {1969}, ปริมาณ = {72}, หน้า = {336--337}, คำหลัก = {เปลี่ยนแปลงคะแนน}}
mdewey

1
เพิร์ลจูเดียทำยังโพสต์อื่นบนเส้นขนานซิมป์สันเมื่อเร็ว ๆ นี้ ฉันค่อนข้างแน่ใจว่าเขาไม่เห็นด้วยกับการนำเสนอของ Gelman สำหรับจุดหนึ่งจุดที่สองไม่ใช่ "เส้นขนาน" การกลับรายการของประมาณการอันเป็นผลมาจากสิ่งที่คุณมีเงื่อนไขเป็นข้อเท็จจริงทางคณิตศาสตร์ สิ่งที่ทำให้มันขัดแย้งกันคือเมื่อคุณทำการตีความเชิงสาเหตุของการประมาณทั้งสอง ประการที่สองทำไมข้อ จำกัด ของการจัดการที่ไม่สามารถจัดการได้เป็นสาเหตุเท่านั้น
NRH

คำตอบ:


9

ฉันไม่แน่ใจในคำถามของคุณทั้งหมด แต่สามารถพูดเกี่ยวกับการอ้างสิทธิ์ของเขาและความสับสนของคุณในแบบตัวอย่าง

แอนดรูว์ยังไม่ชัดเจนนักหากความสนใจทางวิทยาศาสตร์อยู่ในสมาคมปรับระดับรายได้ทางเพศหรือสมาคมปรับรายได้สูง ในแบบจำลองเชิงสาเหตุมีความสูง แต่ความสูงไม่ทำให้เกิดเพศ ดังนั้นหากเราต้องการผลกระทบของเพศการปรับความสูงจะแนะนำอคติคนกลาง (อาจเป็นอคติคอลเดอร์เช่นกันเนื่องจากคนรวยสูงกว่า!) ฉันพบว่ามันสับสนและตลกเมื่อฉันเห็นการวิจัยประยุกต์ที่ตีความอื่น ๆ"covariates" (confounders และตัวแปรความแม่นยำ) ซึ่งรวมอยู่ในแบบจำลอง มันเป็นเรื่องไร้สาระ แต่ให้การแบ่งชั้นอย่างเพียงพอเพื่อทำการเปรียบเทียบที่จำเป็น การปรับความสูงหากคุณสนใจที่จะอนุมานความแตกต่างของรายได้ตามเพศนั้นเป็นสิ่งที่ผิด

ฉันเห็นด้วยกับสิ่งล่อใจไม่จำเป็นต้องอธิบายความขัดแย้งของ Simpson พวกเขาสามารถเป็นลักษณะที่แท้จริงของข้อมูล ฉันคิดว่าทั้งน้ำมันดิบและ RR ที่ปรับปรุงแล้วมีความรู้สึกที่ถูกต้องโดยไม่มีสาเหตุ แน่นอนว่ามันเป็นปัญหามากกว่าเมื่อเป้าหมายคือการวิเคราะห์เชิงสาเหตุและการปรับตัวมากเกินไปจะเผยปัญหาของการไม่ยุบตัว (ซึ่งพองตัว OR) และขนาดตัวอย่างไม่เพียงพอ

เพื่อเป็นการเตือนสำหรับผู้อ่าน: ความขัดแย้งของซิมป์สันเป็นปรากฏการณ์ที่เฉพาะเจาะจงมากซึ่งหมายถึงตัวอย่างที่สมาคมพลิกทิศทางหลังจากควบคุมตัวแปรที่ทำให้สับสน ข้อมูลการรับสมัครของ Berkeley เป็นตัวอย่างที่สร้างแรงบันดาลใจ ที่นั่นน้ำมันดิบ RRs แสดงให้เห็นว่าผู้หญิงมีโอกาสน้อยที่จะได้รับการยอมรับจาก Berkeley แต่เมื่อแบ่งชั้นโดยหน่วยงาน , RRs แสดงให้เห็นว่าผู้หญิงที่มีแนวโน้มที่จะได้รับการยอมรับในทุกฝ่ายเดียว พวกเขามีแนวโน้มที่จะนำไปใช้กับแผนกยาก ๆ ที่ปฏิเสธคนจำนวนมาก

ตอนนี้ในทฤษฎีการอนุมานเชิงสาเหตุเราจะได้รับการทำให้งงงวยที่จะเข้าใจว่าแผนกหนึ่งใช้กับ สาเหตุ เพศ. เพศนั้นเป็นสิ่งที่ถูกต้องใช่ไหม? ก็ใช่และไม่ใช่ Miettenen โต้แย้งวิธีการ "ศึกษาฐาน" เพื่อแก้ไขปัญหาดังกล่าว: ใครคือประชากร? ไม่ใช่นักเรียนที่มีสิทธิ์ทุกคน แต่เป็นผู้ที่สมัครเป็นพิเศษกับ Berkeley หน่วยงานที่มีการแข่งขันมากขึ้นได้ดึงดูดให้ผู้หญิงสมัครเข้าเรียนที่เบิร์กลีย์เมื่อพวกเขาไม่สมัครเป็นอย่างอื่น หากต้องการขยาย: ผู้หญิงที่มีความฉลาดอย่างลึกซึ้งต้องการที่จะได้สิ่งที่ดีที่สุดพูดวิศวกรรมโปรแกรม ถ้าเบิร์กลีย์ไม่มีโปรแกรมวิศวกรรมที่ยอดเยี่ยมเธอจะไม่สมัครเข้าเรียน Berkeley ต่อไปเธอจะสมัครกับ MIT หรือ CalPoly ดังนั้นในแง่นั้นประชากร "นักศึกษาที่สมัครเข้าเรียน" ทำให้เกิดเพศและเป็นคนที่สับสน (ข้อแม้: ฉันเป็นนักศึกษารุ่นเก๋าคนแรกดังนั้นไม่ทราบมากเกี่ยวกับโปรแกรมที่มีชื่อเสียงในเรื่องอะไร)

ดังนั้นเราจะสรุปข้อมูลนี้ได้อย่างไร มันเป็นความจริงที่ Berkeley มีแนวโน้มที่จะยอมรับผู้ชายที่สมัครมากกว่าผู้หญิง และเป็นความจริงที่แผนกของ Berkeley มีแนวโน้มที่จะรับผู้หญิงมากกว่าที่จะยอมรับผู้ชาย RR ดิบและแบ่งชั้นเป็นมาตรการที่เหมาะสมแม้ว่าจะไม่ใช่สาเหตุ สิ่งนี้ตอกย้ำความสำคัญของความแม่นยำในการใช้ถ้อยคำของเราในฐานะนักสถิติ (ผู้เขียนที่ถ่อมตนไม่คิดว่าตัวเองจะแม่นยำจากระยะไกล)

Confounding เป็นปรากฏการณ์ที่แตกต่างจากการไม่ยุบตัวอีกรูปแบบหนึ่งของตัวแปรอคติที่ถูกละไว้ ซึ่งแตกต่างจากการถดถอยโลจิสติกไม่ใช่การยุบรวมไม่ก่อให้เกิดอคติในการถดถอยเชิงเส้นและการพิจารณาอย่างต่อเนื่องในตัวอย่างของ Gelman ควรได้รับการอธิบายอย่างละเอียดมากขึ้น

แอนดรูว์ตีความค่าสัมประสิทธิ์ทางเพศในโมเดลรายได้ที่ปรับเพศ / ความสูงของเขาเผยให้เห็นลักษณะของสมมติฐานของโมเดล: สมมติฐานของการเชิงเส้น แน่นอนในโมเดลเชิงเส้นการเปรียบเทียบระหว่างชายกับหญิงนั้นเปิดใช้งานเพราะสำหรับผู้หญิงที่เฉพาะเจาะจงเราสามารถทำนายได้สิ่งที่ชายร่างสูงที่คล้ายกันอาจได้รับแม้ว่าเขาจะไม่ได้สังเกต นี่เป็นกรณีเช่นเดียวกันหากมีการอนุญาตให้มีการปรับเปลี่ยนเอฟเฟ็กต์ดังนั้นความชันของแนวโน้มในผู้หญิงจึงแตกต่างจากของผู้ชาย ในทางกลับกันฉันไม่คิดว่ามันบ้าเกินกว่าที่จะนึกภาพผู้ชายและผู้หญิงที่มีความสูงเท่ากัน 66 นิ้วแน่นอนจะเป็นผู้หญิงที่สูงและชายร่างเตี้ย ดูเหมือนว่าฉันจะฉายภาพอย่างอ่อนโยนมากกว่าการคาดการณ์ขั้นต้น ยิ่งไปกว่านั้นเนื่องจากสมมติฐานของแบบจำลองสามารถระบุได้อย่างชัดเจนจึงช่วยให้ผู้อ่านเข้าใจว่าการมีเพศสัมพันธ์ที่มีรายได้สูงนั้นแบ่งเป็นข้อมูลที่ยืมมาหรือเฉลี่ยระหว่างตัวอย่างเพศชายและเพศหญิง หากสมาคมดังกล่าวเป็นวัตถุแห่งการอนุมานนักสถิติที่จริงจังจะพิจารณาความเป็นไปได้ของการปรับเปลี่ยนผลกระทบ


2
การอภิปรายที่ยอดเยี่ยม ในฐานะนักสถิติมันทำให้ฉันหงุดหงิดไม่จบเมื่อมีคนพูดถึงผลของการศึกษา แต่ไม่แน่ใจว่าพวกเขากำลังพูดถึงผลกระทบเล็กน้อยหรือมีเงื่อนไข
หน้าผา AB

1

"ทำไมต้องเปรียบเทียบผู้ชายกับผู้หญิงที่สูง 66 นิ้วเช่นนี้จะเปรียบเทียบชายร่างเตี้ยกับผู้หญิงร่างสูง "

ตัวแบบสมมติว่ารายได้ขึ้นอยู่กับเพศและส่วนสูง อย่างไรก็ตามวิธีการที่ความสูงสร้างรายได้ที่สูงขึ้นอาจไม่เหมือนกันสำหรับผู้ชายและผู้หญิง ผู้หญิงอาจถูกมองว่า "สูงพอ" ที่ความสูงซึ่งผู้ชายอาจจะยังถือว่าสั้น

การทำให้แบบจำลองเรียบง่ายขึ้นด้วยวิธีต่อไปนี้อาจมีประโยชน์

สมมติว่าคุณต้องการลดความน่าจะเป็นที่จะได้รับการว่าจ้างเป็นผู้ช่วยร้านค้าในร้านค้าปลีกเสื้อผ้าขนาดใหญ่และพิจารณากลยุทธ์การระบุตัวตนต่อไปนี้

คุณสังเกตว่านายจ้างมีแนวโน้มที่จะจ้างแรงงานที่มีระดับความสูงขั้นต่ำที่ "ต่ำสุด" นั้นสัมพันธ์กับเพศ

แทนที่จะวัดความสูงเป็นซม. สมมติว่ามีค่าเกณฑ์สองค่าที่กำหนดความสูงตามลำดับที่ชายและหญิงเป็น "สูง":> = 180 ซม. สำหรับผู้ชายและ> = 170 ซม. สำหรับผู้หญิง

สมมติว่ามีเกณฑ์อยู่ในความเป็นจริง (เช่นนายจ้างสร้างความแตกต่างอย่างชัดเจนระหว่างเพศหญิงและสูง 169 ซม. หรือ 171 ซม.) และเป็นสิ่งที่ถูกต้องคุณสามารถสร้างหุ่นที่กำหนดเพศชาย / หญิงสูง / สั้นได้ ชายและหญิงที่มีความสูงต่างกันอาจยังตกอยู่ในประเภทเดียวกันของหุ่นจำลองของคุณและในเวลาเดียวกันการวัดของคุณสอดคล้องกับพลวัตที่แท้จริงของตลาดแรงงานนั้น ๆ


-1

คุณจะบอก (ในคำธรรมดามากขึ้น) ว่าการต่อสู้ทางเพศโดยทั่วไปว่าผู้ชายมีโอกาสมากกว่าผู้หญิงเนื่องจากรายได้ของพวกเขาสูงกว่า p% จะมีความลำเอียงที่ขัดแย้ง

บางทีนั่นอาจเป็นประเด็น เรามักจะเห็นสิ่งต่าง ๆ ว่ามีลักษณะอย่างไรและไม่วิเคราะห์ความหมายพื้นฐาน

เพื่อให้เหนือกว่าความขัดแย้งของซิมป์สันเราจะต้องตอบคำถามว่า "เงินเท่าไหร่ที่จะทำให้ผู้หญิงทำงานที่ไม่ฝักใฝ่ฝ่ายใดในจำนวนเท่ากันเมื่อเทียบกับผู้ชาย?" ใครบางคนอาจพูดได้ว่าพวกเขาจะต้องตั้งครรภ์และเลี้ยงดูลูก ๆ มากกว่าซึ่งเป็นเรื่องจริง แต่ประเด็นที่สำคัญคือมันถอนหายใจเพียงแค่พูดว่า "ผู้หญิงที่เป็นผู้หญิงมีโอกาสน้อยลง" และลึกซึ้ง การวิเคราะห์ด้วยสถิติตามเงื่อนไขจะทำให้เราเห็นว่าในสาระสำคัญมีโอกาสที่เท่าเทียมกันและเป็นปัจจัยอื่น ๆ ที่ไม่เกี่ยวข้องกับเพศสิ่งที่ทำให้สถิติดูเหมือนว่าเป็นการเลือกปฏิบัติที่เกี่ยวข้องกับปัญหาทางเพศ


มันอาจจะมีประโยชน์ที่จะเข้าใจว่าการวิเคราะห์ดังกล่าวอาจไม่จำเป็นต้องเป็นสาเหตุหรืออธิบาย แต่อธิบายถึงปรากฏการณ์ที่มีอยู่
AdamO
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.