การถดถอยไปสู่ค่าเฉลี่ยใน“ การคิดเร็วและช้า”


14

ในการคิดเร็วและช้า Daniel Kahneman วางคำถามสมมุติฐานต่อไปนี้:

(หน้า 186) Julie ปัจจุบันเป็นรุ่นพี่ในมหาวิทยาลัยของรัฐ เธออ่านได้คล่องเมื่อเธออายุสี่ขวบ เกรดเฉลี่ย (GPA) ของเธอคืออะไร

ความตั้งใจของเขาคือการแสดงให้เห็นว่าเรามักจะล้มเหลวในการบัญชีสำหรับการถดถอยถึงค่าเฉลี่ยเมื่อทำการทำนายเกี่ยวกับสถิติบางอย่าง ในการอภิปรายต่อไปเขาแนะนำ:

(หน้า 190) จำได้ว่าความสัมพันธ์ระหว่างสองมาตรการ - ในกรณีการอ่านอายุปัจจุบันและเกรดเฉลี่ย - เท่ากับสัดส่วนของปัจจัยที่ใช้ร่วมกันในปัจจัยของพวกเขา คุณคาดเดาสิ่งที่ดีที่สุดเกี่ยวกับสัดส่วนนั้นได้อย่างไร การคาดเดาในแง่ดีที่สุดของฉันคือประมาณ 30% สมมติว่าประมาณการนี้เรามีทุกอย่างที่เราต้องการในการทำนายอย่างเป็นกลาง นี่คือคำแนะนำสำหรับวิธีการเดินทางในสี่ขั้นตอนง่าย ๆ :

  1. เริ่มต้นด้วยการประมาณเกรดเฉลี่ย
  2. กำหนดเกรดเฉลี่ยที่ตรงกับการแสดงหลักฐานของคุณ
  3. ประมาณค่าสหสัมพันธ์ระหว่างการอ่านค่าความฉลาดสูงกับเกรดเฉลี่ย
  4. หากความสัมพันธ์คือ. 30 ให้ย้าย 30% ของระยะทางจากค่าเฉลี่ยไปยังเกรดเฉลี่ยที่ตรงกัน

การตีความคำแนะนำของเขาของฉันเป็นดังนี้:

  1. ใช้ "เธออ่านได้อย่างคล่องแคล่วเมื่อเธออายุสี่ขวบ" เพื่อสร้างคะแนนมาตรฐานสำหรับความฉลาดเกินอายุการอ่านของจูลี่
  2. กำหนดเกรดเฉลี่ยที่มีคะแนนมาตรฐานที่สอดคล้องกัน (GPA ที่มีเหตุผลในการทำนายจะสอดคล้องกับคะแนนมาตรฐานนี้หากความสัมพันธ์ระหว่าง GPA และความแม่นยำในการอ่านนั้นสมบูรณ์แบบ)
  3. ประมาณเปอร์เซ็นต์ของความแปรปรวนใน GPA ที่สามารถอธิบายได้ด้วยความแปรปรวนในการอ่านความแม่นยำ (ฉันคิดว่าเขาหมายถึงสัมประสิทธิ์การตัดสินใจด้วย "สหสัมพันธ์" ในบริบทนี้?)
  4. เนื่องจากมีเพียง 30% ของคะแนนมาตรฐานของความฉลาดเกินดุลการอ่านของจูลี่สามารถอธิบายได้ด้วยปัจจัยที่สามารถอธิบายคะแนนมาตรฐานของเกรดเฉลี่ยของเธอได้เราจึงมีความชอบธรรมในการทำนายว่าคะแนนมาตรฐานของเกรดเฉลี่ยของจูลี่จะเป็น 30% ของสิ่งที่จะเป็น ในกรณีของความสัมพันธ์ที่สมบูรณ์แบบ

การตีความขั้นตอนของ Kahneman ของฉันถูกต้องหรือไม่? ถ้าเป็นเช่นนั้นจะมีเหตุผลทางคณิตศาสตร์ที่เป็นทางการมากขึ้นของขั้นตอนของเขาโดยเฉพาะขั้นตอนที่ 4? โดยทั่วไปแล้วความสัมพันธ์ระหว่างความสัมพันธ์ระหว่างตัวแปรสองตัวกับการเปลี่ยนแปลง / ความแตกต่างในคะแนนมาตรฐานคืออะไร

คำตอบ:


2

การตีความขั้นตอนของ Kahneman ของฉันถูกต้องหรือไม่?

นี่เป็นเรื่องยากที่จะพูดเพราะขั้นตอนที่ # 2 ของ Kahneman ไม่ได้มีการกำหนดอย่างแม่นยำมาก: "กำหนดเกรดเฉลี่ยที่ตรงกับความประทับใจของคุณในหลักฐาน" - สิ่งที่ควรจะหมายถึง? หากการแสดงผลของใครบางคนมีการสอบเทียบที่ดีแล้วก็ไม่จำเป็นต้องแก้ไขต่อค่าเฉลี่ย หากการแสดงผลของใครบางคนถูกปิดอย่างไม่มีการลดแล้วพวกเขาก็ควรจะแก้ไขให้แข็งแกร่งยิ่งขึ้น

ดังนั้นฉันจึงเห็นด้วยกับ @AndyW ว่าคำแนะนำของ Kahneman เป็นเพียงกฎของหัวแม่มือ

ZZ

[... ] มีเหตุผลทางคณิตศาสตร์ที่เป็นทางการของขั้นตอนของเขาโดยเฉพาะอย่างยิ่งขั้นตอนที่ 4? โดยทั่วไปแล้วความสัมพันธ์ระหว่างความสัมพันธ์ระหว่างตัวแปรสองตัวกับการเปลี่ยนแปลง / ความแตกต่างในคะแนนมาตรฐานคืออะไร

YxZρ

Y=ρx,

xYρ

นี่คือสิ่งที่เรียกว่า "การถดถอยของค่าเฉลี่ย" คุณสามารถดูสูตรและการสืบทอดในการอภิปรายเกี่ยวกับวิกิพีเดีย


8

ลำดับของหมายเลขของคุณไม่ตรงกับคำพูดของ Kahneman ด้วยเหตุนี้ดูเหมือนว่าคุณจะพลาดจุดโดยรวม

จุดหนึ่งของคาห์มันมันสำคัญที่สุด มันหมายถึงการประเมินเกรดเฉลี่ยโดยแท้จริง - สำหรับทุกคน จุดที่อยู่เบื้องหลังคำแนะนำนี้ก็คือมันเป็นสมอเรือของคุณ การทำนายใด ๆ ที่คุณให้ควรอ้างอิงถึงการเปลี่ยนแปลงรอบจุดยึดนี้ ฉันไม่แน่ใจว่าฉันเห็นขั้นตอนนี้ในจุดใดของคุณ!

Kahneman ใช้ตัวย่อ WYSIATI สิ่งที่คุณเห็นคือทั้งหมดที่มี นี่เป็นแนวโน้มที่มนุษย์จะประเมินค่าความสำคัญของข้อมูลที่มีอยู่ในปัจจุบัน สำหรับหลาย ๆ คนข้อมูลเกี่ยวกับความสามารถในการอ่านจะทำให้ผู้คนคิดว่าจูลี่ฉลาดและดังนั้นผู้คนจะคาดเดาเกรดเฉลี่ยของคนฉลาด

แต่พฤติกรรมของเด็กที่สี่มีข้อมูลน้อยมากที่เกี่ยวข้องกับพฤติกรรมผู้ใหญ่ คุณน่าจะดีกว่าที่จะเพิกเฉยต่อการคาดการณ์ มันจะแกว่งคุณจากสมอของคุณเพียงเล็กน้อย นอกจากนี้ผู้คนเดาว่า GPA เป็นคนฉลาดคนแรกอาจไม่ถูกต้องมาก เนื่องจากการคัดเลือกส่วนใหญ่ของผู้อาวุโสในวิทยาลัยอยู่เหนือปัญญาเฉลี่ย

จริงๆแล้วมีข้อมูลที่ซ่อนอยู่ในคำถามนอกเหนือจากความสามารถในการอ่านของจูลี่เมื่ออายุสี่ขวบ

  • จูลี่น่าจะเป็นชื่อหญิง
  • เธอกำลังเรียนมหาวิทยาลัยของรัฐ
  • เธอเป็นรุ่นพี่

ฉันสงสัยว่าคุณลักษณะทั้งสามนี้จะเพิ่มเกรดเฉลี่ยโดยเฉลี่ยเล็กน้อยเมื่อเทียบกับจำนวนนักเรียนโดยรวม ตัวอย่างเช่นฉันพนันได้ว่าผู้สูงอายุ 'มีเกรดเฉลี่ยสูงกว่า Sophmores' เพราะนักเรียนที่มีเกรดเฉลี่ยไม่ดีลดลง

ดังนั้นขั้นตอนของ Kahneman (ตามสมมติฐาน) จะเป็นแบบนี้

  1. เฉลี่ยเกรดเฉลี่ยสำหรับหญิงอาวุโสในมหาวิทยาลัยของรัฐคือ 3.1
  2. ฉันเดาว่าขึ้นอยู่กับความสามารถในการอ่านขั้นสูงของ Julie ที่ 4 ที่เกรดเฉลี่ยของเธอคือ 3.8
  3. ฉันเดาว่าความสามารถในการอ่านที่อายุ 4 ปีมีความสัมพันธ์ 0.3 กับเกรดเฉลี่ย
  4. จากนั้น 30% ของวิธีการระหว่าง 3.1 และ 3.8 คือ 3.3 (เช่น3.1 + (3.8-3.1)*0.3)

ดังนั้นในสมมติฐานนี้การคาดเดาขั้นสุดท้ายสำหรับเกรดเฉลี่ยของ Julie คือ 3.3

การถดถอยของค่าเฉลี่ยในแนวทางของ Kahneman คือขั้นตอนที่ 2 น่าจะเป็นการประเมินความสำคัญของข้อมูลที่มีอยู่ ดังนั้นกลยุทธ์ที่ดีกว่าคือถอยหลังการทำนายกลับไปสู่ค่าเฉลี่ยโดยรวม ขั้นตอนที่ 3 และ 4 เป็นวิธี (เฉพาะกิจ) ในการประมาณจำนวนเงินที่จะถดถอย


ฉันเข้าใจสัญชาตญาณหลังกระบวนการ แต่ไม่ใช่เหตุผลทางคณิตศาสตร์ การตีความของฉันคือจุดของการประมาณค่าเฉลี่ยเกรดเฉลี่ยคือการอนุญาตให้หนึ่งเพื่อประเมินเกรดเฉลี่ยเฉพาะในแง่ของคะแนนมาตรฐาน; มิฉะนั้นพวกเขาไม่สามารถเปรียบเทียบความหมายกับการอ่านความฉลาดเกินจริงได้ (ต่อ)
ปันส่วน

1
คาห์นมันแมนกล่าวว่าคนส่วนใหญ่เดาว่าเกรดเฉลี่ย = 3.7 หรือ 3.8 ซึ่งอาจสอดคล้องกับคะแนนมาตรฐานที่พวกเขาเชื่อมโยงกับความหยั่งรู้ในการอ่านของจูลี่ แต่ก็อนุมานว่าความสัมพันธ์ระหว่างตัวแปรทั้งสองนั้นสมบูรณ์แบบ ฉันสับสนเป็นหลักเกี่ยวกับว่าขั้นตอนที่ 4 เป็นกฎพื้นฐานของการใช้นิ้วโป้งหรือเป็นจริงขั้นตอนที่ใช้ได้จริงทางสถิติ (กล่าวคือเราสามารถรักษาคะแนนมาตรฐานได้อย่างต่อเนื่องและเพิ่มสัดส่วนตามความสัมพันธ์หรือไม่) ถ้ามันเป็นเพียงกฎของคนธรรมดาสามัญมีวิธีการทางสถิติที่เข้มงวดมากขึ้นหรือไม่?
ปันส่วน

โดย "additively" ฉันอ้างถึงข้อสันนิษฐานของเราว่า (1) สัดส่วนของคะแนน GPA ของ Julie บางส่วนนั้นอธิบายได้จากปัจจัยที่สามารถอธิบายการอ่านของเธอได้อย่างรวดเร็ว (2) สัดส่วนที่เหลือของคะแนนเฉลี่ยของเธอนั้นถูกอธิบายโดยปัจจัย มีลักษณะเฉพาะในการอธิบาย GPA ว่า (3) ผลรวมเหล่านี้เท่ากับคะแนน GPA สุดท้ายที่เราคาดการณ์ไว้สำหรับ Julie และ (4) เราสามารถแก้ไขการทำนายของเราได้โดยเพียงแค่สัดส่วนการคาดการณ์ลำเอียงของเรา ทำงานกับสัดส่วนของส่วนเบี่ยงเบนมาตรฐานเช่นนี้หรือไม่เมื่อเทียบกับพูดทำงานกับรากที่สองของพวกเขา - ถูกต้อง?
ปันส่วน

มันเป็นกฎเฉพาะกิจ ขั้นตอนที่สองและสามไม่จำเป็นต้องสอดคล้องกันอย่างมีเหตุผล (พวกเขามีสองวิธีที่แตกต่างกันในการพูดข้อมูลเดียวกันหนึ่งวิธีคือขนาดเอฟเฟกต์และอีกวิธีหนึ่งคือขนาดเอฟเฟกต์มาตรฐาน)
Andy W
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.