ความขัดแย้งทางสถิติที่น่าสนใจที่สุด


112

เนื่องจากฉันพบว่าพวกมันน่าหลงใหลฉันอยากจะได้ยินว่าคนในชุมชนนี้ค้นพบว่าอะไรคือความขัดแย้งทางสถิติที่น่าสนใจที่สุดและเพราะอะไร


1
ตัวอย่างเล็ก ๆ น้อย ๆ โดยเฉพาะอย่างยิ่งในบริบทการสำรวจที่นี่: filipspagnoli.wordpress.com/category/statistics/…
Charlie

คำตอบ:


100

มันไม่ได้เป็นความขัดแย้งต่อ seแต่มันก็เป็นความคิดเห็นงงอย่างน้อยในตอนแรก

ในช่วงสงครามโลกครั้งที่สองอับราฮัมวัลด์เป็นนักสถิติสำหรับรัฐบาลสหรัฐฯ เขามองไปที่เครื่องบินทิ้งระเบิดที่กลับมาจากภารกิจและวิเคราะห์รูปแบบของ "บาดแผล" กระสุนปืนบนเครื่องบิน เขาแนะนำว่ากองทัพเรือเสริมพื้นที่ที่เครื่องบินไม่มีความเสียหาย

ทำไม? เรามีเอฟเฟกต์การเลือกในที่ทำงาน ตัวอย่างนี้แสดงให้เห็นว่าความเสียหายที่เกิดขึ้นในพื้นที่ที่สังเกตสามารถทนได้ เครื่องบินทั้งสองไม่เคยถูกโจมตีในพื้นที่ที่ไม่มีการแตะต้องข้อเสนอที่ไม่น่าจะเกิดขึ้น เราสนใจเกี่ยวกับเครื่องบินที่ลงไปไม่ใช่แค่พวกที่กลับมา ผู้ที่ตกสู่บาปจะได้รับการโจมตีในสถานที่ซึ่งมิได้ถูกแตะต้องผู้ที่รอดชีวิต

สำหรับสำเนาของบันทึกเดิมของเขาให้ดูที่นี่ สำหรับการใช้งานที่ทันสมัยมากขึ้นเห็นนี้โพสต์บล็อกวิทยาศาสตร์อเมริกัน

ขยายเมื่อรูปแบบตามที่โพสต์บล็อกนี้ในระหว่างสงครามโลกครั้งที่แนะนำของหมวกกันน็อกดีบุกนำไปสู่การมากขึ้นบาดแผลที่ศีรษะกว่าหมวกผ้ามาตรฐาน หมวกกันน็อกใหม่นี้แย่กว่าสำหรับทหารหรือไม่? ไม่มี แม้ว่าการบาดเจ็บจะสูงขึ้น แต่การเสียชีวิตก็ลดลง


3
ฉันจำได้ว่าเคยอ่านเรื่องนี้มาก่อนสองสามครั้ง แต่ฉันไม่มีเอกสารอ้างอิง มีอย่างใดอย่างหนึ่งที่คุณสามารถเพิ่มได้?
พระคาร์ดินัล

1
@ cardinal ฉันพบบันทึกช่วยจำบางอย่างสำหรับคุณ ดูเหมือนว่าการวิจัยเป็นจริงสำหรับสหรัฐอเมริกา
ชาร์ลี

บางแห่งมีเครื่องบินกระจายของตัวอย่างสมมุติ แต่ฉันหามันไม่พบ
Fomite

+1 นี่คือตัวอย่างของอคติผู้รอดชีวิตบางทีอาจเป็นอันตรายที่สุดของอคติ ฉันขยายมันในคำตอบ
หน้าผา AB

47

อีกตัวอย่างหนึ่งคือการเข้าใจผิดในระบบนิเวศ

ตัวอย่าง
สมมติว่าเรามองหาความสัมพันธ์ระหว่างการลงคะแนนและรายได้โดยการลดส่วนแบ่งการลงคะแนนให้กับวุฒิสมาชิกโอบามาในรายได้เฉลี่ยของรัฐ (เป็นพัน) เราได้ค่าตัดประมาณ 20 และค่าสัมประสิทธิ์ความชันเท่ากับ 0.61

หลายคนจะตีความผลลัพธ์นี้ว่าผู้คนที่มีรายได้สูงมีแนวโน้มที่จะลงคะแนนให้พรรคเดโมแครตมากกว่า แท้จริงแล้วหนังสือกดที่เป็นที่นิยมได้ทำให้การโต้แย้งนี้

แต่เดี๋ยวก่อนฉันคิดว่าคนรวยมีแนวโน้มที่จะเป็นรีพับลิกันมากกว่า? พวกเขาคือ.

สิ่งที่ถดถอยนี้เป็นจริงที่บอกเราเป็นที่อุดมไปด้วยรัฐมีแนวโน้มที่จะลงคะแนนให้พรรคประชาธิปัตย์และคนจนรัฐมีแนวโน้มที่จะลงคะแนนเสียงให้พรรครีพับลิ ภายในรัฐที่กำหนดคนรวยมีแนวโน้มที่จะลงคะแนนให้พรรครีพับลิกันและคนจนมีแนวโน้มที่จะลงคะแนนให้พรรคประชาธิปัตย์มากขึ้น ดูการทำงานของแอนดรูว์เกลแมนและ coauthors

หากไม่มีข้อสมมติฐานเพิ่มเติมเราไม่สามารถใช้ข้อมูลระดับกลุ่ม (รวม) เพื่อทำการอนุมานเกี่ยวกับพฤติกรรมระดับบุคคล นี่คือการเข้าใจผิดทางนิเวศวิทยา ข้อมูลระดับกลุ่มสามารถบอกเราเกี่ยวกับพฤติกรรมระดับกลุ่มเท่านั้น

ในการก้าวกระโดดไปสู่การอนุมานระดับบุคคลเราจำเป็นต้องมีข้อสมมติฐานที่แน่นอน ที่นี่ตัวเลือกการลงคะแนนเสียงของบุคคลส่วนใหญ่ไม่แตกต่างกันอย่างเป็นระบบกับรายได้เฉลี่ยของรัฐ คนที่มีรายรับ $ X ในรัฐที่ร่ำรวยต้องมีแนวโน้มที่จะลงคะแนนให้กับพรรคประชาธิปัตย์เช่นเดียวกับคนที่รับรายได้$ X ในรัฐที่ยากจน แต่คนในคอนเนตทิในทุกระดับรายได้มีแนวโน้มที่จะลงคะแนนให้พรรคประชาธิปัตย์กว่าคนในมิสซิสซิปปี้ที่บรรดาระดับรายเดียวกัน ดังนั้นการสันนิษฐานความสอดคล้องถูกละเมิดและเราจะนำไปสู่ข้อสรุปที่ผิด (หลงกลโดยการรวมอคติ )

หัวข้อนี้เป็นงานอดิเรกบ่อยครั้งของDavid Freedmanตอนปลาย; ดูกระดาษนี้ตัวอย่างเช่น ในบทความนั้นฟรีแมนได้จัดให้มีวิธีสำหรับการจำกัดความน่าจะเป็นระดับบุคคลโดยใช้ข้อมูลกลุ่ม

การเปรียบเทียบกับบุคคลที่ผิดธรรมดาของ Simpson ที่
อื่นใน CW นี้ @Michelle เสนอให้บุคคลที่ผิดธรรมดาของ Simpson เป็นตัวอย่างที่ดีอย่างที่มันเป็น ความขัดแย้งของซิมป์สันและการเข้าใจผิดทางนิเวศวิทยานั้นมีความสัมพันธ์กันอย่างใกล้ชิด แต่ก็ชัดเจน ตัวอย่างทั้งสองแตกต่างกันในลักษณะของข้อมูลที่กำหนดและการวิเคราะห์ที่ใช้

สูตรมาตรฐานของความขัดแย้งของซิมป์สันคือตารางสองทาง ในตัวอย่างของเราที่นี่สมมติว่าเรามีข้อมูลส่วนบุคคลและเราจำแนกแต่ละบุคคลเป็นรายได้สูงหรือต่ำ เราจะได้รับตารางแสดงรายได้ 2x2 จากผลรวมทั้งหมด เราจะเห็นว่าส่วนแบ่งสูงของคนที่มีรายได้สูงโหวตให้กับพรรคประชาธิปัตย์เมื่อเทียบกับคนที่มีรายได้ต่ำ หากเราจะสร้างตารางฉุกเฉินสำหรับแต่ละรัฐอย่างไรก็ตามเราจะเห็นรูปแบบตรงกันข้าม

ในการเข้าใจผิดทางนิเวศวิทยาเราจะไม่ยุบรายได้ลงในตัวแปรแบบแบ่งขั้ว (หรือหลายขั้ว) เพื่อให้ได้ระดับรัฐเราจะได้รับรายได้เฉลี่ย (หรือค่ามัธยฐาน) ของรัฐและการลงคะแนนเสียงของรัฐและดำเนินการถดถอยและพบว่ารัฐที่มีรายได้สูงกว่ามีแนวโน้มที่จะลงคะแนนเสียงให้กับพรรคประชาธิปัตย์มากขึ้น หากเราเก็บข้อมูลระดับบุคคลและดำเนินการถดถอยแยกกันตามรัฐเราจะพบผลที่ตรงกันข้าม

โดยสรุปความแตกต่างคือ:

  • โหมดการวิเคราะห์ : เราสามารถพูดได้ว่าหลังจากการเตรียมทักษะ SAT ของเราแล้วความขัดแย้งของซิมป์สันคือตารางฉุกเฉินเนื่องจากการเข้าใจผิดทางนิเวศวิทยาคือค่าสัมประสิทธิ์สหสัมพันธ์และการถดถอย
  • ระดับของการรวม / ลักษณะของข้อมูล : ในขณะที่ตัวอย่างเช่นความขัดแย้งซิมป์สันเปรียบเทียบตัวเลขสอง (หุ้นลงคะแนนเสียงพรรคประชาธิปัตย์ในกลุ่มบุคคลที่มีรายได้สูงเมื่อเทียบกับเดียวกันสำหรับบุคคลที่มีรายได้ต่ำ) เข้าใจผิดในระบบนิเวศใช้ 50 คะแนนข้อมูล ( เช่นแต่ละรัฐ) เพื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ . เพื่อให้ได้เรื่องราวทั้งหมดในตัวอย่างที่ขัดแย้งกันของซิมป์สันเราแค่ต้องการตัวเลขสองตัวจากแต่ละรัฐห้าสิบ (100 หมายเลข) ในขณะที่ในกรณีของการเข้าใจผิดทางนิเวศวิทยาเราต้องการข้อมูลระดับบุคคล (หรืออื่น ๆ ความสัมพันธ์ระดับรัฐ / ความชันถดถอย)

การสังเกตทั่วไป
@NeilG แสดงความคิดเห็นว่านี่เป็นเพียงการบอกว่าคุณไม่สามารถเลือกตัวแปรที่ไม่สามารถสังเกตเห็นได้ / ละเว้นตัวแปรที่ทำให้เกิดปัญหาในการถดถอยของคุณ ถูกตัอง! อย่างน้อยในบริบทของการถดถอยฉันคิดว่า "บุคคลที่ผิดธรรมดา" เกือบทั้งหมดเป็นเพียงกรณีพิเศษของการละเว้นตัวแปรอคติ

อคติการเลือก (ดูการตอบสนองอื่น ๆ ของฉันใน CW นี้) สามารถควบคุมได้โดยการรวมตัวแปรที่ขับเคลื่อนการเลือก แน่นอนว่าตัวแปรเหล่านี้มักจะไม่ได้รับการตรวจสอบเพื่อผลักดันปัญหา / ข้อขัดแย้ง การถดถอยที่แท้จริง (การตอบกลับอื่น ๆ ของฉัน) สามารถเอาชนะได้โดยการเพิ่มแนวโน้มเวลา กรณีเหล่านี้บอกว่าโดยพื้นฐานแล้วคุณมีข้อมูลเพียงพอ แต่ต้องการตัวทำนายเพิ่มเติม

ในกรณีของการเข้าใจผิดทางนิเวศวิทยามันเป็นเรื่องจริงคุณต้องมีผู้ทำนายมากขึ้น (ที่นี่ความลาดชันและจุดตัดเฉพาะของรัฐ) แต่คุณต้องมีการสังเกตการณ์มากกว่า - เป็นรายบุคคลมากกว่าระดับกลุ่มเพื่อสังเกตความสัมพันธ์เหล่านี้

(โดยบังเอิญถ้าคุณมีการเลือกมากที่ตัวแปรการเลือกแบ่งการรักษาและการควบคุมอย่างสมบูรณ์แบบในตัวอย่าง WWII ที่ฉันให้คุณอาจต้องการข้อมูลเพิ่มเติมเพื่อประเมินการถดถอยเช่นกันที่นั่นเครื่องบินตก)


เป็นไปได้อย่างไรที่จะทำให้สมมติฐานที่สอดคล้องเป็นรูปเป็นร่างเป็นระเบียบขึ้นมา? ดูเหมือนว่าสมมติว่าไม่มีคนหลงทาง (สาเหตุ) ที่ขาดหายไปจากแบบจำลองของคน ๆ นั้น
Neil G

2
นอกจากนี้ตัวอย่างที่ให้ไว้ยังเป็นตัวอย่างของความขัดแย้งของซิมป์สันเนื่องจากการปรับสภาพในรัฐกลับทำให้ความสัมพันธ์ระหว่างรายได้กับพรรค การเข้าใจผิดทางนิเวศวิทยาแตกต่างจากความขัดแย้งของซิมป์สันเมื่อใด
Neil G

ฉันจะชี้ให้เห็นว่าการอ้างถึงความสัมพันธ์ระดับกลุ่มหรือสาเหตุตามความสัมพันธ์ระดับบุคคลหรือความสัมพันธ์เชิงสาเหตุก็ไม่ดีเช่นกัน: การเข้าใจผิดแบบอะตอม (atomistic fallacy) ซึ่งพูดชัดแจ้งอย่างชัดเจน: [Diez-Roux, 1998] Diez-Roux, AV (1998) นำบริบทกลับคืนสู่ระบาดวิทยา: ตัวแปรและความล้มเหลวในการวิเคราะห์หลายระดับ วารสารการสาธารณสุขอเมริกัน 88 (2): 216–222
Alexis

43

การมีส่วนร่วมของฉันคือความขัดแย้งของ Simpsonเพราะ:

  • เหตุผลสำหรับความขัดแย้งนั้นไม่ง่ายนักสำหรับคนจำนวนมากดังนั้น
  • อาจเป็นเรื่องยากมากที่จะอธิบายว่าทำไมการค้นพบเป็นวิธีที่พวกเขาจะวางคนในภาษาอังกฤษธรรมดา

    tl; dr เวอร์ชั่นของเส้นขนาน: นัยสำคัญทางสถิติของผลลัพธ์ปรากฏแตกต่างกันไปขึ้นอยู่กับวิธีการแบ่งพาร์ติชันข้อมูล สาเหตุมักปรากฏขึ้นเนื่องจากตัวแปรที่ทำให้สับสน

อีกร่างที่ดีของความขัดแย้งอยู่ที่นี่


4
+1 ฉันคิดว่าจะใส่ตัวเอง สำหรับผู้ที่มีความสนใจขัดแย้งของซิมป์สันยังกล่าวถึงในประวัติย่อที่นี่: stats.stackexchange.com/questions/21896
gung

3
มีตัวอย่างบางส่วนของความขัดแย้งของ Simpson ที่กล่าวถึงในคำถาม math.SEนี้
Mike Spivey

32

ไม่มีความขัดแย้งในสถิติมีเพียงปริศนาที่รอการแก้ไข

แต่ที่ชื่นชอบคือสองซองจดหมาย "ความขัดแย้ง" สมมติว่าฉันใส่ซองจดหมายสองซองไว้ข้างหน้าคุณและบอกคุณว่าซองหนึ่งมีเงินมากเป็นสองเท่าของซองอื่น (แต่ไม่ใช่ซองไหน) คุณให้เหตุผลดังนี้ สมมติว่าซองซ้ายมีแล้วมีโอกาส 50% ซองด้านขวามี2 xและด้วยความน่าจะเป็น 50% มันมี0.5 xสำหรับค่าที่คาดหวังของ1.25 x แต่แน่นอนคุณสามารถย้อนกลับซองจดหมายและสรุปได้ว่าซองจดหมายด้านซ้ายมีค่า1.25เท่าของซองจดหมายด้านขวา เกิดอะไรขึ้น?x2x0.5x1.25x1.25


brilliant paradox - น่าสนใจถ้าเราไปกับการตีความ "ที่สอง" บนวิกิพีเดียและลองคำนวณเราพบว่าเพื่อป้องกันการตั้งค่าสำหรับการสลับเราต้องการE [ B | A = a ] = a = 2 a p + aE[B|A=a]ที่P=PR(<B|=) การหาค่าpหมายความว่าเราได้p=1E[B|A=a]=a=2aพี+a2(1-พี)p=Pr(A<B|A=a)พี . ในทำนองเดียวกันเราสามารถคำนวณE[A| B=b]=b=2bq+bพี=13โดยที่q=Pr(B<A|B=b)และรับq=1E[A|B=]==2Q+2(1-Q)Q=PR(B<A|B=) .... Bizzare! Q=13
ความน่าจะเป็นทาง

6
ฉันได้รับการนำเสนอเกี่ยวกับเรื่องที่ขัดแย้งกันซึ่งเกมนี้เล่นกับผู้ชมจริง ๆ ด้วยเงินจำนวนจริง มันได้รับความสนใจ ...
whuber

คิดว่าฉันแก้ไขอันนี้ ... ความขัดแย้งได้รับการแก้ไขเมื่อเรารับรู้ว่าซองจดหมายขัดแย้งกันสองข้อเสนอที่ไม่ถูกต้อง 1) มีสามปริมาณที่เป็นไปได้: 0.5x, x, และ 2x เมื่อมีเพียงสองปริมาณในซองจดหมาย (พูด x และ 2x) และ 2) ที่เรารู้ว่าซองจดหมายด้านซ้ายมี x (ในกรณีนี้ซองจดหมายด้านขวาจะมี 2x ที่มีความมั่นใจ 100%!) เมื่อพิจารณาถึงค่าที่เป็นไปได้ของ x และ 2x ที่กำหนดให้กับซองจดหมายสองซองคำตอบที่ถูกต้องคือค่าที่คาดหวังที่ 1.5x ไม่ว่าฉันจะเลือกซองจดหมายด้านซ้ายหรือซองจดหมายด้านขวา
RobertF

3
@RobertF สถานการณ์มีความซับซ้อนมากขึ้น สมมติว่าเป็นที่รู้จักกันว่าเงินที่มีการกระจายในสองซองดังต่อไปนี้ โยนเหรียญที่ยุติธรรมจนกว่ามันจะตกลงมาและนับจำนวนครั้งที่เหรียญถูกโยน วาง 2 ^ n ดอลลาร์ลงในซองหนึ่งและอีก 2 ^ (n + 1) ในซองอื่น ตอนนี้คุณสามารถทำการคำนวณความคาดหวังที่แน่นอนมากและยังคงรักษาความขัดแย้ง
มัน Weiss Weiss

31

นอนปัญหาความงาม

นี่คือการประดิษฐ์ล่าสุด มันถูกอภิปรายอย่างหนักในวารสารปรัชญาชุดเล็กในช่วงทศวรรษที่ผ่านมา มีผู้สนับสนุนอย่างแข็งขันสำหรับคำตอบที่ต่างกันสองคำตอบ ("Halfers" และ "Thirders") มันก่อให้เกิดคำถามเกี่ยวกับธรรมชาติของความเชื่อความน่าจะเป็นและการปรับสภาพและทำให้ผู้คนต้องตีความควอนตัมเชิงกล "หลายโลก" (ในบรรดาสิ่งที่แปลกประหลาดอื่น ๆ )

นี่คือข้อความจาก Wikipedia:

อาสาสมัคร Sleeping Beauty จะได้รับการทดสอบต่อไปนี้และจะแจ้งรายละเอียดทั้งหมดต่อไปนี้ ในวันอาทิตย์เธอนอนหลับ จากนั้นเหรียญที่เป็นธรรมจะถูกโยนเพื่อกำหนดขั้นตอนการทดลองที่จะดำเนินการ หากเหรียญปรากฏขึ้นหัวความงามจะถูกปลุกขึ้นมาและสัมภาษณ์ในวันจันทร์จากนั้นการทดสอบจะสิ้นสุดลง หากเหรียญขึ้นมาเธอจะถูกปลุกให้ตื่นและสัมภาษณ์ในวันจันทร์และวันอังคาร แต่เมื่อเธอถูกสั่งให้นอนหลับอีกครั้งในวันจันทร์เธอจะได้รับยาความจำเสื่อมที่ทำให้เธอไม่สามารถจำการตื่นนอนก่อนหน้านี้ได้ ในกรณีนี้การทดสอบจะสิ้นสุดลงหลังจากเธอถูกสัมภาษณ์ในวันอังคาร

เมื่อใดก็ตามที่ความงามของเจ้าหญิงนิทราถูกปลุกขึ้นมาและสัมภาษณ์เธอถูกถามว่า "ตอนนี้ความน่าเชื่อถือของคุณคืออะไรสำหรับข้อเสนอที่เหรียญลงไปที่หัว"

ตำแหน่งของ Thirder คือ SB ควรตอบสนอง "1/3" (นี่เป็นการคำนวณทฤษฎีบทของ Bayes อย่างง่าย) และตำแหน่ง Halfer ก็คือเธอควรจะพูดว่า "1/2" (เพราะนั่นเป็นความน่าจะเป็นที่ถูกต้องสำหรับเหรียญยุติธรรม! ) IMHO การอภิปรายทั้งหมดขึ้นอยู่กับความเข้าใจในความน่าจะเป็นที่ จำกัด แต่นั่นไม่ใช่ประเด็นทั้งหมดในการสำรวจความขัดแย้งที่ชัดเจน?

เจ้าชาย Florimond ค้นหาเจ้าหญิงนิทรา

(ภาพประกอบจากProject Gutenberg )


แม้ว่านี่ไม่ใช่สถานที่ที่จะพยายามแก้ไขความขัดแย้ง - เพียงเพื่อระบุพวกเขา - ฉันไม่ต้องการปล่อยให้ผู้คนแขวนอยู่และฉันแน่ใจว่าผู้อ่านส่วนใหญ่ของหน้านี้ไม่ต้องการลุยคำอธิบายทางปรัชญา เราสามารถใช้เคล็ดลับจากET Jaynesผู้แทนที่คำถาม“ เราจะสร้างแบบจำลองทางคณิตศาสตร์ของสามัญสำนึกของมนุษย์ได้อย่างไร” ซึ่งเป็นสิ่งที่เราต้องการเพื่อคิดผ่านปัญหาเจ้าหญิงนิทรา - โดย“ เราจะสร้างเครื่องจักรได้อย่างไร ซึ่งจะนำไปสู่การใช้เหตุผลที่น่าเชื่อถือได้ตามหลักการที่กำหนดไว้อย่างชัดเจนซึ่งแสดงถึงสามัญสำนึกในอุดมคติ?” ดังนั้นหากคุณต้องการแทนที่หุ่นยนต์คิดของเจย์เนส SB คุณสามารถโคลนหุ่นยนต์นี้ (แทนที่จะจัดการกับยาลบความทรงจำเพ้อฝัน) สำหรับการทดลองในวันอังคารดังนั้นจึงสร้างรูปแบบที่ชัดเจนของการตั้งค่า SB ที่สามารถวิเคราะห์ได้อย่างไม่น่าสงสัย การสร้างแบบจำลองนี้ในแบบมาตรฐานโดยใช้ทฤษฎีการตัดสินใจเชิงสถิติแล้วเปิดเผยว่ามีคำถามสองข้อที่ถูกถามจริงๆที่นี่ ( โอกาสที่ที่ดินหัวเหรียญยุติธรรมจะเป็นอย่างไรและโอกาสใดที่เหรียญมีหัวลงดิน โคลนใครถูกปลุกให้ตื่น? ) คำตอบคือ 1/2 (ในกรณีแรก) หรือ 1/3 (ในกรณีที่สองโดยใช้ทฤษฎีบทของเบย์) ไม่มีหลักการทางกลศาสตร์ควอนตัมเกี่ยวข้องในการแก้ปัญหานี้ :-)


อ้างอิง

Arntzenius, Frank (2002) ภาพสะท้อนของเจ้าหญิงนิทรา การวิเคราะห์ 62.1 หน้า 53-62 Elga, Adam (2000) ความเชื่อที่ตั้งตัวเองและปัญหาความงามนอนหลับ การวิเคราะห์ 60 pp 143-7

Franceschi, Paul (2005) เจ้าหญิงนิทราและปัญหาที่เกิดจากการลดโลก preprint

Groisman, Berry (2007) ในตอนท้ายของการนอนหลับฝันร้ายของความงาม

Lewis, D (2001) Sleeping Beauty: การตอบกลับ Elga การวิเคราะห์ 61.3 pp 171-6

Papineau, DavidและVictor Dura-Vila (2008) thirder และ Everettian: ตอบกลับของลูอิส 'ควอนตัม Sleeping Beauty'

Pust, Joel (2008) Horgan ในเจ้าหญิงนิทรา ซินธิส 160 หน้า 97-101

Vineberg, Susan (ไม่ได้ระบุไว้, อาจจะเป็นปี 2003) ความงามของเตือนเรื่อง

สามารถพบได้ทั้งหมด (หรืออย่างน้อยก็พบเมื่อหลายปีก่อน) บนเว็บ


1
คุณคิดว่ามันมีประสิทธิภาพเท่าเทียมกันในการกำหนดโซลูชันในแง่ของ "หน่วยพื้นฐาน" หรือไม่? โดยที่ฉันหมายถึงคุณต้องพิจารณาว่าหน่วยฐานเป็นบุคคลหรือการสัมภาษณ์ 1/2 ของบุคคลจะมีหัว แต่ 1/3 ของการสัมภาษณ์จะ จากนั้นเพื่อเลือกหน่วยฐานของเราเราสามารถทบทวนคำถามและวลีเป็น "โอกาสสัมภาษณ์ที่เกี่ยวข้องกับผลลัพธ์ 'หัว' คืออะไร?
Jonathan

1
SB ไม่ทราบว่าหลายสัมภาษณ์มีได้รับและเป็นคำถามที่เกี่ยวกับเธอประเมินความน่าจะเป็นที่ไม่ประเมินขัดเคือง จากมุมมองของเธอไม่สามารถกำหนดจำนวนการสัมภาษณ์ได้
whuber

2
ฉันคิดว่าคุณควรอ่านข้อโต้แย้งในวรรณกรรมก่อนแอรอน (ฉันยอมรับว่าฉันเป็น Thirder แต่ฉันคิดว่าครึ่งหนึ่งไม่พบเหตุผลที่น่าเชื่อถือของคุณอย่างน้อยที่สุดคุณต้องแสดงให้พวกเขาเห็นว่าทำไมข้อโต้แย้งของพวกเขาจึงมีข้อบกพร่อง)
whuber

1
จุดยุติธรรม @whuber ตอนนี้ฉันได้ดูวรรณกรรมเพิ่มเติม ฉันอ่านเอลลิสงามนอน: ตอบกลับ Elga มันเป็นประโยคที่ทำให้ฉันกังวลตอนเริ่มหัวข้อ '4 ข้อโต้แย้งของฉัน "มีเพียงหลักฐานใหม่ที่เกี่ยวข้องไม่ว่าจะอยู่กึ่งกลางหรือไม่รวมศูนย์เท่านั้นที่ทำให้เกิดการเปลี่ยนแปลงในความเชื่อถือ" ฉันจะคิดเพิ่มเติมและอาจบล็อกเกี่ยวกับเรื่องนี้อีกครั้ง ฉันได้พูดคุยกับนักศึกษาปริญญาเอกอีกเจ็ดคนเกี่ยวกับเรื่องนี้!
Aaron McDaid

1
เจ้าหญิงนิทราได้รับอนุญาตให้ดูปฏิทินเมื่อตื่นขึ้นหรือไม่? ถ้าวันจันทร์เธอควรตอบ P (X = head) = 0.5 ถ้าวันอังคารแล้ว P (X = head) = 0
RobertF

25

ขัดแย้ง St.Petersburgซึ่งทำให้คุณคิดว่าแตกต่างกันในแนวคิดและความหมายของค่าที่คาดหวัง สัญชาตญาณ (ส่วนใหญ่สำหรับผู้ที่มีพื้นฐานด้านสถิติ) และการคำนวณนั้นให้ผลลัพธ์ที่แตกต่างกัน


5
X1,X2,nX¯nN(0,1)Var(nX¯n)17

@cardinal โอกาสใดที่คุณสามารถโพสต์รายละเอียดบางอย่างไว้เป็นคำตอบแยกต่างหาก
Silverfish

Xif(n)fVar(nX¯n)

Xif(i)XiVar(nX¯n)=1ni=1nf(i)f(i)Var(nX¯n)

22

ขัดแย้งฟรีย์-ลินด์ซึ่งแสดงให้เห็นว่าภายใต้สถานการณ์บางอย่างเริ่มต้นวิธี frequentist คชกรรมและการทดสอบสมมติฐานสามารถให้คำตอบที่ขัดแย้งกันอย่างสิ้นเชิง มันบังคับให้ผู้ใช้คิดอย่างถ่องแท้ถึงความหมายของการทดสอบรูปแบบเหล่านี้และพิจารณาว่าเป็นสิ่งที่ต้องการหรือไม่ สำหรับตัวอย่างล่าสุดดูการสนทนานี้


20

มีการเข้าใจผิดสองสาวที่มีชื่อเสียง:

ในครอบครัวที่มีลูกสองคนโอกาสที่จะเกิดอะไรขึ้นถ้าเด็กคนใดคนหนึ่งเป็นผู้หญิงเด็กทั้งสองเป็นผู้หญิง?

คนส่วนใหญ่สังหรณ์ใจพูดแต่คำตอบคือ1/2 1/3ปัญหาพื้นฐานคือการเลือก"ผู้หญิงคนหนึ่งจากผู้หญิงทุกคนที่มีพี่น้อง"โดยการสุ่มนั้นไม่เหมือนกับการเลือก"ครอบครัวเดียวกันจากทุกครอบครัวที่มีลูกสองคนและเด็กผู้หญิงอย่างน้อยหนึ่งคน"


อันนี้ง่ายพอที่จะสอดคล้องกับสัญชาตญาณเมื่อคุณเข้าใจ แต่มีรุ่นที่ซับซ้อนมากขึ้นที่ยากต่อการเข้าใจ:

ในครอบครัวที่มีลูกสองคนโอกาสที่จะเกิดอะไรขึ้นถ้าเด็กคนหนึ่งเป็นเด็กชายที่เกิดในวันอังคารที่เด็กทั้งสองเป็นเด็กชาย? (คำตอบ: 13/27)

ในครอบครัวที่มีลูกสองคนโอกาสที่จะเกิดอะไรขึ้นถ้าเด็กคนหนึ่งเป็นผู้หญิงชื่อฟลอริด้าว่าเด็กทั้งสองเป็นผู้หญิง (คำตอบ: ใกล้มากถึง 1/2 โดยสมมติว่า "Florida" เป็นชื่อที่หายากมาก)


ข้อมูลเพิ่มเติมเกี่ยวกับปริศนาเหล่านี้สามารถพบได้ในคำตอบนี้นี้
(เช่น: ข้อมูลเพิ่มเติมเกี่ยวกับเด็กผู้ชายที่เกิดในวันอังคาร , ข้อมูลเพิ่มเติมเกี่ยวกับหญิงสาวที่ชื่อฟลอริดา )


3
คำตอบคือ1/3ไม่2/3แน่นอน? เพียงหนึ่งเดียวจากGB, BG, GG
Martin Smith

3
บทความ "เด็กชายที่เกิดในวันอังคาร" เป็นสิ่งที่ดี ประเด็นหลักซึ่งชัดเจนมาก ("ปัญหาอยู่ภายใต้การกำหนด") คือคำตอบนั้นขึ้นอยู่กับแบบจำลองความน่าจะเป็นที่ใช้ การพูดว่า "คำตอบ" คือ 13/27 นั้นทำให้เข้าใจผิด (ดีที่สุด)
whuber

@ มาร์ติน: ฮิฮิโอ้โห :)
BlueRaja - Danny Pflughoeft

2
เหตุผลที่ปัญหาเหล่านี้ทำให้เกิดความสับสนก็คือคำถามนี้เป็นคำที่ทำให้ยากต่อการตรวจสอบว่าพื้นที่สมมติฐานคืออะไร สิ่งนี้จะทำให้เกิดความสับสนว่าคดี "มีแนวโน้มเท่ากัน" นั้นคืออะไร (และด้วยเหตุนี้สิ่งที่ควรนับ)
ความน่าจะเป็นทาง

1
p(B1G2)=p(G1B2)p(G1G2)2p(B1G2)+p(G1G2)

12

ขออภัย แต่ฉันไม่สามารถช่วยตัวเองได้ (เช่นกันฉันชอบความขัดแย้งทางสถิติ!)

อีกครั้งอาจไม่ใช่ความขัดแย้งต่อ seและอีกตัวอย่างหนึ่งของตัวแปรที่ถูกละเว้น

สาเหตุที่แท้จริง / การถดถอย
ตัวแปรใด ๆ ที่มีแนวโน้มเวลาจะสัมพันธ์กับตัวแปรอื่นที่มีแนวโน้มเวลาเช่นกัน ตัวอย่างเช่นน้ำหนักของฉันตั้งแต่แรกเกิดถึงอายุ 27 จะมีความสัมพันธ์อย่างมากกับน้ำหนักของคุณตั้งแต่แรกเกิดถึงอายุ 27 เห็นได้ชัดว่าน้ำหนักของฉันไม่ได้เกิดจากน้ำหนักของคุณ ถ้าเป็นเช่นนั้นฉันจะขอให้คุณไปที่โรงยิมบ่อยขึ้นโปรด

xtyt

xt=α0+α1t+ϵt andyt=β0+β1t+ηt.

yt=γ0+γ1xt+νt
xtγ1

เมื่อคุณทำการวิเคราะห์อนุกรมเวลาคุณต้องแน่ใจว่าตัวแปรของคุณอยู่กับที่หรือคุณจะได้ผลลัพธ์ที่เป็นไปได้

(ฉันยอมรับอย่างเต็มที่ว่าฉันขโมยความคิดคำตอบของฉันเองที่นี่ )


11

หนึ่งในรายการโปรดของฉันคือปัญหา Monty Hall ฉันจำได้ว่าเรียนรู้เกี่ยวกับมันในชั้นเรียนสถิติระดับประถมบอกพ่อของฉันเพราะเราทั้งคู่ต่างก็ไม่เชื่อฉันจำลองเลขสุ่มแล้วเราก็พยายามแก้ปัญหา เพื่อความประหลาดใจของเรามันเป็นเรื่องจริง

โดยทั่วไปปัญหาระบุว่าถ้าคุณมีสามประตูในรายการเกมหลังซึ่งหนึ่งเป็นรางวัลและอีกสองไม่มีอะไรถ้าคุณเลือกประตูแล้วก็บอกว่าอีกสองประตูที่เหลือหนึ่งในสองไม่ใช่ประตูรางวัล และอนุญาตให้สลับการเลือกของคุณหากคุณเลือกคุณควรสลับประตูปัจจุบันไปที่ประตูที่เหลือ

นี่คือลิงค์ไปสู่การจำลอง R เช่นกัน: LINK


7

Parrondo's Paradox:

จากwikipdedia : "Parrondo's paradox, Paradox ในทฤษฎีเกมได้รับการอธิบายว่า: การรวมกันของการสูญเสียกลยุทธ์กลายเป็นกลยุทธ์ที่ชนะมันได้รับการตั้งชื่อตามผู้สร้าง Juan Parrondo ผู้ค้นพบความขัดแย้งในปี 1996 คำอธิบายเพิ่มเติมคือ :

มีคู่ของเกมแต่ละเกมที่มีความเป็นไปได้สูงที่จะแพ้มากกว่าชนะซึ่งเป็นไปได้ที่จะสร้างกลยุทธ์ที่ชนะโดยการเล่นเกมสลับกัน

Parrondo คิดค้นความขัดแย้งที่เกี่ยวข้องกับการวิเคราะห์วงล้อสีน้ำตาลของเขาซึ่งเป็นการทดลองทางความคิดเกี่ยวกับเครื่องจักรที่สามารถดึงพลังงานจากการเคลื่อนที่ด้วยความร้อนแบบสุ่มซึ่งได้รับความนิยมโดย Richard Feynman นักฟิสิกส์ อย่างไรก็ตามความขัดแย้งจะหายไปเมื่อวิเคราะห์อย่างจริงจัง "

PB(W)=3/4+ϵPA(W)=1/10+ϵ

นอกจากนี้ยังมีความขัดแย้งที่เกี่ยวข้องเมื่อเร็ว ๆ นี้ที่เรียกว่า "อัลลิสันมิกซ์ " ซึ่งแสดงให้เห็นว่าเราสามารถใช้ IID สองชุดและชุดที่ไม่มีความสัมพันธ์กันและแย่งพวกมันแบบสุ่มเพื่อให้ชุดผสมบางชุด


6

เป็นที่น่าสนใจว่าปัญหาเด็กสองคนและปัญหามอนตี้ฮอลล์มักถูกกล่าวถึงกันในบริบทของความขัดแย้ง ทั้งคู่แสดงให้เห็นถึงความขัดแย้งชัดเจนชัดเจนครั้งแรกในปี 2432 เรียกว่าเบอร์ทรานด์บ็อกซ์เป็นเส้นขนานซึ่งสามารถเป็นตัวแทนของทั้งคู่ ฉันคิดว่ามันเป็น "ความขัดแย้ง" ที่น่าสนใจที่สุดเพราะคนที่มีการศึกษาและชาญฉลาดมากคนเดียวกันตอบคำถามทั้งสองนี้ในทางตรงกันข้ามด้วยความเคารพต่อความขัดแย้งนี้ นอกจากนี้ยังเปรียบเทียบกับหลักการที่ใช้ในเกมไพ่เช่นบริดจ์หรือที่รู้จักในชื่อหลักการของตัวเลือกที่ จำกัด ซึ่งจะมีการทดสอบความละเอียดตามเวลา

สมมติว่าคุณมีรายการที่เลือกแบบสุ่มซึ่งฉันจะเรียกว่า "กล่อง" ทุกกล่องที่เป็นไปได้มีคุณสมบัติสมมาตรอย่างน้อยหนึ่งในสอง แต่บางกล่องมีทั้งสองอย่าง ฉันจะเรียกคุณสมบัติ "ทอง" และ "เงิน" ความน่าจะเป็นที่กล่องเป็นเพียงแค่ทองก็คือ P และเนื่องจากคุณสมบัติมีความสมมาตร P จึงเป็นความน่าจะเป็นที่กล่องเป็นเพียงเงิน นั่นทำให้ความน่าจะเป็นที่กล่องหนึ่งอันมีคุณสมบัติเพียง 2P และความน่าจะเป็นที่มีทั้ง 1-2P

หากคุณได้รับการบอกว่ากล่องเป็นทองคำ แต่ไม่ว่าจะเป็นเงินคุณอาจถูกล่อลวงให้บอกว่าโอกาสที่มันจะเป็นเพียงแค่ทองคือ P / (P + (1-2P)) = P / (1-P) แต่คุณจะต้องระบุความน่าจะเป็นแบบเดียวกันสำหรับกล่องสีเดียวถ้าคุณบอกว่ามันเป็นเงิน และถ้าความน่าจะเป็นนี้คือ P / (1-P) เมื่อใดก็ตามที่คุณบอกแค่สีเดียวมันจะต้องเป็น P / (1-P) แม้ว่าคุณจะไม่ได้บอกสี แต่เรารู้ว่ามันเป็น 2P จากย่อหน้าสุดท้าย

ความขัดแย้งที่เห็นได้ชัดนี้ได้รับการแก้ไขโดยการสังเกตว่าถ้ากล่องมีเพียงสีเดียวก็ไม่มีความเคลือบแคลงเกี่ยวกับสีที่คุณจะบอก แต่ถ้ามันมีสองตัว คุณต้องรู้ว่าตัวเลือกนั้นถูกสร้างขึ้นเพื่อตอบคำถามและนั่นคือรากของความขัดแย้งที่ชัดเจน หากคุณไม่ได้รับแจ้งคุณสามารถสันนิษฐานได้ว่ามีเพียงสีที่ถูกสุ่มเลือกเท่านั้นทำให้คำตอบ P / (P + (1-2P) / 2) = 2P หากคุณยืนยันว่า P / (1-P) เป็นคำตอบคุณถือว่าโดยปริยายว่าไม่มีความเป็นไปได้ที่จะมีการพูดถึงสีอื่นเว้นแต่ว่าเป็นสีเดียวเท่านั้น

ในปัญหามอนตี้ฮอลล์การเปรียบเทียบสีนั้นไม่ง่ายนัก แต่เป็น P = 1/3 คำตอบที่อิงกับสองประตูที่ยังไม่ได้เปิด แต่แรกเริ่มมีโอกาสเท่าเทียมกันที่จะได้รับรางวัลสมมติว่า Monty Hall จำเป็นต้องเปิดประตูที่เขาทำแม้ว่าเขาจะมีทางเลือกก็ตาม คำตอบนั้นคือ P / (1-P) = 1/2 คำตอบที่อนุญาตให้เขาเลือกแบบสุ่มคือ 2P = 2/3 สำหรับความน่าจะเป็นที่การสลับจะชนะ

ในปัญหาลูกสองสีในการเปรียบเทียบของฉันค่อนข้างเปรียบเทียบกับเพศ มีสี่ราย P = 1/4 ในการตอบคำถามเราจำเป็นต้องรู้ว่ามันถูกกำหนดแล้วว่ามีผู้หญิงในครอบครัว หากเป็นไปได้ที่จะเรียนรู้เกี่ยวกับเด็กผู้ชายในครอบครัวด้วยวิธีการนั้นคำตอบคือ 2P = 1/2 ไม่ใช่ P / (1-P) = 1/3 มันซับซ้อนกว่านี้เล็กน้อยถ้าคุณพิจารณาชื่อฟลอริดาหรือ "เกิดวันอังคาร" แต่ผลลัพธ์ก็เหมือนกัน คำตอบคือ 1/2 ถ้ามีตัวเลือกและข้อความส่วนใหญ่ของปัญหาบ่งบอกถึงตัวเลือกดังกล่าว และเหตุผลที่ "เปลี่ยน" จาก 1/3 เป็น 13/27 หรือจาก 1/3 เป็น "เกือบ 1/2" ดูเหมือนว่าขัดแย้งและไม่ได้ใช้งานง่ายเพราะข้อสันนิษฐานที่ไม่มีทางเลือกนั้นไม่ได้ใช้งานง่าย

ในหลักการของการ จำกัด การเลือกสมมติว่าคุณขาดไพ่ชุดเดียวกัน - เช่น Jack, Queen และ King ในชุดเดียวกัน โอกาสเริ่มต้นแม้กระทั่งการ์ดใด ๆ ที่เป็นของคู่ต่อสู้ที่เฉพาะเจาะจง แต่หลังจากที่ฝ่ายตรงข้ามเล่นหนึ่งโอกาสของเขาที่จะมีคนอื่น ๆ จะลดลงเพราะเขาสามารถเล่นไพ่ใบนั้นถ้าเขามี


PG=PSP22P(1P)212PPG=PS=.8PGS=1.6PGS=.6P=.5

ขออภัยฉันไม่ได้อธิบายว่าพยายามสรุปให้ดีที่สุด My P ไม่ใช่ความน่าจะเป็นที่กล่องมีสีทองมันเป็นความน่าจะเป็นที่เป็นเพียงทอง ความน่าจะเป็นที่มีสีทองคือ 1-P และในขณะที่คุณสมบัติสองอย่างนั้นเป็นแบบสมมาตรพวกมันไม่จำเป็นต้องเป็นอิสระดังนั้นคุณไม่สามารถคูณความน่าจะเป็นได้ นอกจากนี้ยังไม่มีกล่อง "ไม่ได้" เบอร์ทรานด์ใช้กล่องสามกล่องกับเหรียญสองเหรียญในแต่ละทองและทองคำและเงินและเงิน กล่องที่มีเหรียญทองจำนวนหนึ่งคือ "ทอง" ในการวางนัยทั่วไปของฉัน
JeffJo

+1 นั่นช่วยได้ ตอนนี้ฉันเห็นวลี "อย่างน้อยหนึ่งในสอง" และคำว่า "เพียงแค่" ซึ่งฉันต้องอ่านอย่างช้าๆ
gung


2

ฉันพบภาพกราฟิกที่เรียบง่ายของการเข้าใจผิดทางนิเวศวิทยา (ที่นี่รัฐที่ร่ำรวย / รัฐที่ยากจนผู้ลงคะแนนขัดแย้ง) ช่วยให้ฉันเข้าใจในระดับที่เข้าใจง่ายว่าทำไมเราถึงเห็นรูปแบบการกลับรายการเมื่อเรารวมประชากรของรัฐ:

ป้อนคำอธิบายรูปภาพที่นี่


3
นี่เป็นตัวอย่างที่ดี แต่ฉันคิดว่านี่เป็นความขัดแย้งของ Simpson: en.wikipedia.org/wiki/Simpson%27s_paradox 27sm
Nick

1
@ นิค: ตัวอย่างที่เฉพาะเจาะจงนี้แตกต่างจาก Paradox ของซิมป์สัน แต่ก็ยากที่จะรู้ว่าการเข้าใจผิด / ความขัดแย้งที่นำไปใช้ในสถานการณ์เฉพาะเพราะพวกเขาดูสถิติเดียวกัน ความแตกต่างคือ SP เป็น "ผลกระทบที่ผิดพลาด" ซึ่งจะปรากฏเฉพาะเมื่อวิเคราะห์กลุ่มย่อย แนวโน้มนี้แสดงให้เห็นว่าเป็น "ผลจริง" ที่ปรากฏเฉพาะเมื่อวิเคราะห์กลุ่มย่อย ในกรณีนี้มันแสดงให้เห็นว่าแม้ว่ารายได้ในฐานะตัวเลขดิบจะไม่ส่งผลกระทบต่อรูปแบบการลงคะแนนโดยรวม แต่รายได้ที่เกี่ยวข้องกับประเทศเพื่อนบ้านของคุณ (รัฐของคุณ) จะมีผลต่อรูปแบบการลงคะแนน
Jonathan

มันเป็นความเข้าใจผิดทางนิเวศวิทยาที่อธิบายด้านล่าง
Charlie

3
@Charlie 'เบื้องล่าง' และ 'ด้านบน' เป็นฟังก์ชั่นไม่ว่าผู้อ่านของหน้าใดจะเรียงลำดับ (ใช้งาน / เก่าที่สุด / โหวต) และในกรณีใด ๆ คำสั่งภายใต้เกณฑ์การเรียงลำดับบางอย่างสามารถเปลี่ยนแปลงได้ตลอดเวลา . ดังนั้นควรพูดถึงบุคคลที่โพสต์การสนทนาที่คุณอ้างถึงหรือแม้กระทั่งลิงก์ไปยังมัน
Glen_b

2

สมมติว่าคุณได้รับข้อมูลเกี่ยวกับการเกิดในราชวงศ์ของบางราชอาณาจักร ในแผนภูมิต้นไม้แต่ละการเกิดถูกบันทึกไว้ สิ่งที่แปลกประหลาดเกี่ยวกับครอบครัวนี้ก็คือพ่อแม่พยายามที่จะมีลูกเท่านั้นเมื่อเร็ว ๆ นี้เด็กชายคนแรกเกิดและไม่มีลูกอีกแล้ว

ดังนั้นข้อมูลของคุณอาจมีลักษณะคล้ายกับสิ่งนี้:

G G B
B
G G B
G B
G G G G G G G G G B
etc.

สัดส่วนของเด็กชายและเด็กหญิงในตัวอย่างนี้จะสะท้อนถึงความน่าจะเป็นโดยทั่วไปของการให้กำเนิดเด็กผู้ชาย (พูด 0.5) คำตอบและคำอธิบายสามารถพบได้ในหัวข้อนี้


2
คำตอบนี้อ่านได้เหมือนตัวต่อปริศนาไม่เหมือนเส้นขนาน ฉันสามารถจินตนาการได้ว่าทำไมคุณต้องการโพสต์แบบนี้ แต่ฉันคิดว่าคำตอบนี้มีคุณสมบัติเป็นบุคคลที่ผิดธรรมดาและเพื่อให้พอดีกับหัวข้อนี้คุณจะต้องชัดเจนมากขึ้น
อะมีบา

2
คำถามนี้ (กับเด็กผู้ชายและเด็กผู้หญิง interchanged) ถูกถามที่stats.stackexchange.com/questions/93830ซึ่งได้รับคำตอบจำนวนมาก - ไม่ใช่ทั้งหมดในข้อตกลง! (ฉันได้เรียนรู้บางสิ่งบางอย่างด้วยการแก้ปัญหาอย่างจริงจังและคิดในแง่ที่เป็นจริงมากขึ้นสำรวจสมมติฐานที่จำเป็นต้องทำ)
whuber

@whuber ขอบคุณสำหรับลิงค์! ฉันเพิ่มมันเข้าไปในคำอธิบาย
ทิม

2

นี่คือ Paradox ของ Simpson อีกครั้ง แต่ 'ถอยหลัง' และข้างหน้ามาจากหนังสือเล่มใหม่ของ Judea Pearl เกี่ยวกับการอนุมานสาเหตุในสถิติ: ไพรเมอร์ [^ 1]

Paradox คลาสสิกของซิมป์สันทำงานดังนี้ลองพิจารณาเลือกหมอสองคน คุณเลือกโดยอัตโนมัติด้วยผลลัพธ์ที่ดีที่สุด แต่สมมติว่าผลลัพธ์ที่ดีที่สุดเลือกกรณีที่ง่ายที่สุด บันทึกที่ไม่ดีของอีกฝ่ายเป็นผลมาจากการทำงานที่ยุ่งยากมากขึ้น

ตอนนี้คุณเลือกใคร ดีกว่าที่จะดูผลลัพธ์ที่แบ่งชั้นด้วยความยากลำบากและจากนั้นตัดสินใจ

มีอีกด้านหนึ่งของเหรียญ (อีกอันที่ขัดแย้งกัน) ซึ่งบอกว่าผลลัพธ์ของการแบ่งชั้นยังสามารถนำคุณไปสู่การเลือกที่ผิด

คราวนี้พิจารณาเลือกที่จะใช้ยาหรือไม่ ยาเสพติดมีผลข้างเคียงที่เป็นพิษ แต่กลไกการรักษาของการกระทำคือการลดความดันโลหิต โดยรวมแล้วยาจะช่วยเพิ่มผลลัพธ์ในประชากร แต่เมื่อแบ่งชั้นความดันโลหิตหลังการรักษาผลลัพธ์จะแย่ลงทั้งในกลุ่มที่มีความดันต่ำและกลุ่มที่มีความดันโลหิตสูง สิ่งนี้จะเป็นจริงได้อย่างไร เพราะเรามีการแบ่งชั้นผลลัพธ์โดยไม่ได้ตั้งใจและในแต่ละผลลัพธ์สิ่งที่เหลืออยู่ที่ต้องสังเกตคือผลข้างเคียงที่เป็นพิษ

เพื่ออธิบายให้ชัดเจนลองนึกภาพยานี้ออกแบบมาเพื่อแก้ไขหัวใจที่แตกสลายและทำได้โดยลดความดันโลหิตและแทนที่จะแบ่งชั้นความดันโลหิตที่เราแบ่งชั้นบนหัวใจคงที่ เมื่อยาทำงาน, หัวใจได้รับการแก้ไข (และความดันโลหิตจะลดลง), แต่ผู้ป่วยบางรายจะได้รับผลข้างเคียงที่เป็นพิษ. เนื่องจากการทำงานของยากลุ่ม 'หัวใจคงที่' จะมีผู้ป่วยจำนวนมากที่ได้ทานยามากกว่าที่จะมีผู้ป่วยทานยาในกลุ่มหัวใจที่แตกหัก ผู้ป่วยที่รับประทานยามากขึ้นหมายถึงผู้ป่วยที่ได้รับผลข้างเคียงมากขึ้นและเห็นได้ชัดว่า (แต่เท็จ) ผลลัพธ์ที่ดีกว่าสำหรับผู้ป่วยที่ไม่ได้ใช้ยา

ผู้ป่วยที่หายดีขึ้นโดยไม่ทานยาถือเป็นโชคดี ผู้ป่วยที่ใช้ยาและดีขึ้นเป็นส่วนผสมของผู้ที่ต้องการยาเพื่อให้ดีขึ้นและผู้ที่จะโชคดีอยู่แล้ว การตรวจผู้ป่วยด้วย 'หัวใจคงที่' หมายถึงไม่รวมผู้ป่วยที่จะได้รับการแก้ไขหากพวกเขาใช้ยา ไม่รวมผู้ป่วยดังกล่าวหมายถึงการยกเว้นอันตรายจากการไม่ใช้ยาซึ่งหมายความว่าเราเห็นอันตรายจากการใช้ยา

ความขัดแย้งของซิมป์สันเกิดขึ้นเมื่อมีสาเหตุของผลลัพธ์นอกเหนือจากการรักษาเช่นความจริงที่ว่าแพทย์ของคุณทำเฉพาะกรณีที่ยุ่งยาก การควบคุมสำหรับสาเหตุที่พบบ่อย (กรณีที่ยุ่งยากกับกรณีง่าย) ช่วยให้เราเห็นผลที่แท้จริง ในตัวอย่างหลังเราได้แบ่งชั้นโดยไม่ได้ตั้งใจในผลลัพธ์ที่ไม่ได้อยู่ในสาเหตุซึ่งหมายความว่าคำตอบที่แท้จริงอยู่ในการรวมไม่ใช่ข้อมูลที่แบ่งเป็นชั้น ๆ

[^ 1]: Pearl J. การอนุมานเชิงสาเหตุในสถิติ John Wiley & Sons; 2016


2

หนึ่งใน "รายการโปรดของฉัน" ซึ่งหมายความว่ามันเป็นสิ่งที่ไดรฟ์ผมบ้าเกี่ยวกับความหมายของการศึกษาจำนวนมาก (และมักจะโดยผู้เขียนเองไม่ได้เป็นเพียงสื่อ) เป็นที่ของตกทอดอคติ

วิธีหนึ่งที่จะคิดว่ามันจะคิดว่ามีผลกระทบบางอย่างที่เป็นมากเป็นอันตรายกับอาสาสมัครให้มากเพื่อที่จะมีโอกาสที่ดีมากของการฆ่าพวกเขา หากผู้เข้าร่วมการทดลองได้รับผลกระทบนี้ก่อนการศึกษาดังนั้นเมื่อถึงเวลาที่เริ่มการทดลองผู้เข้าร่วมที่ยังมีชีวิตอยู่จะมีโอกาสสูงมากที่จะมีความยืดหยุ่นผิดปกติ การคัดเลือกโดยธรรมชาติอย่างแท้จริงในที่ทำงาน เมื่อเกิดเหตุการณ์นี้การศึกษาจะสังเกตว่าวิชาสัมผัสมีสุขภาพดีผิดปกติ (เนื่องจากทุกคนที่ไม่แข็งแรงอยู่แล้วเสียชีวิตหรือทำให้แน่ใจว่าจะหยุดการสัมผัสกับผลที่ออกมา) สิ่งอำนวยมักจะตีความได้ว่าว่าการสัมผัสเป็นจริงที่ดีสำหรับวิชา นี่คือผลลัพธ์ของการละเว้นการตัดปลาย (เช่นเพิกเฉยต่ออาสาสมัครที่เสียชีวิตและไม่ได้ทำการศึกษา)

ในทำนองเดียวกันผู้ที่หยุดการสัมผัสกับผลกระทบในระหว่างการศึกษามักจะไม่แข็งแรงอย่างไม่น่าเชื่อ: นี่เป็นเพราะพวกเขาตระหนักว่าการเปิดรับอย่างต่อเนื่องอาจจะฆ่าพวกเขา แต่จากการศึกษาพบว่าผู้ที่ลาออกนั้นไม่แข็งแรงมาก!

@ คำตอบของ Charlie เกี่ยวกับเครื่องบินทิ้งระเบิดสงครามโลกครั้งที่สองนั้นสามารถเป็นตัวอย่างได้ แต่ก็มีตัวอย่างที่ทันสมัยมากมายเช่นกัน ตัวอย่างล่าสุดคือการศึกษารายงานว่าดื่มกาแฟวันละ 8+ แก้ว(!!) เชื่อมโยงกับสุขภาพหัวใจที่สูงขึ้นอย่างมากในอาสาสมัครที่มีอายุมากกว่า 55 ปี ผู้คนจำนวนมากที่มีปริญญาเอกตีความเช่นนี้ว่า "การดื่มกาแฟเป็นสิ่งที่ดีต่อหัวใจของคุณ!" รวมถึงผู้เขียนการศึกษาด้วย ฉันอ่านสิ่งนี้เพราะคุณต้องมีหัวใจที่แข็งแรงอย่างไม่น่าเชื่อที่จะยังคงดื่มกาแฟ 8 ถ้วยต่อวันหลังจากอายุ 55 ปีและไม่มีอาการหัวใจวาย แม้ว่ามันจะไม่ฆ่าคุณ แต่ก็มีบางสิ่งที่น่าเป็นห่วงเกี่ยวกับสุขภาพของคุณทุกคนที่รักคุณ (รวมถึงแพทย์ของคุณ) จะกระตุ้นให้คุณหยุดดื่มกาแฟทันที การศึกษาเพิ่มเติมพบว่าการดื่มกาแฟมากไม่มีผลประโยชน์ในกลุ่มวัยรุ่นซึ่งฉันเชื่อว่าเป็นหลักฐานเพิ่มเติมว่าเรากำลังเห็นผลการรอดชีวิตมากกว่าผลเชิงบวก กระนั้นก็มีการศึกษาระดับปริญญาเอกมากมายที่พูดว่า "


ฉันไม่แน่ใจในการตีความของคุณ ในนอร์เวย์การดื่มกาแฟวันละ 8 ถ้วยไม่ใช่เรื่องผิดปกติค่าเฉลี่ย (รวมถึงเด็กและผู้ไม่ดื่มอื่น ๆ ) อยู่ที่ประมาณสองแก้วต่อวัน ในฟินแลนด์ค่าเฉลี่ยอยู่ที่ประมาณ 2.5 ถ้วยต่อวัน ฉันเคยดื่มหมออีธานสิบถ้วยต่อวัน แต่ก็ไม่ได้อีกแล้ว
kjetil b halvorsen

1

ฉันประหลาดใจที่ยังไม่มีใครพูดถึงNewcombe's Paradoxถึงแม้ว่ามันจะถูกกล่าวถึงอย่างหนักในทฤษฎีการตัดสินใจ มันเป็นหนึ่งในรายการโปรดของฉันอย่างแน่นอน


-2

ให้ x, y และ z เป็นเวกเตอร์ที่ไม่เกี่ยวข้อง แต่ x / z และ y / z จะสัมพันธ์กัน


2
เหตุใดจึงเป็นสิ่งที่ผิดธรรมดา? ดูเหมือนว่าใช้งานง่าย
lcrmorin

2
ฉันประหลาดใจถ้านี่ไม่ใช่เรื่องปกติ
Glen_b

1
มันไม่ชัดเจนอะไร x/zx/zzX,Y,Z
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.