ความขัดแย้งทางสถิติที่น่าสนใจที่สุด

112

เนื่องจากฉันพบว่าพวกมันน่าหลงใหลฉันอยากจะได้ยินว่าคนในชุมชนนี้ค้นพบว่าอะไรคือความขัดแย้งทางสถิติที่น่าสนใจที่สุดและเพราะอะไร

paradox

— Nick
แหล่งที่มา

1

ตัวอย่างเล็ก ๆ น้อย ๆ โดยเฉพาะอย่างยิ่งในบริบทการสำรวจที่นี่: filipspagnoli.wordpress.com/category/statistics/…

— Charlie

100

มันไม่ได้เป็นความขัดแย้งต่อ seแต่มันก็เป็นความคิดเห็นงงอย่างน้อยในตอนแรก

ในช่วงสงครามโลกครั้งที่สองอับราฮัมวัลด์เป็นนักสถิติสำหรับรัฐบาลสหรัฐฯ เขามองไปที่เครื่องบินทิ้งระเบิดที่กลับมาจากภารกิจและวิเคราะห์รูปแบบของ "บาดแผล" กระสุนปืนบนเครื่องบิน เขาแนะนำว่ากองทัพเรือเสริมพื้นที่ที่เครื่องบินไม่มีความเสียหาย

ทำไม? เรามีเอฟเฟกต์การเลือกในที่ทำงาน ตัวอย่างนี้แสดงให้เห็นว่าความเสียหายที่เกิดขึ้นในพื้นที่ที่สังเกตสามารถทนได้ เครื่องบินทั้งสองไม่เคยถูกโจมตีในพื้นที่ที่ไม่มีการแตะต้องข้อเสนอที่ไม่น่าจะเกิดขึ้น เราสนใจเกี่ยวกับเครื่องบินที่ลงไปไม่ใช่แค่พวกที่กลับมา ผู้ที่ตกสู่บาปจะได้รับการโจมตีในสถานที่ซึ่งมิได้ถูกแตะต้องผู้ที่รอดชีวิต

สำหรับสำเนาของบันทึกเดิมของเขาให้ดูที่นี่ สำหรับการใช้งานที่ทันสมัยมากขึ้นเห็นนี้โพสต์บล็อกวิทยาศาสตร์อเมริกัน

ขยายเมื่อรูปแบบตามที่โพสต์บล็อกนี้ในระหว่างสงครามโลกครั้งที่แนะนำของหมวกกันน็อกดีบุกนำไปสู่การมากขึ้นบาดแผลที่ศีรษะกว่าหมวกผ้ามาตรฐาน หมวกกันน็อกใหม่นี้แย่กว่าสำหรับทหารหรือไม่? ไม่มี แม้ว่าการบาดเจ็บจะสูงขึ้น แต่การเสียชีวิตก็ลดลง

— Charlie
แหล่งที่มา

3

ฉันจำได้ว่าเคยอ่านเรื่องนี้มาก่อนสองสามครั้ง แต่ฉันไม่มีเอกสารอ้างอิง มีอย่างใดอย่างหนึ่งที่คุณสามารถเพิ่มได้?

— พระคาร์ดินัล

1

@ cardinal ฉันพบบันทึกช่วยจำบางอย่างสำหรับคุณ ดูเหมือนว่าการวิจัยเป็นจริงสำหรับสหรัฐอเมริกา

— ชาร์ลี

บางแห่งมีเครื่องบินกระจายของตัวอย่างสมมุติ แต่ฉันหามันไม่พบ

— Fomite

+1 นี่คือตัวอย่างของอคติผู้รอดชีวิตบางทีอาจเป็นอันตรายที่สุดของอคติ ฉันขยายมันในคำตอบ

— หน้าผา AB

47

อีกตัวอย่างหนึ่งคือการเข้าใจผิดในระบบนิเวศ

ตัวอย่าง
สมมติว่าเรามองหาความสัมพันธ์ระหว่างการลงคะแนนและรายได้โดยการลดส่วนแบ่งการลงคะแนนให้กับวุฒิสมาชิกโอบามาในรายได้เฉลี่ยของรัฐ (เป็นพัน) เราได้ค่าตัดประมาณ 20 และค่าสัมประสิทธิ์ความชันเท่ากับ 0.61

หลายคนจะตีความผลลัพธ์นี้ว่าผู้คนที่มีรายได้สูงมีแนวโน้มที่จะลงคะแนนให้พรรคเดโมแครตมากกว่า แท้จริงแล้วหนังสือกดที่เป็นที่นิยมได้ทำให้การโต้แย้งนี้

แต่เดี๋ยวก่อนฉันคิดว่าคนรวยมีแนวโน้มที่จะเป็นรีพับลิกันมากกว่า? พวกเขาคือ.

สิ่งที่ถดถอยนี้เป็นจริงที่บอกเราเป็นที่อุดมไปด้วยรัฐมีแนวโน้มที่จะลงคะแนนให้พรรคประชาธิปัตย์และคนจนรัฐมีแนวโน้มที่จะลงคะแนนเสียงให้พรรครีพับลิ ภายในรัฐที่กำหนดคนรวยมีแนวโน้มที่จะลงคะแนนให้พรรครีพับลิกันและคนจนมีแนวโน้มที่จะลงคะแนนให้พรรคประชาธิปัตย์มากขึ้น ดูการทำงานของแอนดรูว์เกลแมนและ coauthors

หากไม่มีข้อสมมติฐานเพิ่มเติมเราไม่สามารถใช้ข้อมูลระดับกลุ่ม (รวม) เพื่อทำการอนุมานเกี่ยวกับพฤติกรรมระดับบุคคล นี่คือการเข้าใจผิดทางนิเวศวิทยา ข้อมูลระดับกลุ่มสามารถบอกเราเกี่ยวกับพฤติกรรมระดับกลุ่มเท่านั้น

ในการก้าวกระโดดไปสู่การอนุมานระดับบุคคลเราจำเป็นต้องมีข้อสมมติฐานที่แน่นอน ที่นี่ตัวเลือกการลงคะแนนเสียงของบุคคลส่วนใหญ่ไม่แตกต่างกันอย่างเป็นระบบกับรายได้เฉลี่ยของรัฐ คนที่มีรายรับ $ X ในรัฐที่ร่ำรวยต้องมีแนวโน้มที่จะลงคะแนนให้กับพรรคประชาธิปัตย์เช่นเดียวกับคนที่รับรายได้$ X ในรัฐที่ยากจน แต่คนในคอนเนตทิในทุกระดับรายได้มีแนวโน้มที่จะลงคะแนนให้พรรคประชาธิปัตย์กว่าคนในมิสซิสซิปปี้ที่บรรดาระดับรายเดียวกัน ดังนั้นการสันนิษฐานความสอดคล้องถูกละเมิดและเราจะนำไปสู่ข้อสรุปที่ผิด (หลงกลโดยการรวมอคติ )

หัวข้อนี้เป็นงานอดิเรกบ่อยครั้งของDavid Freedmanตอนปลาย; ดูกระดาษนี้ตัวอย่างเช่น ในบทความนั้นฟรีแมนได้จัดให้มีวิธีสำหรับการจำกัดความน่าจะเป็นระดับบุคคลโดยใช้ข้อมูลกลุ่ม

การเปรียบเทียบกับบุคคลที่ผิดธรรมดาของ Simpson ที่
อื่นใน CW นี้ @Michelle เสนอให้บุคคลที่ผิดธรรมดาของ Simpson เป็นตัวอย่างที่ดีอย่างที่มันเป็น ความขัดแย้งของซิมป์สันและการเข้าใจผิดทางนิเวศวิทยานั้นมีความสัมพันธ์กันอย่างใกล้ชิด แต่ก็ชัดเจน ตัวอย่างทั้งสองแตกต่างกันในลักษณะของข้อมูลที่กำหนดและการวิเคราะห์ที่ใช้

สูตรมาตรฐานของความขัดแย้งของซิมป์สันคือตารางสองทาง ในตัวอย่างของเราที่นี่สมมติว่าเรามีข้อมูลส่วนบุคคลและเราจำแนกแต่ละบุคคลเป็นรายได้สูงหรือต่ำ เราจะได้รับตารางแสดงรายได้ 2x2 จากผลรวมทั้งหมด เราจะเห็นว่าส่วนแบ่งสูงของคนที่มีรายได้สูงโหวตให้กับพรรคประชาธิปัตย์เมื่อเทียบกับคนที่มีรายได้ต่ำ หากเราจะสร้างตารางฉุกเฉินสำหรับแต่ละรัฐอย่างไรก็ตามเราจะเห็นรูปแบบตรงกันข้าม

ในการเข้าใจผิดทางนิเวศวิทยาเราจะไม่ยุบรายได้ลงในตัวแปรแบบแบ่งขั้ว (หรือหลายขั้ว) เพื่อให้ได้ระดับรัฐเราจะได้รับรายได้เฉลี่ย (หรือค่ามัธยฐาน) ของรัฐและการลงคะแนนเสียงของรัฐและดำเนินการถดถอยและพบว่ารัฐที่มีรายได้สูงกว่ามีแนวโน้มที่จะลงคะแนนเสียงให้กับพรรคประชาธิปัตย์มากขึ้น หากเราเก็บข้อมูลระดับบุคคลและดำเนินการถดถอยแยกกันตามรัฐเราจะพบผลที่ตรงกันข้าม

โดยสรุปความแตกต่างคือ:

โหมดการวิเคราะห์ : เราสามารถพูดได้ว่าหลังจากการเตรียมทักษะ SAT ของเราแล้วความขัดแย้งของซิมป์สันคือตารางฉุกเฉินเนื่องจากการเข้าใจผิดทางนิเวศวิทยาคือค่าสัมประสิทธิ์สหสัมพันธ์และการถดถอย
ระดับของการรวม / ลักษณะของข้อมูล : ในขณะที่ตัวอย่างเช่นความขัดแย้งซิมป์สันเปรียบเทียบตัวเลขสอง (หุ้นลงคะแนนเสียงพรรคประชาธิปัตย์ในกลุ่มบุคคลที่มีรายได้สูงเมื่อเทียบกับเดียวกันสำหรับบุคคลที่มีรายได้ต่ำ) เข้าใจผิดในระบบนิเวศใช้ 50 คะแนนข้อมูล ( เช่นแต่ละรัฐ) เพื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ . เพื่อให้ได้เรื่องราวทั้งหมดในตัวอย่างที่ขัดแย้งกันของซิมป์สันเราแค่ต้องการตัวเลขสองตัวจากแต่ละรัฐห้าสิบ (100 หมายเลข) ในขณะที่ในกรณีของการเข้าใจผิดทางนิเวศวิทยาเราต้องการข้อมูลระดับบุคคล (หรืออื่น ๆ ความสัมพันธ์ระดับรัฐ / ความชันถดถอย)

การสังเกตทั่วไป
@NeilG แสดงความคิดเห็นว่านี่เป็นเพียงการบอกว่าคุณไม่สามารถเลือกตัวแปรที่ไม่สามารถสังเกตเห็นได้ / ละเว้นตัวแปรที่ทำให้เกิดปัญหาในการถดถอยของคุณ ถูกตัอง! อย่างน้อยในบริบทของการถดถอยฉันคิดว่า "บุคคลที่ผิดธรรมดา" เกือบทั้งหมดเป็นเพียงกรณีพิเศษของการละเว้นตัวแปรอคติ

อคติการเลือก (ดูการตอบสนองอื่น ๆ ของฉันใน CW นี้) สามารถควบคุมได้โดยการรวมตัวแปรที่ขับเคลื่อนการเลือก แน่นอนว่าตัวแปรเหล่านี้มักจะไม่ได้รับการตรวจสอบเพื่อผลักดันปัญหา / ข้อขัดแย้ง การถดถอยที่แท้จริง (การตอบกลับอื่น ๆ ของฉัน) สามารถเอาชนะได้โดยการเพิ่มแนวโน้มเวลา กรณีเหล่านี้บอกว่าโดยพื้นฐานแล้วคุณมีข้อมูลเพียงพอ แต่ต้องการตัวทำนายเพิ่มเติม

ในกรณีของการเข้าใจผิดทางนิเวศวิทยามันเป็นเรื่องจริงคุณต้องมีผู้ทำนายมากขึ้น (ที่นี่ความลาดชันและจุดตัดเฉพาะของรัฐ) แต่คุณต้องมีการสังเกตการณ์มากกว่า - เป็นรายบุคคลมากกว่าระดับกลุ่มเพื่อสังเกตความสัมพันธ์เหล่านี้

(โดยบังเอิญถ้าคุณมีการเลือกมากที่ตัวแปรการเลือกแบ่งการรักษาและการควบคุมอย่างสมบูรณ์แบบในตัวอย่าง WWII ที่ฉันให้คุณอาจต้องการข้อมูลเพิ่มเติมเพื่อประเมินการถดถอยเช่นกันที่นั่นเครื่องบินตก)

— Charlie
แหล่งที่มา

เป็นไปได้อย่างไรที่จะทำให้สมมติฐานที่สอดคล้องเป็นรูปเป็นร่างเป็นระเบียบขึ้นมา? ดูเหมือนว่าสมมติว่าไม่มีคนหลงทาง (สาเหตุ) ที่ขาดหายไปจากแบบจำลองของคน ๆ นั้น

— Neil G

2

นอกจากนี้ตัวอย่างที่ให้ไว้ยังเป็นตัวอย่างของความขัดแย้งของซิมป์สันเนื่องจากการปรับสภาพในรัฐกลับทำให้ความสัมพันธ์ระหว่างรายได้กับพรรค การเข้าใจผิดทางนิเวศวิทยาแตกต่างจากความขัดแย้งของซิมป์สันเมื่อใด

— Neil G

ฉันจะชี้ให้เห็นว่าการอ้างถึงความสัมพันธ์ระดับกลุ่มหรือสาเหตุตามความสัมพันธ์ระดับบุคคลหรือความสัมพันธ์เชิงสาเหตุก็ไม่ดีเช่นกัน: การเข้าใจผิดแบบอะตอม (atomistic fallacy) ซึ่งพูดชัดแจ้งอย่างชัดเจน: [Diez-Roux, 1998] Diez-Roux, AV (1998) นำบริบทกลับคืนสู่ระบาดวิทยา: ตัวแปรและความล้มเหลวในการวิเคราะห์หลายระดับ วารสารการสาธารณสุขอเมริกัน 88 (2): 216–222

— Alexis

43

การมีส่วนร่วมของฉันคือความขัดแย้งของ Simpsonเพราะ:

เหตุผลสำหรับความขัดแย้งนั้นไม่ง่ายนักสำหรับคนจำนวนมากดังนั้น
อาจเป็นเรื่องยากมากที่จะอธิบายว่าทำไมการค้นพบเป็นวิธีที่พวกเขาจะวางคนในภาษาอังกฤษธรรมดา

tl; dr เวอร์ชั่นของเส้นขนาน: นัยสำคัญทางสถิติของผลลัพธ์ปรากฏแตกต่างกันไปขึ้นอยู่กับวิธีการแบ่งพาร์ติชันข้อมูล สาเหตุมักปรากฏขึ้นเนื่องจากตัวแปรที่ทำให้สับสน

อีกร่างที่ดีของความขัดแย้งอยู่ที่นี่

— มิเชล
แหล่งที่มา

4

+1 ฉันคิดว่าจะใส่ตัวเอง สำหรับผู้ที่มีความสนใจขัดแย้งของซิมป์สันยังกล่าวถึงในประวัติย่อที่นี่: stats.stackexchange.com/questions/21896

— gung

3

มีตัวอย่างบางส่วนของความขัดแย้งของ Simpson ที่กล่าวถึงในคำถาม math.SEนี้

— Mike Spivey

32

ไม่มีความขัดแย้งในสถิติมีเพียงปริศนาที่รอการแก้ไข

แต่ที่ชื่นชอบคือสองซองจดหมาย "ความขัดแย้ง" สมมติว่าฉันใส่ซองจดหมายสองซองไว้ข้างหน้าคุณและบอกคุณว่าซองหนึ่งมีเงินมากเป็นสองเท่าของซองอื่น (แต่ไม่ใช่ซองไหน) คุณให้เหตุผลดังนี้ สมมติว่าซองซ้ายมีแล้วมีโอกาส 50% ซองด้านขวามีและด้วยความน่าจะเป็น 50% มันมีสำหรับค่าที่คาดหวังของ xแต่แน่นอนคุณสามารถย้อนกลับซองจดหมายและสรุปได้ว่าซองจดหมายด้านซ้ายมีค่าเท่าของซองจดหมายด้านขวา เกิดอะไรขึ้น? $x$ $2x$ $0.5x$ $1.25x$ $1.25$

— อเล็กซ์ฟลินท์
แหล่งที่มา

brilliant paradox - น่าสนใจถ้าเราไปกับการตีความ "ที่สอง" บนวิกิพีเดียและลองคำนวณ

เราพบว่าเพื่อป้องกันการตั้งค่าสำหรับการสลับเราต้องการ

E [B | A = a]

$E[B|A=a]$

ที่

)

การหาค่า

หมายความว่าเราได้

E [B | A = a] = a = 2 a p + \frac{a}{2} (1 - p)

$E[B|A=a]=a=2ap+\frac{a}{2}(1-p)$

p = P r (A < B | A = a)

$p=Pr(A<B|A=a)$

p

$p$

. ในทำนองเดียวกันเราสามารถคำนวณ

p = \frac{1}{3}

$p=\frac{1}{3}$

โดยที่

และรับ

E [A | B = b] = b = 2 b q + \frac{b}{2} (1 - q)

$E[A|B=b]=b=2bq+\frac{b}{2}(1-q)$

q = P r (B < A | B = b)

$q=Pr(B<A|B=b)$

.... Bizzare!

q = \frac{1}{3}

$q=\frac{1}{3}$

— ความน่าจะเป็นทาง

6

ฉันได้รับการนำเสนอเกี่ยวกับเรื่องที่ขัดแย้งกันซึ่งเกมนี้เล่นกับผู้ชมจริง ๆ ด้วยเงินจำนวนจริง มันได้รับความสนใจ ...

— whuber

คิดว่าฉันแก้ไขอันนี้ ... ความขัดแย้งได้รับการแก้ไขเมื่อเรารับรู้ว่าซองจดหมายขัดแย้งกันสองข้อเสนอที่ไม่ถูกต้อง 1) มีสามปริมาณที่เป็นไปได้: 0.5x, x, และ 2x เมื่อมีเพียงสองปริมาณในซองจดหมาย (พูด x และ 2x) และ 2) ที่เรารู้ว่าซองจดหมายด้านซ้ายมี x (ในกรณีนี้ซองจดหมายด้านขวาจะมี 2x ที่มีความมั่นใจ 100%!) เมื่อพิจารณาถึงค่าที่เป็นไปได้ของ x และ 2x ที่กำหนดให้กับซองจดหมายสองซองคำตอบที่ถูกต้องคือค่าที่คาดหวังที่ 1.5x ไม่ว่าฉันจะเลือกซองจดหมายด้านซ้ายหรือซองจดหมายด้านขวา

— RobertF

3

@RobertF สถานการณ์มีความซับซ้อนมากขึ้น สมมติว่าเป็นที่รู้จักกันว่าเงินที่มีการกระจายในสองซองดังต่อไปนี้ โยนเหรียญที่ยุติธรรมจนกว่ามันจะตกลงมาและนับจำนวนครั้งที่เหรียญถูกโยน วาง 2 ^ n ดอลลาร์ลงในซองหนึ่งและอีก 2 ^ (n + 1) ในซองอื่น ตอนนี้คุณสามารถทำการคำนวณความคาดหวังที่แน่นอนมากและยังคงรักษาความขัดแย้ง

— มัน Weiss Weiss

31

นอนปัญหาความงาม

นี่คือการประดิษฐ์ล่าสุด มันถูกอภิปรายอย่างหนักในวารสารปรัชญาชุดเล็กในช่วงทศวรรษที่ผ่านมา มีผู้สนับสนุนอย่างแข็งขันสำหรับคำตอบที่ต่างกันสองคำตอบ ("Halfers" และ "Thirders") มันก่อให้เกิดคำถามเกี่ยวกับธรรมชาติของความเชื่อความน่าจะเป็นและการปรับสภาพและทำให้ผู้คนต้องตีความควอนตัมเชิงกล "หลายโลก" (ในบรรดาสิ่งที่แปลกประหลาดอื่น ๆ )

นี่คือข้อความจาก Wikipedia:

อาสาสมัคร Sleeping Beauty จะได้รับการทดสอบต่อไปนี้และจะแจ้งรายละเอียดทั้งหมดต่อไปนี้ ในวันอาทิตย์เธอนอนหลับ จากนั้นเหรียญที่เป็นธรรมจะถูกโยนเพื่อกำหนดขั้นตอนการทดลองที่จะดำเนินการ หากเหรียญปรากฏขึ้นหัวความงามจะถูกปลุกขึ้นมาและสัมภาษณ์ในวันจันทร์จากนั้นการทดสอบจะสิ้นสุดลง หากเหรียญขึ้นมาเธอจะถูกปลุกให้ตื่นและสัมภาษณ์ในวันจันทร์และวันอังคาร แต่เมื่อเธอถูกสั่งให้นอนหลับอีกครั้งในวันจันทร์เธอจะได้รับยาความจำเสื่อมที่ทำให้เธอไม่สามารถจำการตื่นนอนก่อนหน้านี้ได้ ในกรณีนี้การทดสอบจะสิ้นสุดลงหลังจากเธอถูกสัมภาษณ์ในวันอังคาร

เมื่อใดก็ตามที่ความงามของเจ้าหญิงนิทราถูกปลุกขึ้นมาและสัมภาษณ์เธอถูกถามว่า "ตอนนี้ความน่าเชื่อถือของคุณคืออะไรสำหรับข้อเสนอที่เหรียญลงไปที่หัว"

ตำแหน่งของ Thirder คือ SB ควรตอบสนอง "1/3" (นี่เป็นการคำนวณทฤษฎีบทของ Bayes อย่างง่าย) และตำแหน่ง Halfer ก็คือเธอควรจะพูดว่า "1/2" (เพราะนั่นเป็นความน่าจะเป็นที่ถูกต้องสำหรับเหรียญยุติธรรม! ) IMHO การอภิปรายทั้งหมดขึ้นอยู่กับความเข้าใจในความน่าจะเป็นที่ จำกัด แต่นั่นไม่ใช่ประเด็นทั้งหมดในการสำรวจความขัดแย้งที่ชัดเจน?

เจ้าชาย Florimond ค้นหาเจ้าหญิงนิทรา

(ภาพประกอบจากProject Gutenberg )

แม้ว่านี่ไม่ใช่สถานที่ที่จะพยายามแก้ไขความขัดแย้ง - เพียงเพื่อระบุพวกเขา - ฉันไม่ต้องการปล่อยให้ผู้คนแขวนอยู่และฉันแน่ใจว่าผู้อ่านส่วนใหญ่ของหน้านี้ไม่ต้องการลุยคำอธิบายทางปรัชญา เราสามารถใช้เคล็ดลับจากET Jaynesผู้แทนที่คำถาม“ เราจะสร้างแบบจำลองทางคณิตศาสตร์ของสามัญสำนึกของมนุษย์ได้อย่างไร” ซึ่งเป็นสิ่งที่เราต้องการเพื่อคิดผ่านปัญหาเจ้าหญิงนิทรา - โดย“ เราจะสร้างเครื่องจักรได้อย่างไร ซึ่งจะนำไปสู่การใช้เหตุผลที่น่าเชื่อถือได้ตามหลักการที่กำหนดไว้อย่างชัดเจนซึ่งแสดงถึงสามัญสำนึกในอุดมคติ?” ดังนั้นหากคุณต้องการแทนที่หุ่นยนต์คิดของเจย์เนส SB คุณสามารถโคลนหุ่นยนต์นี้ (แทนที่จะจัดการกับยาลบความทรงจำเพ้อฝัน) สำหรับการทดลองในวันอังคารดังนั้นจึงสร้างรูปแบบที่ชัดเจนของการตั้งค่า SB ที่สามารถวิเคราะห์ได้อย่างไม่น่าสงสัย การสร้างแบบจำลองนี้ในแบบมาตรฐานโดยใช้ทฤษฎีการตัดสินใจเชิงสถิติแล้วเปิดเผยว่ามีคำถามสองข้อที่ถูกถามจริงๆที่นี่ ( โอกาสที่ที่ดินหัวเหรียญยุติธรรมจะเป็นอย่างไรและโอกาสใดที่เหรียญมีหัวลงดิน โคลนใครถูกปลุกให้ตื่น? ) คำตอบคือ 1/2 (ในกรณีแรก) หรือ 1/3 (ในกรณีที่สองโดยใช้ทฤษฎีบทของเบย์) ไม่มีหลักการทางกลศาสตร์ควอนตัมเกี่ยวข้องในการแก้ปัญหานี้ :-)

อ้างอิง

Arntzenius, Frank (2002) ภาพสะท้อนของเจ้าหญิงนิทรา การวิเคราะห์ 62.1 หน้า 53-62 Elga, Adam (2000) ความเชื่อที่ตั้งตัวเองและปัญหาความงามนอนหลับ การวิเคราะห์ 60 pp 143-7

Franceschi, Paul (2005) เจ้าหญิงนิทราและปัญหาที่เกิดจากการลดโลก preprint

Groisman, Berry (2007) ในตอนท้ายของการนอนหลับฝันร้ายของความงาม

Lewis, D (2001) Sleeping Beauty: การตอบกลับ Elga การวิเคราะห์ 61.3 pp 171-6

Papineau, DavidและVictor Dura-Vila (2008) thirder และ Everettian: ตอบกลับของลูอิส 'ควอนตัม Sleeping Beauty'

Pust, Joel (2008) Horgan ในเจ้าหญิงนิทรา ซินธิส 160 หน้า 97-101

Vineberg, Susan (ไม่ได้ระบุไว้, อาจจะเป็นปี 2003) ความงามของเตือนเรื่อง

สามารถพบได้ทั้งหมด (หรืออย่างน้อยก็พบเมื่อหลายปีก่อน) บนเว็บ

— whuber
แหล่งที่มา

1

คุณคิดว่ามันมีประสิทธิภาพเท่าเทียมกันในการกำหนดโซลูชันในแง่ของ "หน่วยพื้นฐาน" หรือไม่? โดยที่ฉันหมายถึงคุณต้องพิจารณาว่าหน่วยฐานเป็นบุคคลหรือการสัมภาษณ์ 1/2 ของบุคคลจะมีหัว แต่ 1/3 ของการสัมภาษณ์จะ จากนั้นเพื่อเลือกหน่วยฐานของเราเราสามารถทบทวนคำถามและวลีเป็น "โอกาสสัมภาษณ์ที่เกี่ยวข้องกับผลลัพธ์ 'หัว' คืออะไร?

— Jonathan

1

SB ไม่ทราบว่าหลายสัมภาษณ์มีได้รับและเป็นคำถามที่เกี่ยวกับเธอประเมินความน่าจะเป็นที่ไม่ประเมินขัดเคือง จากมุมมองของเธอไม่สามารถกำหนดจำนวนการสัมภาษณ์ได้

— whuber

2

ฉันคิดว่าคุณควรอ่านข้อโต้แย้งในวรรณกรรมก่อนแอรอน (ฉันยอมรับว่าฉันเป็น Thirder แต่ฉันคิดว่าครึ่งหนึ่งไม่พบเหตุผลที่น่าเชื่อถือของคุณอย่างน้อยที่สุดคุณต้องแสดงให้พวกเขาเห็นว่าทำไมข้อโต้แย้งของพวกเขาจึงมีข้อบกพร่อง)

— whuber

1

จุดยุติธรรม @whuber ตอนนี้ฉันได้ดูวรรณกรรมเพิ่มเติม ฉันอ่านเอลลิสงามนอน: ตอบกลับ Elga มันเป็นประโยคที่ทำให้ฉันกังวลตอนเริ่มหัวข้อ '4 ข้อโต้แย้งของฉัน "มีเพียงหลักฐานใหม่ที่เกี่ยวข้องไม่ว่าจะอยู่กึ่งกลางหรือไม่รวมศูนย์เท่านั้นที่ทำให้เกิดการเปลี่ยนแปลงในความเชื่อถือ" ฉันจะคิดเพิ่มเติมและอาจบล็อกเกี่ยวกับเรื่องนี้อีกครั้ง ฉันได้พูดคุยกับนักศึกษาปริญญาเอกอีกเจ็ดคนเกี่ยวกับเรื่องนี้!

— Aaron McDaid

1

เจ้าหญิงนิทราได้รับอนุญาตให้ดูปฏิทินเมื่อตื่นขึ้นหรือไม่? ถ้าวันจันทร์เธอควรตอบ P (X = head) = 0.5 ถ้าวันอังคารแล้ว P (X = head) = 0

— RobertF

25

ขัดแย้ง St.Petersburgซึ่งทำให้คุณคิดว่าแตกต่างกันในแนวคิดและความหมายของค่าที่คาดหวัง สัญชาตญาณ (ส่วนใหญ่สำหรับผู้ที่มีพื้นฐานด้านสถิติ) และการคำนวณนั้นให้ผลลัพธ์ที่แตกต่างกัน

— Guy
แหล่งที่มา

5

X_{1}, X_{2}, \dots

$X_1,X_2,\ldots$

\sqrt{n} {\bar{X}}_{n}

$\sqrt{n} \bar X_n$

N (0, 1)

$\mathcal N(0,1)$

V a r (\sqrt{n} {\bar{X}}_{n}) \to 17

$\mathrm{Var}(\sqrt{n} \bar X_n) \to 17$

@cardinal โอกาสใดที่คุณสามารถโพสต์รายละเอียดบางอย่างไว้เป็นคำตอบแยกต่างหาก

— Silverfish

X_{i}

$X_i$

f (n)

$f(n)$

f

$f$

Var (\sqrt{n} {\bar{X}}_{n})

$\text{Var}(\sqrt{n}\bar X_n)$

X_{i}

$X_i$

f (i)

$f(i)$

X_{i}

$X_i$

V a r (\sqrt{n} {\bar{X}}_{n}) = \frac{1}{n} \sum_{i = 1}^{n} f (i)

$\mathrm{Var}(\sqrt{n}\bar X_n) = \frac{1}{n}\sum_{i=1}^n f(i)$

f (i)

$f(i)$

V a r (\sqrt{n} {\bar{X}}_{n})

$\mathrm{Var}(\sqrt{n}\bar X_n)$

22

ขัดแย้งฟรีย์-ลินด์ซึ่งแสดงให้เห็นว่าภายใต้สถานการณ์บางอย่างเริ่มต้นวิธี frequentist คชกรรมและการทดสอบสมมติฐานสามารถให้คำตอบที่ขัดแย้งกันอย่างสิ้นเชิง มันบังคับให้ผู้ใช้คิดอย่างถ่องแท้ถึงความหมายของการทดสอบรูปแบบเหล่านี้และพิจารณาว่าเป็นสิ่งที่ต้องการหรือไม่ สำหรับตัวอย่างล่าสุดดูการสนทนานี้

— แขก
แหล่งที่มา

20

มีการเข้าใจผิดสองสาวที่มีชื่อเสียง:

ในครอบครัวที่มีลูกสองคนโอกาสที่จะเกิดอะไรขึ้นถ้าเด็กคนใดคนหนึ่งเป็นผู้หญิงเด็กทั้งสองเป็นผู้หญิง?

คนส่วนใหญ่สังหรณ์ใจพูดแต่คำตอบคือ1/2 1/3ปัญหาพื้นฐานคือการเลือก"ผู้หญิงคนหนึ่งจากผู้หญิงทุกคนที่มีพี่น้อง"โดยการสุ่มนั้นไม่เหมือนกับการเลือก"ครอบครัวเดียวกันจากทุกครอบครัวที่มีลูกสองคนและเด็กผู้หญิงอย่างน้อยหนึ่งคน"

อันนี้ง่ายพอที่จะสอดคล้องกับสัญชาตญาณเมื่อคุณเข้าใจ แต่มีรุ่นที่ซับซ้อนมากขึ้นที่ยากต่อการเข้าใจ:

ในครอบครัวที่มีลูกสองคนโอกาสที่จะเกิดอะไรขึ้นถ้าเด็กคนหนึ่งเป็นเด็กชายที่เกิดในวันอังคารที่เด็กทั้งสองเป็นเด็กชาย? (คำตอบ: 13/27)

ในครอบครัวที่มีลูกสองคนโอกาสที่จะเกิดอะไรขึ้นถ้าเด็กคนหนึ่งเป็นผู้หญิงชื่อฟลอริด้าว่าเด็กทั้งสองเป็นผู้หญิง (คำตอบ: ใกล้มากถึง 1/2 โดยสมมติว่า "Florida" เป็นชื่อที่หายากมาก)

ข้อมูลเพิ่มเติมเกี่ยวกับปริศนาเหล่านี้สามารถพบได้ในคำตอบนี้นี้
(เช่น: ข้อมูลเพิ่มเติมเกี่ยวกับเด็กผู้ชายที่เกิดในวันอังคาร , ข้อมูลเพิ่มเติมเกี่ยวกับหญิงสาวที่ชื่อฟลอริดา )

— BlueRaja - Danny Pflughoeft
แหล่งที่มา

3

คำตอบคือ1/3ไม่2/3แน่นอน? เพียงหนึ่งเดียวจากGB, BG, GG

— Martin Smith

3

บทความ "เด็กชายที่เกิดในวันอังคาร" เป็นสิ่งที่ดี ประเด็นหลักซึ่งชัดเจนมาก ("ปัญหาอยู่ภายใต้การกำหนด") คือคำตอบนั้นขึ้นอยู่กับแบบจำลองความน่าจะเป็นที่ใช้ การพูดว่า "คำตอบ" คือ 13/27 นั้นทำให้เข้าใจผิด (ดีที่สุด)

— whuber

@ มาร์ติน: ฮิฮิโอ้โห :)

— BlueRaja - Danny Pflughoeft

2

เหตุผลที่ปัญหาเหล่านี้ทำให้เกิดความสับสนก็คือคำถามนี้เป็นคำที่ทำให้ยากต่อการตรวจสอบว่าพื้นที่สมมติฐานคืออะไร สิ่งนี้จะทำให้เกิดความสับสนว่าคดี "มีแนวโน้มเท่ากัน" นั้นคืออะไร (และด้วยเหตุนี้สิ่งที่ควรนับ)

— ความน่าจะเป็นทาง

1

p (B_{1} G_{2}) = p (G_{1} B_{2})

$p(B_1G_2)=p(G_1B_2)$

\frac{p (G_{1} G_{2})}{2 p (B_{1} G_{2}) + p (G_{1} G_{2})}

$\frac{p(G_1G_2)}{2p(B_1G_2)+p(G_1G_2)}$

12

ขออภัย แต่ฉันไม่สามารถช่วยตัวเองได้ (เช่นกันฉันชอบความขัดแย้งทางสถิติ!)

อีกครั้งอาจไม่ใช่ความขัดแย้งต่อ seและอีกตัวอย่างหนึ่งของตัวแปรที่ถูกละเว้น

สาเหตุที่แท้จริง / การถดถอย
ตัวแปรใด ๆ ที่มีแนวโน้มเวลาจะสัมพันธ์กับตัวแปรอื่นที่มีแนวโน้มเวลาเช่นกัน ตัวอย่างเช่นน้ำหนักของฉันตั้งแต่แรกเกิดถึงอายุ 27 จะมีความสัมพันธ์อย่างมากกับน้ำหนักของคุณตั้งแต่แรกเกิดถึงอายุ 27 เห็นได้ชัดว่าน้ำหนักของฉันไม่ได้เกิดจากน้ำหนักของคุณ ถ้าเป็นเช่นนั้นฉันจะขอให้คุณไปที่โรงยิมบ่อยขึ้นโปรด

$x_t$ $y_t$

\begin{aligned} x_{t} & = α_{0} + α_{1} t + ϵ_{t} and \\ y_{t} & = β_{0} + β_{1} t + η_{t} . \end{aligned}

$\begin{align*}x_t &= \alpha_0 + \alpha_1 t + \epsilon_t \text{ and} \\ y_t &= \beta_0 + \beta_1 t + \eta_t.\end{align*}$

y_{t} = γ_{0} + γ_{1} x_{t} + ν_{t}

$\begin{equation*}y_t = \gamma_0 + \gamma_1 x_t + \nu_t\end{equation*}$

x_{t}

$x_t$

γ_{1}

$\gamma_1$

เมื่อคุณทำการวิเคราะห์อนุกรมเวลาคุณต้องแน่ใจว่าตัวแปรของคุณอยู่กับที่หรือคุณจะได้ผลลัพธ์ที่เป็นไปได้

(ฉันยอมรับอย่างเต็มที่ว่าฉันขโมยความคิดคำตอบของฉันเองที่นี่ )

— Charlie
แหล่งที่มา

11

หนึ่งในรายการโปรดของฉันคือปัญหา Monty Hall ฉันจำได้ว่าเรียนรู้เกี่ยวกับมันในชั้นเรียนสถิติระดับประถมบอกพ่อของฉันเพราะเราทั้งคู่ต่างก็ไม่เชื่อฉันจำลองเลขสุ่มแล้วเราก็พยายามแก้ปัญหา เพื่อความประหลาดใจของเรามันเป็นเรื่องจริง

โดยทั่วไปปัญหาระบุว่าถ้าคุณมีสามประตูในรายการเกมหลังซึ่งหนึ่งเป็นรางวัลและอีกสองไม่มีอะไรถ้าคุณเลือกประตูแล้วก็บอกว่าอีกสองประตูที่เหลือหนึ่งในสองไม่ใช่ประตูรางวัล และอนุญาตให้สลับการเลือกของคุณหากคุณเลือกคุณควรสลับประตูปัจจุบันไปที่ประตูที่เหลือ

นี่คือลิงค์ไปสู่การจำลอง R เช่นกัน: LINK

— Tyler Rinker
แหล่งที่มา

7

Parrondo's Paradox:

จากwikipdedia : "Parrondo's paradox, Paradox ในทฤษฎีเกมได้รับการอธิบายว่า: การรวมกันของการสูญเสียกลยุทธ์กลายเป็นกลยุทธ์ที่ชนะมันได้รับการตั้งชื่อตามผู้สร้าง Juan Parrondo ผู้ค้นพบความขัดแย้งในปี 1996 คำอธิบายเพิ่มเติมคือ :

มีคู่ของเกมแต่ละเกมที่มีความเป็นไปได้สูงที่จะแพ้มากกว่าชนะซึ่งเป็นไปได้ที่จะสร้างกลยุทธ์ที่ชนะโดยการเล่นเกมสลับกัน

Parrondo คิดค้นความขัดแย้งที่เกี่ยวข้องกับการวิเคราะห์วงล้อสีน้ำตาลของเขาซึ่งเป็นการทดลองทางความคิดเกี่ยวกับเครื่องจักรที่สามารถดึงพลังงานจากการเคลื่อนที่ด้วยความร้อนแบบสุ่มซึ่งได้รับความนิยมโดย Richard Feynman นักฟิสิกส์ อย่างไรก็ตามความขัดแย้งจะหายไปเมื่อวิเคราะห์อย่างจริงจัง "

$P_B(W)=3/4+\epsilon$ $P_A(W)=1/10 + \epsilon$

นอกจากนี้ยังมีความขัดแย้งที่เกี่ยวข้องเมื่อเร็ว ๆ นี้ที่เรียกว่า "อัลลิสันมิกซ์ " ซึ่งแสดงให้เห็นว่าเราสามารถใช้ IID สองชุดและชุดที่ไม่มีความสัมพันธ์กันและแย่งพวกมันแบบสุ่มเพื่อให้ชุดผสมบางชุด

— ตบเบา ๆ
แหล่งที่มา

6

เป็นที่น่าสนใจว่าปัญหาเด็กสองคนและปัญหามอนตี้ฮอลล์มักถูกกล่าวถึงกันในบริบทของความขัดแย้ง ทั้งคู่แสดงให้เห็นถึงความขัดแย้งชัดเจนชัดเจนครั้งแรกในปี 2432 เรียกว่าเบอร์ทรานด์บ็อกซ์เป็นเส้นขนานซึ่งสามารถเป็นตัวแทนของทั้งคู่ ฉันคิดว่ามันเป็น "ความขัดแย้ง" ที่น่าสนใจที่สุดเพราะคนที่มีการศึกษาและชาญฉลาดมากคนเดียวกันตอบคำถามทั้งสองนี้ในทางตรงกันข้ามด้วยความเคารพต่อความขัดแย้งนี้ นอกจากนี้ยังเปรียบเทียบกับหลักการที่ใช้ในเกมไพ่เช่นบริดจ์หรือที่รู้จักในชื่อหลักการของตัวเลือกที่ จำกัด ซึ่งจะมีการทดสอบความละเอียดตามเวลา

สมมติว่าคุณมีรายการที่เลือกแบบสุ่มซึ่งฉันจะเรียกว่า "กล่อง" ทุกกล่องที่เป็นไปได้มีคุณสมบัติสมมาตรอย่างน้อยหนึ่งในสอง แต่บางกล่องมีทั้งสองอย่าง ฉันจะเรียกคุณสมบัติ "ทอง" และ "เงิน" ความน่าจะเป็นที่กล่องเป็นเพียงแค่ทองก็คือ P และเนื่องจากคุณสมบัติมีความสมมาตร P จึงเป็นความน่าจะเป็นที่กล่องเป็นเพียงเงิน นั่นทำให้ความน่าจะเป็นที่กล่องหนึ่งอันมีคุณสมบัติเพียง 2P และความน่าจะเป็นที่มีทั้ง 1-2P

หากคุณได้รับการบอกว่ากล่องเป็นทองคำ แต่ไม่ว่าจะเป็นเงินคุณอาจถูกล่อลวงให้บอกว่าโอกาสที่มันจะเป็นเพียงแค่ทองคือ P / (P + (1-2P)) = P / (1-P) แต่คุณจะต้องระบุความน่าจะเป็นแบบเดียวกันสำหรับกล่องสีเดียวถ้าคุณบอกว่ามันเป็นเงิน และถ้าความน่าจะเป็นนี้คือ P / (1-P) เมื่อใดก็ตามที่คุณบอกแค่สีเดียวมันจะต้องเป็น P / (1-P) แม้ว่าคุณจะไม่ได้บอกสี แต่เรารู้ว่ามันเป็น 2P จากย่อหน้าสุดท้าย

ความขัดแย้งที่เห็นได้ชัดนี้ได้รับการแก้ไขโดยการสังเกตว่าถ้ากล่องมีเพียงสีเดียวก็ไม่มีความเคลือบแคลงเกี่ยวกับสีที่คุณจะบอก แต่ถ้ามันมีสองตัว คุณต้องรู้ว่าตัวเลือกนั้นถูกสร้างขึ้นเพื่อตอบคำถามและนั่นคือรากของความขัดแย้งที่ชัดเจน หากคุณไม่ได้รับแจ้งคุณสามารถสันนิษฐานได้ว่ามีเพียงสีที่ถูกสุ่มเลือกเท่านั้นทำให้คำตอบ P / (P + (1-2P) / 2) = 2P หากคุณยืนยันว่า P / (1-P) เป็นคำตอบคุณถือว่าโดยปริยายว่าไม่มีความเป็นไปได้ที่จะมีการพูดถึงสีอื่นเว้นแต่ว่าเป็นสีเดียวเท่านั้น

ในปัญหามอนตี้ฮอลล์การเปรียบเทียบสีนั้นไม่ง่ายนัก แต่เป็น P = 1/3 คำตอบที่อิงกับสองประตูที่ยังไม่ได้เปิด แต่แรกเริ่มมีโอกาสเท่าเทียมกันที่จะได้รับรางวัลสมมติว่า Monty Hall จำเป็นต้องเปิดประตูที่เขาทำแม้ว่าเขาจะมีทางเลือกก็ตาม คำตอบนั้นคือ P / (1-P) = 1/2 คำตอบที่อนุญาตให้เขาเลือกแบบสุ่มคือ 2P = 2/3 สำหรับความน่าจะเป็นที่การสลับจะชนะ

ในปัญหาลูกสองสีในการเปรียบเทียบของฉันค่อนข้างเปรียบเทียบกับเพศ มีสี่ราย P = 1/4 ในการตอบคำถามเราจำเป็นต้องรู้ว่ามันถูกกำหนดแล้วว่ามีผู้หญิงในครอบครัว หากเป็นไปได้ที่จะเรียนรู้เกี่ยวกับเด็กผู้ชายในครอบครัวด้วยวิธีการนั้นคำตอบคือ 2P = 1/2 ไม่ใช่ P / (1-P) = 1/3 มันซับซ้อนกว่านี้เล็กน้อยถ้าคุณพิจารณาชื่อฟลอริดาหรือ "เกิดวันอังคาร" แต่ผลลัพธ์ก็เหมือนกัน คำตอบคือ 1/2 ถ้ามีตัวเลือกและข้อความส่วนใหญ่ของปัญหาบ่งบอกถึงตัวเลือกดังกล่าว และเหตุผลที่ "เปลี่ยน" จาก 1/3 เป็น 13/27 หรือจาก 1/3 เป็น "เกือบ 1/2" ดูเหมือนว่าขัดแย้งและไม่ได้ใช้งานง่ายเพราะข้อสันนิษฐานที่ไม่มีทางเลือกนั้นไม่ได้ใช้งานง่าย

ในหลักการของการ จำกัด การเลือกสมมติว่าคุณขาดไพ่ชุดเดียวกัน - เช่น Jack, Queen และ King ในชุดเดียวกัน โอกาสเริ่มต้นแม้กระทั่งการ์ดใด ๆ ที่เป็นของคู่ต่อสู้ที่เฉพาะเจาะจง แต่หลังจากที่ฝ่ายตรงข้ามเล่นหนึ่งโอกาสของเขาที่จะมีคนอื่น ๆ จะลดลงเพราะเขาสามารถเล่นไพ่ใบนั้นถ้าเขามี

— JeffJo
แหล่งที่มา

P_{G} = P_{S}

$P_G=P_S$

P^{2}

$P^2$

2 P

$2P$

(1 - P)^{2}

$(1-P)^2$

1 - 2 P

$1-2P$

P_{G} = P_{S} = .8

$P_G=P_S=.8$

P_{G S} = 1.6

$P_{GS}=1.6$

P_{- G - S} = - .6

$P_{-G-S}=-.6$

P = .5

$P=.5$

ขออภัยฉันไม่ได้อธิบายว่าพยายามสรุปให้ดีที่สุด My P ไม่ใช่ความน่าจะเป็นที่กล่องมีสีทองมันเป็นความน่าจะเป็นที่เป็นเพียงทอง ความน่าจะเป็นที่มีสีทองคือ 1-P และในขณะที่คุณสมบัติสองอย่างนั้นเป็นแบบสมมาตรพวกมันไม่จำเป็นต้องเป็นอิสระดังนั้นคุณไม่สามารถคูณความน่าจะเป็นได้ นอกจากนี้ยังไม่มีกล่อง "ไม่ได้" เบอร์ทรานด์ใช้กล่องสามกล่องกับเหรียญสองเหรียญในแต่ละทองและทองคำและเงินและเงิน กล่องที่มีเหรียญทองจำนวนหนึ่งคือ "ทอง" ในการวางนัยทั่วไปของฉัน

— JeffJo

+1 นั่นช่วยได้ ตอนนี้ฉันเห็นวลี "อย่างน้อยหนึ่งในสอง" และคำว่า "เพียงแค่" ซึ่งฉันต้องอ่านอย่างช้าๆ

— gung

6

$[0,1]$ $x,y\in [0,1]$ $P(x=y)=0$ $x$ $y>x$ $y<x$ $y>x$ $0.5$

— Ittay Weiss
แหล่งที่มา

2

[0, 1]

$[0,1]$

y

$y$

x

$x$

2

ฉันพบภาพกราฟิกที่เรียบง่ายของการเข้าใจผิดทางนิเวศวิทยา (ที่นี่รัฐที่ร่ำรวย / รัฐที่ยากจนผู้ลงคะแนนขัดแย้ง) ช่วยให้ฉันเข้าใจในระดับที่เข้าใจง่ายว่าทำไมเราถึงเห็นรูปแบบการกลับรายการเมื่อเรารวมประชากรของรัฐ:

ป้อนคำอธิบายรูปภาพที่นี่

— RobertF
แหล่งที่มา

3

นี่เป็นตัวอย่างที่ดี แต่ฉันคิดว่านี่เป็นความขัดแย้งของ Simpson: en.wikipedia.org/wiki/Simpson%27s_paradox 27sm

— Nick

1

@ นิค: ตัวอย่างที่เฉพาะเจาะจงนี้แตกต่างจาก Paradox ของซิมป์สัน แต่ก็ยากที่จะรู้ว่าการเข้าใจผิด / ความขัดแย้งที่นำไปใช้ในสถานการณ์เฉพาะเพราะพวกเขาดูสถิติเดียวกัน ความแตกต่างคือ SP เป็น "ผลกระทบที่ผิดพลาด" ซึ่งจะปรากฏเฉพาะเมื่อวิเคราะห์กลุ่มย่อย แนวโน้มนี้แสดงให้เห็นว่าเป็น "ผลจริง" ที่ปรากฏเฉพาะเมื่อวิเคราะห์กลุ่มย่อย ในกรณีนี้มันแสดงให้เห็นว่าแม้ว่ารายได้ในฐานะตัวเลขดิบจะไม่ส่งผลกระทบต่อรูปแบบการลงคะแนนโดยรวม แต่รายได้ที่เกี่ยวข้องกับประเทศเพื่อนบ้านของคุณ (รัฐของคุณ) จะมีผลต่อรูปแบบการลงคะแนน

— Jonathan

มันเป็นความเข้าใจผิดทางนิเวศวิทยาที่อธิบายด้านล่าง

— Charlie

3

@Charlie 'เบื้องล่าง' และ 'ด้านบน' เป็นฟังก์ชั่นไม่ว่าผู้อ่านของหน้าใดจะเรียงลำดับ (ใช้งาน / เก่าที่สุด / โหวต) และในกรณีใด ๆ คำสั่งภายใต้เกณฑ์การเรียงลำดับบางอย่างสามารถเปลี่ยนแปลงได้ตลอดเวลา . ดังนั้นควรพูดถึงบุคคลที่โพสต์การสนทนาที่คุณอ้างถึงหรือแม้กระทั่งลิงก์ไปยังมัน

— Glen_b

2

สมมติว่าคุณได้รับข้อมูลเกี่ยวกับการเกิดในราชวงศ์ของบางราชอาณาจักร ในแผนภูมิต้นไม้แต่ละการเกิดถูกบันทึกไว้ สิ่งที่แปลกประหลาดเกี่ยวกับครอบครัวนี้ก็คือพ่อแม่พยายามที่จะมีลูกเท่านั้นเมื่อเร็ว ๆ นี้เด็กชายคนแรกเกิดและไม่มีลูกอีกแล้ว

ดังนั้นข้อมูลของคุณอาจมีลักษณะคล้ายกับสิ่งนี้:

G G B
B
G G B
G B
G G G G G G G G G B
etc.

สัดส่วนของเด็กชายและเด็กหญิงในตัวอย่างนี้จะสะท้อนถึงความน่าจะเป็นโดยทั่วไปของการให้กำเนิดเด็กผู้ชาย (พูด 0.5) คำตอบและคำอธิบายสามารถพบได้ในหัวข้อนี้

— ทิม
แหล่งที่มา

2

คำตอบนี้อ่านได้เหมือนตัวต่อปริศนาไม่เหมือนเส้นขนาน ฉันสามารถจินตนาการได้ว่าทำไมคุณต้องการโพสต์แบบนี้ แต่ฉันคิดว่าคำตอบนี้มีคุณสมบัติเป็นบุคคลที่ผิดธรรมดาและเพื่อให้พอดีกับหัวข้อนี้คุณจะต้องชัดเจนมากขึ้น

— อะมีบา

2

คำถามนี้ (กับเด็กผู้ชายและเด็กผู้หญิง interchanged) ถูกถามที่stats.stackexchange.com/questions/93830ซึ่งได้รับคำตอบจำนวนมาก - ไม่ใช่ทั้งหมดในข้อตกลง! (ฉันได้เรียนรู้บางสิ่งบางอย่างด้วยการแก้ปัญหาอย่างจริงจังและคิดในแง่ที่เป็นจริงมากขึ้นสำรวจสมมติฐานที่จำเป็นต้องทำ)

— whuber

@whuber ขอบคุณสำหรับลิงค์! ฉันเพิ่มมันเข้าไปในคำอธิบาย

— ทิม

2

นี่คือ Paradox ของ Simpson อีกครั้ง แต่ 'ถอยหลัง' และข้างหน้ามาจากหนังสือเล่มใหม่ของ Judea Pearl เกี่ยวกับการอนุมานสาเหตุในสถิติ: ไพรเมอร์ [^ 1]

Paradox คลาสสิกของซิมป์สันทำงานดังนี้ลองพิจารณาเลือกหมอสองคน คุณเลือกโดยอัตโนมัติด้วยผลลัพธ์ที่ดีที่สุด แต่สมมติว่าผลลัพธ์ที่ดีที่สุดเลือกกรณีที่ง่ายที่สุด บันทึกที่ไม่ดีของอีกฝ่ายเป็นผลมาจากการทำงานที่ยุ่งยากมากขึ้น

ตอนนี้คุณเลือกใคร ดีกว่าที่จะดูผลลัพธ์ที่แบ่งชั้นด้วยความยากลำบากและจากนั้นตัดสินใจ

มีอีกด้านหนึ่งของเหรียญ (อีกอันที่ขัดแย้งกัน) ซึ่งบอกว่าผลลัพธ์ของการแบ่งชั้นยังสามารถนำคุณไปสู่การเลือกที่ผิด

คราวนี้พิจารณาเลือกที่จะใช้ยาหรือไม่ ยาเสพติดมีผลข้างเคียงที่เป็นพิษ แต่กลไกการรักษาของการกระทำคือการลดความดันโลหิต โดยรวมแล้วยาจะช่วยเพิ่มผลลัพธ์ในประชากร แต่เมื่อแบ่งชั้นความดันโลหิตหลังการรักษาผลลัพธ์จะแย่ลงทั้งในกลุ่มที่มีความดันต่ำและกลุ่มที่มีความดันโลหิตสูง สิ่งนี้จะเป็นจริงได้อย่างไร เพราะเรามีการแบ่งชั้นผลลัพธ์โดยไม่ได้ตั้งใจและในแต่ละผลลัพธ์สิ่งที่เหลืออยู่ที่ต้องสังเกตคือผลข้างเคียงที่เป็นพิษ

เพื่ออธิบายให้ชัดเจนลองนึกภาพยานี้ออกแบบมาเพื่อแก้ไขหัวใจที่แตกสลายและทำได้โดยลดความดันโลหิตและแทนที่จะแบ่งชั้นความดันโลหิตที่เราแบ่งชั้นบนหัวใจคงที่ เมื่อยาทำงาน, หัวใจได้รับการแก้ไข (และความดันโลหิตจะลดลง), แต่ผู้ป่วยบางรายจะได้รับผลข้างเคียงที่เป็นพิษ. เนื่องจากการทำงานของยากลุ่ม 'หัวใจคงที่' จะมีผู้ป่วยจำนวนมากที่ได้ทานยามากกว่าที่จะมีผู้ป่วยทานยาในกลุ่มหัวใจที่แตกหัก ผู้ป่วยที่รับประทานยามากขึ้นหมายถึงผู้ป่วยที่ได้รับผลข้างเคียงมากขึ้นและเห็นได้ชัดว่า (แต่เท็จ) ผลลัพธ์ที่ดีกว่าสำหรับผู้ป่วยที่ไม่ได้ใช้ยา

ผู้ป่วยที่หายดีขึ้นโดยไม่ทานยาถือเป็นโชคดี ผู้ป่วยที่ใช้ยาและดีขึ้นเป็นส่วนผสมของผู้ที่ต้องการยาเพื่อให้ดีขึ้นและผู้ที่จะโชคดีอยู่แล้ว การตรวจผู้ป่วยด้วย 'หัวใจคงที่' หมายถึงไม่รวมผู้ป่วยที่จะได้รับการแก้ไขหากพวกเขาใช้ยา ไม่รวมผู้ป่วยดังกล่าวหมายถึงการยกเว้นอันตรายจากการไม่ใช้ยาซึ่งหมายความว่าเราเห็นอันตรายจากการใช้ยา

ความขัดแย้งของซิมป์สันเกิดขึ้นเมื่อมีสาเหตุของผลลัพธ์นอกเหนือจากการรักษาเช่นความจริงที่ว่าแพทย์ของคุณทำเฉพาะกรณีที่ยุ่งยาก การควบคุมสำหรับสาเหตุที่พบบ่อย (กรณีที่ยุ่งยากกับกรณีง่าย) ช่วยให้เราเห็นผลที่แท้จริง ในตัวอย่างหลังเราได้แบ่งชั้นโดยไม่ได้ตั้งใจในผลลัพธ์ที่ไม่ได้อยู่ในสาเหตุซึ่งหมายความว่าคำตอบที่แท้จริงอยู่ในการรวมไม่ใช่ข้อมูลที่แบ่งเป็นชั้น ๆ

[^ 1]: Pearl J. การอนุมานเชิงสาเหตุในสถิติ John Wiley & Sons; 2016

— drstevok
แหล่งที่มา

2

หนึ่งใน "รายการโปรดของฉัน" ซึ่งหมายความว่ามันเป็นสิ่งที่ไดรฟ์ผมบ้าเกี่ยวกับความหมายของการศึกษาจำนวนมาก (และมักจะโดยผู้เขียนเองไม่ได้เป็นเพียงสื่อ) เป็นที่ของตกทอดอคติ

วิธีหนึ่งที่จะคิดว่ามันจะคิดว่ามีผลกระทบบางอย่างที่เป็นมากเป็นอันตรายกับอาสาสมัครให้มากเพื่อที่จะมีโอกาสที่ดีมากของการฆ่าพวกเขา หากผู้เข้าร่วมการทดลองได้รับผลกระทบนี้ก่อนการศึกษาดังนั้นเมื่อถึงเวลาที่เริ่มการทดลองผู้เข้าร่วมที่ยังมีชีวิตอยู่จะมีโอกาสสูงมากที่จะมีความยืดหยุ่นผิดปกติ การคัดเลือกโดยธรรมชาติอย่างแท้จริงในที่ทำงาน เมื่อเกิดเหตุการณ์นี้การศึกษาจะสังเกตว่าวิชาสัมผัสมีสุขภาพดีผิดปกติ (เนื่องจากทุกคนที่ไม่แข็งแรงอยู่แล้วเสียชีวิตหรือทำให้แน่ใจว่าจะหยุดการสัมผัสกับผลที่ออกมา) สิ่งอำนวยมักจะตีความได้ว่าว่าการสัมผัสเป็นจริงที่ดีสำหรับวิชา นี่คือผลลัพธ์ของการละเว้นการตัดปลาย (เช่นเพิกเฉยต่ออาสาสมัครที่เสียชีวิตและไม่ได้ทำการศึกษา)

ในทำนองเดียวกันผู้ที่หยุดการสัมผัสกับผลกระทบในระหว่างการศึกษามักจะไม่แข็งแรงอย่างไม่น่าเชื่อ: นี่เป็นเพราะพวกเขาตระหนักว่าการเปิดรับอย่างต่อเนื่องอาจจะฆ่าพวกเขา แต่จากการศึกษาพบว่าผู้ที่ลาออกนั้นไม่แข็งแรงมาก!

@ คำตอบของ Charlie เกี่ยวกับเครื่องบินทิ้งระเบิดสงครามโลกครั้งที่สองนั้นสามารถเป็นตัวอย่างได้ แต่ก็มีตัวอย่างที่ทันสมัยมากมายเช่นกัน ตัวอย่างล่าสุดคือการศึกษารายงานว่าดื่มกาแฟวันละ 8+ แก้ว(!!) เชื่อมโยงกับสุขภาพหัวใจที่สูงขึ้นอย่างมากในอาสาสมัครที่มีอายุมากกว่า 55 ปี ผู้คนจำนวนมากที่มีปริญญาเอกตีความเช่นนี้ว่า "การดื่มกาแฟเป็นสิ่งที่ดีต่อหัวใจของคุณ!" รวมถึงผู้เขียนการศึกษาด้วย ฉันอ่านสิ่งนี้เพราะคุณต้องมีหัวใจที่แข็งแรงอย่างไม่น่าเชื่อที่จะยังคงดื่มกาแฟ 8 ถ้วยต่อวันหลังจากอายุ 55 ปีและไม่มีอาการหัวใจวาย แม้ว่ามันจะไม่ฆ่าคุณ แต่ก็มีบางสิ่งที่น่าเป็นห่วงเกี่ยวกับสุขภาพของคุณทุกคนที่รักคุณ (รวมถึงแพทย์ของคุณ) จะกระตุ้นให้คุณหยุดดื่มกาแฟทันที การศึกษาเพิ่มเติมพบว่าการดื่มกาแฟมากไม่มีผลประโยชน์ในกลุ่มวัยรุ่นซึ่งฉันเชื่อว่าเป็นหลักฐานเพิ่มเติมว่าเรากำลังเห็นผลการรอดชีวิตมากกว่าผลเชิงบวก กระนั้นก็มีการศึกษาระดับปริญญาเอกมากมายที่พูดว่า "

— Cliff AB
แหล่งที่มา

ฉันไม่แน่ใจในการตีความของคุณ ในนอร์เวย์การดื่มกาแฟวันละ 8 ถ้วยไม่ใช่เรื่องผิดปกติค่าเฉลี่ย (รวมถึงเด็กและผู้ไม่ดื่มอื่น ๆ ) อยู่ที่ประมาณสองแก้วต่อวัน ในฟินแลนด์ค่าเฉลี่ยอยู่ที่ประมาณ 2.5 ถ้วยต่อวัน ฉันเคยดื่มหมออีธานสิบถ้วยต่อวัน แต่ก็ไม่ได้อีกแล้ว

— kjetil b halvorsen

1

ฉันประหลาดใจที่ยังไม่มีใครพูดถึงNewcombe's Paradoxถึงแม้ว่ามันจะถูกกล่าวถึงอย่างหนักในทฤษฎีการตัดสินใจ มันเป็นหนึ่งในรายการโปรดของฉันอย่างแน่นอน

— ely
แหล่งที่มา

-2

ให้ x, y และ z เป็นเวกเตอร์ที่ไม่เกี่ยวข้อง แต่ x / z และ y / z จะสัมพันธ์กัน

— zbicyclist
แหล่งที่มา

2

เหตุใดจึงเป็นสิ่งที่ผิดธรรมดา? ดูเหมือนว่าใช้งานง่าย

— lcrmorin

2

ฉันประหลาดใจถ้านี่ไม่ใช่เรื่องปกติ

— Glen_b

1

มันไม่ชัดเจนอะไร

x / z

$x/z$

x / z

$x/z$

z

$z$

X, Y,

$X,Y,$

Z

$Z$

— whuber