สถิติที่สำคัญยิ่งกว่า: '90 เปอร์เซ็นต์ของผู้หญิงทุกคนรอดชีวิต 'หรือ '90 เปอร์เซ็นต์ของผู้หญิงที่รอดชีวิตมาจากผู้หญิง'?


14

พิจารณาข้อความต่อไปนี้ที่เขียนว่า Titanic:

ข้อสันนิษฐานที่ 1: มีเพียงผู้ชายและผู้หญิงเท่านั้นที่อยู่บนเรือ

ข้อสันนิษฐานที่ 2: มีผู้ชายเป็นจำนวนมากเช่นเดียวกับผู้หญิง

คำแถลงที่ 1: 90 เปอร์เซ็นต์ของผู้หญิงทุกคนรอดชีวิตมาได้

คำแถลงที่ 2: 90 เปอร์เซ็นต์ของผู้รอดชีวิตทั้งหมดเป็นผู้หญิง

คนแรกบ่งชี้ว่าผู้หญิงที่รอดชีวิตอาจมีความสำคัญสูง

สถิติที่สองมีประโยชน์เมื่อใด

เราสามารถพูดได้ว่าหนึ่งในนั้นมักจะมีประโยชน์มากกว่าอีกหรือไม่


40
มีประโยชน์มากขึ้นสำหรับวัตถุประสงค์อะไร?
Aksakal

12
แปลกใจที่คำตอบเหล่านี้ไม่ได้กล่าวถึงParadox ของซิมป์สัน
นีโม

3
ฉันจะบอกว่าขึ้นอยู่กับว่าคุณเป็นผู้หญิงหรือไม่!
meh

6
ประโยคแรกไม่มีความหมายหากไม่มีสถิติที่เปรียบเทียบได้สำหรับผู้ชาย
Barmar

1
@RahulSaha แต่ถ้า 95% ของผู้ชายรอดชีวิตความหมายอาจเป็นเพราะพวกเขาให้ความสำคัญกับผู้ชายมากกว่า นั่นเป็นเหตุผลที่จำเป็นต้องมีการเปรียบเทียบ
Barmar

คำตอบ:


54

ในขณะที่พวกเขายืนอยู่ไม่มีใครใน Statement 1 หรือ 2 ที่มีประโยชน์มาก หากผู้โดยสาร 90% เป็นผู้หญิงและ 90% ของคนที่รอดชีวิตจากการสุ่มตัวอย่างทั้งสองข้อความจะเป็นจริง ข้อความที่ต้องพิจารณาในบริบทขององค์ประกอบโดยรวมของผู้โดยสาร และโอกาสโดยรวมของการอยู่รอด


สมมติว่าเรามีผู้ชายมากเท่ากับผู้หญิงละ 100 คน นี่คือเมทริกซ์ของผู้ชาย (M) ต่อผู้หญิง (W) และการรอดชีวิต (S) ต่อการตาย (D):

  |  M |  W
------------
S | 90 | 90
------------
D | 10 | 10

ผู้หญิง 90% รอดชีวิตมาได้ เช่นเดียวกับผู้ชาย 90% คำแถลงที่ 1 เป็นความจริงแถลงการณ์ที่ 2 เป็นเท็จเนื่องจากผู้รอดชีวิตครึ่งหนึ่งเป็นผู้หญิง ซึ่งสอดคล้องกับผู้รอดชีวิตจำนวนมาก แต่ความแตกต่างระหว่างเพศไม่มี

  |  M |  W
------------
S | 10 | 90
------------
D | 90 | 10

ผู้หญิง 90% รอดชีวิต แต่มีผู้ชายเพียง 10% เท่านั้น 90% ของผู้รอดชีวิตเป็นผู้หญิง ข้อความทั้งสองเป็นจริง สิ่งนี้สอดคล้องกับความแตกต่างระหว่างเพศ : ผู้หญิงมีแนวโน้มที่จะอยู่รอดมากกว่าผู้ชาย

  |  M |  W
------------
S |  1 |  9
------------
D | 99 | 91

ผู้หญิง 9% รอดชีวิต แต่มีผู้ชายเพียง 1% เท่านั้น 90% ของผู้รอดชีวิตเป็นผู้หญิง Statement 1 เป็นเท็จ Statement 2 เป็นจริง นี่เป็นอีกครั้งที่สอดคล้องกับความแตกต่างระหว่างเพศ : ผู้หญิงมีแนวโน้มที่จะอยู่รอดมากกว่าผู้ชาย


3
(or indeed, if *everyone* survived)... หากทุกคนรอดชีวิตมาได้ 100% ของผู้หญิงทุกคนรอดชีวิตโดยไม่คำนึงถึงสัดส่วน
Bridgeburners

1
@Bridgeburners: คุณพูดถูกและมันทำให้ฉันเมื่อฉันไม่อยู่ที่คอมพิวเตอร์ ขอบคุณฉันแก้ไขคำตอบของฉัน
Stephan Kolassa

18

ที่ใบหน้าความน่าจะเป็นที่มีเงื่อนไขของการรอดชีวิตแบบมีเงื่อนไขกับเพศนั้นมีประโยชน์มากกว่าเพียงเพราะทิศทางการไหลของข้อมูล เพศของบุคคลนั้นทราบก่อนสถานะการอยู่รอดของเขาและความน่าจะเป็นนี้สามารถใช้ในการทำนายได้ นอกจากนี้ยังไม่ได้รับอิทธิพลจากความชุกของผู้หญิง เมื่อสงสัยให้คิดคำทำนาย


ใช่ที่ใบหน้าของมัน ดังนั้นเพื่อให้แน่ใจว่าฉันเข้าใจวิธีการที่นำไปใช้กับสถิติที่เป็นจริงในคำถาม ... คุณกำลังพูดว่า statement # 1 มีประโยชน์เพราะมันบอกฉันว่าถ้าฉันเป็นผู้หญิงให้ขึ้นเรือโดยสารขนาดใหญ่ในปี 1912 เกิดอะไรขึ้นกับจมลงไปในน่านน้ำภูเขาน้ำแข็งรบกวนโอกาสของฉันที่รอดชีวิตมาได้ 90%? และการเพิ่มข้อสันนิษฐานที่สมเหตุสมผลว่าเทคโนโลยีและการปฏิบัติที่ช่วยชีวิตดีขึ้นตั้งแต่นั้นมานั่นหมายความว่าโอกาสของฉันที่จะรอดชีวิตจากสถานการณ์เช่นนี้ในวันนี้น่าจะดีกว่า 90% หรือไม่? เย็น! ;-)
Don Hatch

ความคิดเห็นเหล่านั้นจะขายเกินเป้าหมายที่เป็นคำอธิบายดั้งเดิม
Frank Harrell

คุณแน่ใจหรือว่าคุณมีเป้าหมายที่ถูกต้อง คำถามก็คือเกี่ยวกับประโยชน์ของข้อความเหล่านี้เกี่ยวกับไททานิคจริงซึ่งในความเป็นจริงไม่ได้มีประโยชน์สำหรับการคาดการณ์เพราะมีการเปลี่ยนแปลงมากมายตั้งแต่นั้นมา ดังนั้นดูเหมือนว่าฮิวริสติกของคุณล้มเหลวในตัวอย่างจริงแรกที่ขว้างใส่มันใช่ไหม? ดูเหมือนจะไม่ใช่จุดเริ่มต้นที่ดี ในทางกลับกัน OP อาจตั้งคำถาม Titanic ให้เป็น proxy สำหรับคำถามทั่วไปของรูปแบบเดียวกันที่ใช้กับสถานการณ์ปัจจุบันที่ทำมีความเกี่ยวข้องทำนาย; ฉันไม่รู้
Don Hatch

1
อย่างที่ฉันได้รับกรณีศึกษาอย่างละเอียดเกี่ยวกับความน่าจะเป็นของการอยู่รอดของผู้โดยสาร TItanic ในหนังสือของฉัน กลยุทธ์การสร้างแบบจำลองการถดถอยมีค่ามากในการค้นพบสิ่งที่เกิดขึ้น ฉันไม่ได้ใช้ความน่าจะเป็นที่คาดการณ์จากโมเดลโลจิสติกส์นั้นเพื่อทำนาย Titanics ในอนาคต แต่เพื่อค้นหารูปแบบในกระบวนการคัดเลือกเรือชูชีพ
Frank Harrell

6

คนแรกบ่งชี้ว่าผู้หญิงที่รอดชีวิตอาจมีความสำคัญสูง

คำว่า "บุริมภาพ" มาจากภาษาละตินสำหรับคำว่า "มาก่อน" ลำดับความสำคัญคือสิ่งที่เกิดขึ้นก่อนสิ่งอื่น (ซึ่ง "ก่อน" กำลังถูกใช้ในแง่ของ "สำคัญกว่า") หากคุณบอกว่าการช่วยชีวิตผู้หญิงเป็นเรื่องสำคัญอันดับแรกการช่วยให้ผู้หญิงต้องมาต่อหน้าอย่างอื่น และข้อสันนิษฐานตามธรรมชาติคือสิ่งที่เกิดขึ้นก่อนหน้านี้คือการช่วยมนุษย์ หากคุณพูดว่า "ไม่ว่าใครจะช่วยชีวิตผู้ชาย" เราก็จะสงสัยว่ามันเกิดขึ้นมาก่อนหน้านี้แล้ว

ผู้หญิงที่มีอัตราการรอดชีวิตสูงไม่พูดมากถ้าเราไม่รู้ว่าอัตราการรอดชีวิตโดยทั่วไปคืออะไร เรือลำสุดท้ายที่ฉันเดินทางไปนั้นมีผู้หญิงมากกว่า 90% ที่รอดชีวิตมาได้ แต่ฉันจะไม่บอกว่าการประหยัดผู้หญิงเป็นเรื่องสำคัญอันดับแรก

และการรู้ว่าเปอร์เซ็นต์ของผู้รอดชีวิตที่เป็นผู้หญิงนั้นไม่ได้พูดอะไรมากนัก

สถิติอะไรที่มีประโยชน์มากกว่านี้ขึ้นอยู่กับสถานการณ์ หากคุณต้องการรู้ว่าอันตรายมีอะไรบ้างอัตราการตายนั้นสำคัญกว่า หากคุณต้องการรู้ว่าสิ่งใดมีผลต่อความอันตรายของสิ่งนั้นการแบ่งเปอร์เซ็นต์การบาดเจ็บล้มตายเป็นสิ่งสำคัญ


2
บทวิจารณ์ที่ดี :-) "เรือลำสุดท้ายที่ฉันแล่นไปมีผู้หญิงกว่า 90% รอดชีวิตมาได้ แต่ฉันจะไม่อธิบายว่าการแสดงให้เห็นว่าผู้หญิงที่รอดชีวิตมีความสำคัญเป็นอันดับแรก แน่นอนว่า .. มีความสำคัญสูงเมื่อเทียบกับการทิ้งลงน้ำ! แน่นอนนี่คือการตีความที่ไร้สาระของ "ลำดับความสำคัญสูง" แต่เนื่องจาก OP ได้ตัดการตีความ "ลำดับความสำคัญสูงกว่าการบันทึกคน" สิ่งที่เราเหลืออยู่คือการตีความที่ไร้สาระ
Don Hatch

3

อาจเป็นประโยชน์สำหรับเราที่จะตรวจสอบว่าความน่าจะเป็นเหล่านี้เกี่ยวข้องกันอย่างไร

ให้เป็นเหตุการณ์ที่บุคคลเป็นผู้หญิงและให้Sเป็นเหตุการณ์ที่บุคคลนั้นรอดชีวิตมาได้WS

คำแถลง 1:

P(S|W)=0.9

คำแถลง 2:

P(W|S)=0.9

ทฤษฎีบทของเบย์แสดงให้เห็นว่าคำแถลงความน่าจะเป็นเหล่านี้เกี่ยวข้องกันอย่างไร

P(S|W)=P(W|S)P(S)P(W)

ในกรณีนี้ (ความน่าจะเป็นของการอยู่รอด) และP ( W )P(S)P(W) (สัดส่วนของผู้หญิงบนไททานิค) นั้นค่อนข้างง่ายต่อการค้นหาดังนั้นจึงมีความเป็นไปได้ที่จะพึ่งพาซึ่งกันและกัน นั่นคือการรู้ว่าใครจะเป็นตัวกำหนดอย่างเต็มที่

P(S)P(W)


3
ฉันก็จะบอกว่าตรงกันข้ามกับข้อสรุปของคุณว่าถ้าไม่รู้จัก P (S) และ P (W) ทั้ง P (S | W) และ P (W | S) ก็ประสบกับการขาดประโยชน์ที่น่าผิดหวังเช่นเดียวกัน ฉันยังไม่มีภาพที่ชัดเจนในใจของฉันในสิ่งที่สามารถพูดได้หากเป็นที่รู้จักหนึ่งใน P (S) และ P (W)
Don Hatch

P(W)=0.5

1
ใช่มันดูถูกต้องและคำตัดสินของศาลดูเหมือนจะเป็นข้อมูลที่ไม่เพียงพอแม้จะเป็นเช่นนั้นก็ตาม ฉันต้องบอกว่าทุกครั้งที่ฉันเริ่มคิดเกี่ยวกับข้อมูลที่ฉันสามารถแยกได้จากเพียงแค่ P (W | S) หรือเพียงแค่ P (S | W) หรือแม้แต่การเพิ่ม P (W) หรืออะไรก็ตามฉันคิดว่า "ทำไมบนโลกนี้ ผมคิดเกี่ยวกับเรื่องนี้? พวกเขาให้ฉันทำไมเพียงร้อยละเหล่านั้นหรือไม่เพียงแสดงให้ฉันตารางทั้งหมด "
Don Hatch

3

มันขึ้นอยู่กับสิ่งที่คนคิดว่ามีประโยชน์

P(S|W)>P(S|M)ดังนั้นข้อความทั้งสองนี้ก็ไร้ประโยชน์อย่างเท่าเทียมกันโดยไม่มีข้อมูลเพิ่มเติม ในคำตอบของพวกเขา หากใครบางคนมีความหมายที่จะแสดงข้อมูลประเภทนี้พวกเขาจำเป็นต้องพูดอะไรมากกว่าคำแถลงที่ 1 เช่น "90 เปอร์เซ็นต์ของผู้หญิงที่รอดชีวิต แต่เพียง 20 เปอร์เซ็นต์เท่านั้นที่รอดชีวิต"

ในทางกลับกันหากคุณสงสัยว่าทำไมเรื่องราวผู้รอดชีวิตส่วนใหญ่มาจากผู้หญิงข้อความที่ 2 จะอธิบายว่าการทำประโยคที่ 2 มีประโยชน์แม้ว่าจะไม่มีข้อมูลอื่น

ฉันไม่สามารถนึกถึงสิ่งที่คำสั่ง 1 มีประโยชน์สำหรับบริบท แน่นอนว่ามันไม่ได้พูดอะไรเกี่ยวกับลำดับความสำคัญที่ให้ไว้กับการช่วยชีวิตผู้หญิงเทียบกับสิ่งอื่น สิ่งเดียวที่ทำให้คำสั่ง 1 สำหรับฉันคือมันทำให้ฉันพูดว่า "บอกฉันมากกว่านี้"


0

บนพื้นผิว (หรือแยกจากความเป็นจริง) ข้อความทั้งสองดูเหมือนจะไร้ประโยชน์เท่ากันสำหรับเป้าหมายของรัฐ อย่างไรก็ตามเมื่อพิจารณาตามบริบทแล้วข้อความที่สองนั้นมีประโยชน์มากกว่าอย่างชัดเจน

แถลงการณ์ 2

w

w=px/(px+(1p)z)
pxz

H0:x>z

H0

(1w)px=w(1p)z
x=w(1p)z/((1w)p)
H0
x=w(1p)z/((1w)p)>z
W(1-พี)>(1-W)พี
0.9(1-พี)>0.1พี
1-พี>พี/9
พี<0.9

พี1/2. ดังนั้นฉันจึงประกาศแถลงการณ์ที่ 2 ทั้งหมด แต่ยืนยันว่าผู้หญิงมีแนวโน้มที่จะอยู่รอดมากกว่านั่นคือมันมีประโยชน์มากสำหรับเป้าหมายของคุณ

คำแถลง 1

ประโยคแรกไม่มีประโยชน์อย่างแท้จริงในการแยก แต่มีการใช้งาน จำกัด ในบริบท ถ้าเราแกล้งเราไม่รู้อะไรเกี่ยวกับเหตุการณ์แล้วพูดอย่างนั้นx=0.9 บอกอะไรเราเกี่ยวกับ Zและไม่ว่าจะ x>Z?

อย่างไรก็ตามจากสิ่งเล็ก ๆ น้อย ๆ ที่ฉันรู้เกี่ยวกับเหตุการณ์ - ฉันไม่ได้เห็นภาพยนตร์ - มันไม่น่าเป็นไปเช่นนั้น xZ. ทำไม?

เรารู้จากอัสสัมชัญ 2 ว่า พี1/2ดังนั้นอัตราการรอดชีวิตโดยรวมคือ พีx+(1-พี)Z. ถ้าเราคิดเอาเองว่าxZ และ พี1/2 เราได้รับ

พีx+(1-พี)Zx=0.9
ในคำอื่น ๆ 90% ของผู้โดยสารทั้งหมดรอดชีวิตซึ่งไม่ได้แหวนจริงสำหรับฉัน พวกเขาจะสร้างภาพยนตร์และพูดคุยเกี่ยวกับเรื่องนี้เป็นเวลา 100 ปีหรือไม่หากผู้โดยสาร 90% รอดชีวิต? ดังนั้นจะต้องเป็นอย่างนั้นx>>Z และน้อยกว่าครึ่งหนึ่งของผู้โดยสารที่ทำมัน

ข้อสรุป

ฉันจะบอกว่าทั้งสองคำสนับสนุน hypo ของคุณว่าผู้หญิงมีแนวโน้มที่จะอยู่รอดมากกว่าผู้ชาย แต่งบ 1 ทำค่อนข้างอ่อนแอในขณะที่งบ 2 เมื่อรวมกับสมมติฐานเกือบแน่นอนสร้าง hypo ของคุณเป็นจริง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.