ความเป็นไปได้ที่บุคคลนี้เป็นเพศหญิงคืออะไร


32

มีคนอยู่ด้านหลังม่าน - ฉันไม่รู้ว่าคนนั้นเป็นผู้หญิงหรือผู้ชาย

ฉันรู้ว่าคนที่มีผมยาวและ 90% ของคนที่มีผมยาวเป็นผู้หญิง

ฉันรู้ว่าบุคคลนั้นมีกรุ๊ปเลือด AX3 ที่หายากและ 80% ของคนทั้งหมดที่มีกรุ๊ปเลือดนี้เป็นผู้หญิง

ความน่าจะเป็นที่บุคคลนั้นเป็นผู้หญิงคืออะไร

หมายเหตุ: สูตรดั้งเดิมนี้ได้ขยายออกไปพร้อมกับสมมติฐานสองข้อเพิ่มเติม: 1. กรุ๊ปเลือดและความยาวผมมีความเป็นอิสระ 2. อัตราส่วนเพศชาย: หญิงในประชากรส่วนใหญ่คือ 50:50

(สถานการณ์ที่เฉพาะเจาะจงที่นี่ไม่เกี่ยวข้อง - แต่ฉันมีโครงการเร่งด่วนที่ต้องการให้ฉันทราบวิธีการที่ถูกต้องในการตอบคำถามนี้ความรู้สึกของฉันคือว่ามันเป็นคำถามของความน่าจะเป็นแบบง่าย กว่าสิ่งที่มีคำตอบที่ถกเถียงกันหลายอย่างตามทฤษฎีทางสถิติที่แตกต่างกัน)


1
มีหลายทฤษฎีของความน่าจะเป็น แต่มันก็เป็นความจริงที่ฉาวโฉ่ว่าผู้คนมีปัญหาในการคิดอย่างถูกต้องเกี่ยวกับความน่าจะเป็น (Augustus DeMorgan นักคณิตศาสตร์ที่ดียอมแพ้การศึกษาความน่าจะเป็นเนื่องจากความยากลำบากของมัน) อย่าดูที่การโต้วาที: มองหาการอุทธรณ์ถึงหลักการของความน่าจะเป็น (เช่นสัจพจน์ Kolmogorov) อย่าปล่อยให้เรื่องนี้แก้ไขได้ในเชิงประชาธิปไตย: คำถามของคุณดึงดูดคำตอบที่เข้าใจผิดหลายข้อซึ่งแม้ว่าบางคนในกลุ่มเห็นด้วยเห็นด้วยก็เป็นเพียงความผิดที่เรียกรวมกัน @Michael C ให้คำแนะนำที่ดี; คำตอบของฉันพยายามแสดงให้คุณเห็นว่าทำไมเขาถึงพูดถูก
whuber

@ หากมีการสันนิษฐานว่าเป็นอิสระคุณจะเห็นด้วยว่า 0.97297 เป็นคำตอบที่ถูกต้องหรือไม่? (ฉันเชื่อว่าคำตอบอาจอยู่ระหว่าง 0% ถึง 100% โดยไม่มีสมมติฐานนี้ - ไดอะแกรมของคุณแสดงอย่างนี้)
อาจจะผิดพลาด

ความเป็นอิสระของอะไรอย่างแม่นยำ? คุณแนะนำว่าทรงผมผู้หญิงและผู้ชายจะเหมือนกันหรือไม่? ดังที่คุณพูดไว้ในคำถามของคุณสถานการณ์ที่เกี่ยวข้องกับเพศ / ผม / กรุ๊ปเลือดอาจไม่เกี่ยวข้องกัน: นั่นบอกฉันว่าคุณพยายามเข้าใจวิธีแก้ปัญหาเช่นนี้โดยทั่วไป ในการทำเช่นนั้นคุณจะต้องรู้ว่าข้อสันนิษฐานใดบ่งบอกถึงข้อสรุป ดังนั้นคุณต้องให้ความสำคัญกับสมมติฐานที่คุณเต็มใจทำและกำหนดว่าจะอนุญาตให้คุณสรุปได้มากแค่ไหน
whuber

3
ชนิดของความเป็นอิสระในการสำรวจเกี่ยวข้องกับการรวมกันของคุณลักษณะทั้งสาม เช่นถ้า AX3 เป็นเครื่องหมายสำหรับกลุ่มอาการที่มีศีรษะล้านในเพศหญิง (แต่ไม่ใช่ในเพศชาย) ดังนั้นบุคคลที่มีผมยาวที่มี AX3 จำเป็นต้องเป็นเพศชาย ฉันหวังว่านี่จะทำให้เห็นได้ชัดว่าใครก็ตามที่สร้างคำตอบที่ชัดเจนสำหรับคำถามนี้จะต้องตั้งสมมติฐานเพิ่มเติมแม้ว่าพวกเขาจะไม่ยอมรับพวกเขาอย่างชัดเจนก็ตาม คำตอบที่มีประโยชน์อย่างแท้จริง IMHO คือคำตอบที่แสดงโดยตรงว่าสมมติฐานที่แตกต่างนำไปสู่ผลลัพธ์ที่แตกต่างกันอย่างไร
whuber

2
คุณพลาดโอกาสที่ผู้หญิงจะไม่มีผมยาว นั่นเป็นมาตรการที่สำคัญ
Daniel R Hicks

คำตอบ:


35

หลายคนพบว่าการคิดในแง่ของ "ประชากร" ในกลุ่มย่อยนั้นมีประโยชน์และเป็นสัดส่วน (แทนที่จะเป็นความน่าจะเป็น) นี่เป็นการให้เหตุผลทางภาพเอง

ฉันจะอธิบายตัวเลขในรายละเอียด แต่ความตั้งใจก็คือการเปรียบเทียบอย่างรวดเร็วของทั้งสองตัวเลขควรระบุอย่างชัดเจนและทันทีว่าอย่างไรและทำไมไม่มีคำตอบเฉพาะสำหรับคำถาม การตรวจสอบอีกเล็กน้อยจะแนะนำว่าข้อมูลเพิ่มเติมใดที่จะเป็นประโยชน์ในการพิจารณาคำตอบหรืออย่างน้อยก็มีขอบเขตในคำตอบ

แผนภาพเวนน์

ตำนาน

Cross-hatching : เพศหญิง / พื้นหลังแข็ง : เพศชาย

ด้านบน : ผมยาว / ด้านล่าง : ผมสั้น

ขวา (และสี) : AX3 / ซ้าย (ไม่มีสี) : ไม่ใช่ AX3

ข้อมูล

cross-hatching ด้านบนคือ 90% ของสี่เหลี่ยมผืนผ้าบนสุด ("90% ของคนที่มีผมยาวเป็นผู้หญิง")

การฟักไข่ไขว้รวมในสี่เหลี่ยมสีที่ถูกต้องคือ 80% ของสี่เหลี่ยมนั้น ("80% ของคนที่มีกรุ๊ปเลือดนี้เป็นผู้หญิง")

คำอธิบาย

แผนภาพนี้แสดงให้เห็นว่าแผนผังประชากร (ของผู้หญิงทั้งหมดและไม่ใช่เพศหญิงภายใต้การพิจารณา) สามารถแบ่งออกเป็นเพศหญิง / ไม่ใช่เพศหญิงพร้อมกัน, AX3 / ไม่ใช่ - AX3, และผมยาว / ผมยาว / ไม่ใช่ผมสั้น ("สั้น") มันใช้พื้นที่อย่างน้อยประมาณเพื่อแสดงสัดส่วน (มีการพูดเกินจริงเพื่อให้ภาพชัดเจนขึ้น)

เห็นได้ชัดว่าการจำแนกประเภทไบนารีทั้งสามนี้สร้างกลุ่มที่เป็นไปได้แปดกลุ่ม แต่ละกลุ่มจะปรากฏขึ้นที่นี่

ข้อมูลระบุว่ารูปสี่เหลี่ยมผืนผ้าข้ามแฮทช์ (หญิงผมยาว) ประกอบด้วย 90% ของรูปสี่เหลี่ยมผืนผ้าบน (คนที่มีผมยาวทั้งหมด) นอกจากนี้ยังระบุว่าส่วนที่รวมกันข้ามของสี่เหลี่ยมสี (หญิงขนยาวกับ AX3 และหญิงขนสั้นกับ AX3) ประกอบด้วย 80% ของพื้นที่สีทางด้านขวา (ทุกคนที่มี AX3) มีคนบอกว่ามีคนอยู่ที่มุมขวาบน (ลูกศร): คนผมยาวกับ AX3 สัดส่วนของสี่เหลี่ยมนี้มีลักษณะเป็นตัวช่องฟักข้าม (เพศหญิง)?

ฉันยังมี (โดยปริยาย) สันนิษฐานว่ากรุ๊ปเลือดและความยาวผมมีความเป็นอิสระ : สัดส่วนของสี่เหลี่ยมผืนผ้าบน (ผมยาว) ที่มีสี (AX3) เท่ากับสัดส่วนของสี่เหลี่ยมล่าง (ผมสั้น) ที่มีสี (AX3) นั่นคือสิ่งที่หมายถึงความเป็นอิสระ มันเป็นข้อสันนิษฐานที่เป็นธรรมและเป็นธรรมชาติที่จะสร้างขึ้นเมื่อตอบคำถามเช่นนี้ แต่แน่นอนว่าจะต้องมีการระบุไว้

ไม่ทราบตำแหน่งของสี่เหลี่ยมมุมฉากบน (หญิงขนยาว) เราสามารถนึกภาพการเลื่อนสี่เหลี่ยมข้ามแฮทช์ด้านบนจากด้านหนึ่งไปอีกด้านหนึ่งและเลื่อนสี่เหลี่ยมไขว้ด้านล่างแบบแฮทช์จากด้านหนึ่งไปอีกด้านหนึ่งและอาจเปลี่ยนความกว้างของมัน หากเราทำเช่นนี้เพื่อให้ 80% ของสี่เหลี่ยมสียังคงเป็นช่องว่างการเปลี่ยนแปลงดังกล่าวจะไม่เปลี่ยนแปลงข้อมูลที่ระบุ แต่มันสามารถเปลี่ยนสัดส่วนของผู้หญิงในสี่เหลี่ยมผืนผ้าขวาบนได้ เห็นได้ชัดว่าสัดส่วนอาจอยู่ที่ใดก็ได้ระหว่าง 0% ถึง 100% และยังคงสอดคล้องกับข้อมูลที่ได้รับดังเช่นในภาพนี้:

รูปที่ 2


จุดแข็งของวิธีนี้คือสร้างการมีอยู่ของคำตอบหลาย ๆ คำถาม เราสามารถแปลพีชคณิตทั้งหมดได้และโดยการกำหนดความน่าจะเป็นนำเสนอสถานการณ์เฉพาะเป็นตัวอย่างที่เป็นไปได้ แต่จากนั้นคำถามจะเกิดขึ้นว่าตัวอย่างดังกล่าวสอดคล้องกับข้อมูลจริงหรือไม่ ตัวอย่างเช่นหากมีคนแนะนำว่าบางทีผม 50% ของคนที่มีผมยาวเป็น AX3 ในตอนแรกก็ไม่ปรากฏว่าสิ่งนี้เป็นไปได้แม้จะได้รับข้อมูลทั้งหมดที่มี ไดอะแกรม (Venn) เหล่านี้ของประชากรและกลุ่มย่อยทำให้สิ่งต่าง ๆ ชัดเจน


3
Whuber สมมติว่ากรุ๊ปเลือดและความยาวผมมีความเป็นอิสระแล้วแน่นอนว่าผู้หญิงผมยาวที่มีประเภท AX3 ควรจะเหมือนกับผู้หญิงผมสั้นที่มี AX3 ใช่หรือไม่ คือคุณไม่มีความยืดหยุ่นในการเปลี่ยนรูปสี่เหลี่ยมผืนผ้าในแบบที่คุณเสนอ ... ถ้าเราสมมติว่าผู้ชายและผู้หญิงอยู่ที่ 50:50 ในประชากรทั้งหมดนั่นไม่ได้ให้ข้อมูลที่เพียงพอแก่เราในการแก้ปัญหานี้ด้วยคำถามเพียงครั้งเดียว คำตอบที่เถียงไม่ได้?
อาจผิดพลาด

@whuber +1 ดีมาก
Michael R. Chernick

5
อาจเป็นเรื่องที่ผิดลองดูคำถามในความคิดเห็นของคุณอย่างใกล้ชิด: เพราะมันเกี่ยวข้องกับผู้หญิงจึงทำให้มีข้อสันนิษฐานเพิ่มเติมเกี่ยวกับความเป็นอิสระตามเงื่อนไขในเรื่องเพศ สมมติฐานของความเป็นอิสระ (ไม่มีเงื่อนไข) ของเส้นผมและกรุ๊ปเลือดไม่ได้กล่าวถึงเพศเลยดังนั้นเพื่อทำความเข้าใจความหมายของมันให้ลบ cross-hatching ออกจากร่าง ฉันหวังว่าสิ่งนี้จะบ่งบอกว่าทำไมเราถึงมีความยืดหยุ่นในการสร้างการฟักข้ามที่ใดก็ตามที่เราต้องการภายในสี่เหลี่ยมมุมบนและล่าง
whuber

1
@whuber ฉันชอบสิ่งนี้ อย่างไรก็ตามฉันมีคำถาม / คำอธิบาย 2 ข้อ: 1. ตัวเลขดูเหมือนจะถือว่าสัดส่วนประชากรสำหรับผมยาวและผมสั้น (ประมาณ 6: 4) & ~ AX3 เทียบกับ AX3 (ประมาณ 85:15) แต่นี่ไม่ได้กล่าวถึงในคำถามดั้งเดิม และไม่ได้กล่าวถึงในคำอธิบายของตัวเลข ฉันสงสัยว่าสัดส่วนป๊อปไม่เกี่ยวข้องกัน ฉันถูก / คุณอธิบายได้อย่างชัดเจนในคำอธิบายหรือไม่? 2. ฉันคิดว่าสถานการณ์นี้ในท้ายที่สุดการทำงานที่มีปรากฏการณ์เดียวกันกับของซิมป์สันเป็นเส้นขนานกรอบเท่านั้นแตกต่างกัน (มาที่ปัญหาจากทิศทางอื่นเช่นเดิม) นั่นเป็นการประเมินที่ยุติธรรมหรือไม่?
gung - Reinstate Monica

3
@ gung ขอบคุณสำหรับการชี้แจงเหล่านั้น ตัวเลขของหลักสูตรต้องแสดงถึงสัดส่วนบางอย่างเพื่อให้สามารถใช้งานได้ทั้งหมด แต่สัดส่วนใด ๆ ที่ไม่ได้ถูกตรึงไว้เป็นพิเศษในคำแถลงปัญหานั้นมีอิสระที่จะเปลี่ยนแปลง (ฉันสร้างภาพเพื่อให้ประชากรราว 50% ปรากฏตัวเป็นผู้หญิงโดยคาดว่าจะมีการแก้ไขในภายหลังซึ่งสิ่งนี้ถูกสันนิษฐานไว้) แนวคิดของการใช้การนำเสนอแบบกราฟิกนี้เพื่อทำความเข้าใจกับ Paradox ของซิมป์สันนั้นน่าสนใจ ฉันคิดว่ามันมีข้อดี
whuber

13

นี่เป็นคำถามของความน่าจะเป็นแบบมีเงื่อนไข คุณรู้ไหมว่าคนที่มีผมยาวและกรุ๊ปเลือด Ax3 ให้A = { 'บุคคลที่มีผมยาว' } ดังนั้นคุณแสวงหา P ( C |และB ) คุณรู้ไหมว่า P ( C | ) = 0.9และ P ( C | B ) = 0.8 การคำนวณ P ( C | A และB )เพียงพอหรือไม่ สมมติว่า P ( A และB และC ) = 0.7

     A={'คนที่มีผมยาว'}              B={'บุคคลที่มีกรุ๊ปเลือด Ax3'}C={'บุคคลนั้นเป็นผู้หญิง'}.

P(C|A และ B)P(C|A)=0.9P(C|B)=0.8
P(C|A และ B)P(A and B and C)=0.7แล้ว สมมติว่าP ในทางกลับกันถ้า P
P(C|A and B)=P(A and B and C)/P(A and B)=0.7/P(A และ B).
0.8 จากนั้นตามข้างบน P ( C | A และB ) = 0.875P(A และ B)=0.8P(C|A และ B)=0.875เราจะมี P ( C | A และB ) = 0.78P(A และ B)=0.9P(C|A และ B)

ตอนนี้ทั้งสองเป็นไปได้เมื่อและP ( CP(C|A)=0.9 0.8 ดังนั้นเราจึงไม่สามารถบอกได้อย่างแน่นอนว่า P ( C | A และB )คืออะไรP(C|B)=0.8P(C|A และ B)


สวัสดีไมเคิลถ้าฉันอ่านคุณอย่างถูกต้องคุณกำลังพูดคำถามที่ถูกวางไม่สามารถตอบได้ใช่ไหม? หรือเพื่อให้เป็นอีกวิธีหนึ่งคุณต้องการข้อมูลเพิ่มเติมเพื่อตอบคำถามนี้หรือไม่ 1. สมมติว่ากรุ๊ปเลือดที่หายากในคำถามเดิมของฉันไม่มีผลกระทบใด ๆ ต่อความต้องการหรือความสามารถของบุคคลในการปลูกผมยาว คำถามนี้สามารถตอบได้หรือไม่? 2. คุณเห็นด้วยหรือไม่ว่าคำตอบจะต้องยิ่งใหญ่กว่า 0.9? (เพราะคุณมีข้อมูลอิสระชิ้นที่สอง - กรุ๊ปเลือด - ที่ตอกย้ำสมมติฐานที่ว่าบุคคลนั้นเป็นผู้หญิง)
อาจเป็นไปได้ผิด

2
หากเป็นอิสระดังนั้นP ( A  และ  B ) = P ( A ) P ( B )และคุณจะต้องระบุว่าส่วนใดของคนที่มีผมยาวเช่นP ( A )P(A และ B)P(A และ B)=P(A)P(B)P(A)และเศษส่วนอะไร ของบุคคลที่มีเลือดกรุ๊ป AX3 คือ ) นอกจากนี้คุณไม่สามารถพูดได้ว่าคำตอบจะต้องยิ่งใหญ่กว่า 0.9 ซึ่งเทียบเท่ากับการระบุว่าP ( C | A  และ  B )P(B) (ฉันไม่เห็นสาเหตุ) P(C|A และ B)>0.9
Néstor

2
@ProbablyWrong ใช่ปัญหาตามที่ระบุไว้ในตอนแรกมีข้อมูลไม่เพียงพอสำหรับคำตอบที่ไม่ซ้ำกัน
Michael R. Chernick

@ Néstor, ไมคาเอล, ฉันไม่เห็นด้วยที่เราต้องรู้ว่าเศษเสี้ยวของคนมีผมยาวหรือเศษส่วนของคนที่มีกรุ๊ปเลือด AX3 ฉันคิดว่าคำตอบสำหรับคำถามดั้งเดิมนั้นจะแก้ไขได้โดยไม่ต้องรู้อะไร (สมมติว่า A และ B เป็นอิสระซึ่งเราทุกคนมีและสมมติว่าเรารู้ว่าการแยกชายหญิงในประชากรทั้งหมด - ไม่ใช่เหตุผลที่คิดว่าประมาณ 50:50 , ฉันคิด).
อาจจะผิดพลาด

7
ทำไมฉันคิดว่าP ( C | A B ) = P
P(C|A และ B)=P(A และ B และ C)×P(A และ B)??
P(C|AB)=P(C(AB))P(AB)=P(ABC)P(AB)
โดยใช้คำจำกัดความของความน่าจะเป็นแบบมีเงื่อนไข
Dilip Sarwate

4

การสนทนาที่น่าสนใจ! ฉันสงสัยว่าถ้าเราระบุ P (A) และ P (B) ด้วยหรือไม่ว่าช่วงของ P (C | A, B) จะไม่แคบกว่าช่วงเต็ม [0,1] เพียงเพราะข้อ จำกัด มากมาย เรามี.

ติดกับสัญลักษณ์ที่แนะนำข้างต้น:

A = เหตุการณ์ที่บุคคลนั้นมีผมยาว

B = เหตุการณ์ที่บุคคลนั้นมีกรุ๊ปเลือด AX3

C = เหตุการณ์ที่บุคคลนั้นเป็นเพศหญิง

P (C | A) = 0.9

P (C | B) = 0.8

P (C) = 0.5 (กล่าวคือสมมติอัตราส่วนของผู้ชายและผู้หญิงในจำนวนที่เท่ากัน)

ดูเหมือนเป็นไปไม่ได้ที่จะสันนิษฐานว่าเหตุการณ์ A และ B เป็นอิสระจากเงื่อนไข C! สิ่งนั้นนำไปสู่ความขัดแย้งโดยตรง: ถ้าP(AB|C)=P(A|C)P(B|C)=P(C|A)P(A)P(C)P(C|B)P(B)P(C)

แล้วก็

P(C|AB)=P(AB|C)(P(C)P(AB))=P(C|A)P(A)P(C)P(C|B)P(B)P(C)(P(C)P(AB))

ถ้าเราสมมติว่า A และ B นั้นมีความเป็นอิสระเช่นกัน: P(AB)=P(A)P(B)ข้อตกลงส่วนใหญ่จะถูกยกเลิกและท้ายที่สุดเราก็จบลงด้วย

P(C|AB)=P(C|A)P(C|B)P(C)=0.90.80.5>1

การติดตามปัญหาทางเรขาคณิตที่ยอดเยี่ยมของ whuber: ในขณะที่มันเป็นความจริงที่พูดโดยทั่วไปสามารถถือว่าค่าใด ๆ ในช่วงเวลา [ 0 , 1 ]ข้อ จำกัด ทางเรขาคณิตทำให้ช่วงของค่าที่เป็นไปได้แคบลง ค่าของ P ( A )และ P ( B )ที่ไม่ใช่ "เล็กเกินไป" (แม้ว่าเราสามารถผูกขอบไว้ด้านบน: P ( A )และ P (P(C|AB)[0,1]P(A)P(B)P(A) )P(B)

ขอให้เราคำนวณค่า {\ bf ที่น้อยที่สุดที่เป็นไปได้} สำหรับภายใต้ข้อ จำกัด ทางเรขาคณิตต่อไปนี้:P(C|AB)

1.เศษส่วนของพื้นที่ส่วนบน (A TRUE) ที่ครอบคลุมโดยสี่เหลี่ยมผืนผ้าด้านบนจะต้องเท่ากับP(C|A)=0.9

2.ผลรวมของพื้นที่ของรูปสี่เหลี่ยมผืนผ้าทั้งสองจะต้องเท่ากับP(C)=0.5

3.ผลรวมของเศษส่วนของพื้นที่ของสี่เหลี่ยมสองสี (เช่นที่ทับซ้อนกับเหตุการณ์ B) ต้องเท่ากับP(C|B)=0.8

4. (เล็กน้อย) สี่เหลี่ยมผืนผ้าด้านบนไม่สามารถเคลื่อนที่ได้เกินขอบเขตด้านซ้ายและไม่ควรเลื่อนเกินทับซ้อนขั้นต่ำสุดไปทางซ้าย

5. (เล็กน้อย) สี่เหลี่ยมผืนผ้าด้านล่างไม่สามารถเคลื่อนย้ายเกินขอบเขตขวาและไม่ควรเคลื่อนเกินขอบเขตทับซ้อนสูงสุดไปทางขวา

ข้อ จำกัด เหล่านี้ จำกัด ว่าเราสามารถเลื่อนสี่เหลี่ยมที่ถูกแฮชได้อย่างอิสระและสร้างขอบเขตที่ต่ำกว่าสำหรับได้อย่างไร รูปด้านล่าง (สร้างด้วยสิ่งนี้P(C|AB)สคริปต์ R ) แสดงสองตัวอย่าง ป้อนคำอธิบายรูปภาพที่นี่

วิ่งผ่านช่วงของค่าที่เป็นไปได้สำหรับ P (A) และ P (B) (สคริปต์ R ) สร้างกราฟนี้ ป้อนคำอธิบายรูปภาพที่นี่

สรุปได้ว่าเราสามารถลดความน่าจะเป็นแบบมีเงื่อนไข P (c | A, B) สำหรับ P (A), P (B)


2
A,B,C

1
@whuber: ขอบคุณสำหรับความคิดเห็นที่เป็นประโยชน์! ฉันหวังว่าการแก้ไขใหม่จะทำให้อ่านและชัดเจนขึ้น
Markus Loecher

@ ใครและคนอื่น ๆ : ฉันหวังว่าจะได้รับการอภิปราย แต่ด้ายดูเหมือนจะไม่ทำงาน? ไม่มีความคิดเห็นเพิ่มเติมจากใคร?
Markus Loecher

1

ทำให้สมมุติฐานคือบุคคลที่อยู่ด้านหลังม่านเป็นผู้หญิง

เราได้รับหลักฐานสองชิ้น ได้แก่ :

หลักฐานที่ 1: เรารู้ว่าบุคคลนั้นมีผมยาว (และเราบอกว่า 90% ของคนที่มีผมยาวเป็นผู้หญิง)

หลักฐานที่ 2: เรารู้ว่าบุคคลนั้นมีกรุ๊ปเลือดที่หายาก AX3 (และเราบอกว่า 80% ของคนทั้งหมดที่มีกรุ๊ปเลือดนี้เป็นผู้หญิง)

จากหลักฐานเพียงข้อ 1 เราสามารถระบุได้ว่าคนที่อยู่หลังม่านนั้นมีค่าความน่าจะเป็น 0.9 ในการเป็นผู้หญิง (สมมติว่า 50:50 แยกระหว่างชายและหญิง)

เกี่ยวกับคำถามที่ถูกโพสต์ก่อนหน้านี้ในหัวข้อคือ "คุณจะเห็นด้วยว่าคำตอบจะต้องยิ่งใหญ่กว่า 0.9?" โดยไม่ต้องทำคณิตศาสตร์ใด ๆ ฉันจะพูดอย่างสังหรณ์ใจคำตอบจะต้อง "ใช่" (มันยิ่งใหญ่กว่า 0.9) เหตุผลก็คือหลักฐานที่ 2 เป็นหลักฐานสนับสนุน (อีกครั้งโดยสมมติว่าแบ่ง 50:50 สำหรับจำนวนผู้ชายและผู้หญิงในโลก) หากเราได้รับแจ้งว่า 50% ของคนที่มีกรุ๊ปเลือด AX3 เป็นเพศหญิงดังนั้นหลักฐานที่ 2 จะเป็นกลางและไม่มีผลใด ๆ แต่เนื่องจากเราได้รับการบอกว่า 80% ของคนที่มีกรุ๊ปเลือดนี้เป็นเพศหญิงหลักฐาน 2 เป็นหลักฐานสนับสนุนและมีเหตุผลควรผลักดันความน่าจะเป็นสุดท้ายของผู้หญิงที่สูงกว่า 0.9

ในการคำนวณความน่าจะเป็นที่เฉพาะเจาะจงเราสามารถใช้กฎของเบย์สำหรับหลักฐาน 1 แล้วใช้การปรับปรุงแบบเบย์เพื่อใช้หลักฐาน 2 กับสมมติฐานใหม่

สมมติ:

A = เหตุการณ์ที่บุคคลนั้นมีผมยาว

B = เหตุการณ์ที่บุคคลนั้นมีกรุ๊ปเลือด AX3

C = เหตุการณ์ที่บุคคลนั้นเป็นผู้หญิง (สมมติว่า 50%)

การใช้กฎของเบย์กับหลักฐาน 1:

P (C | A) = (P (A | C) * P (C)) / P (A)

ในกรณีนี้อีกครั้งหากเราถือว่า 50:50 แยกระหว่างชายและหญิง:

P (A) = (0.5 * 0.9) + (0.5 * 0.1) = 0.5

ดังนั้น P (C | A) = (0.9 * 0.5) / 0.5 = 0.9 (ไม่น่าแปลกใจ แต่มันจะแตกต่างกันถ้าเราไม่ได้แยก 50:50 ระหว่างผู้ชายกับผู้หญิง)

การใช้การปรับปรุงแบบเบย์เพื่อใช้หลักฐาน 2 และเสียบเป็นความน่าจะเป็นก่อนหน้าใหม่ 0.9 เรามี:

P (C | A AND B) = (P (B | C) * 0.9) / P (E)

ที่นี่ P (E) คือความน่าจะเป็นของหลักฐาน 2 ซึ่งตั้งสมมติฐานว่าบุคคลนั้นมีโอกาส 90% ที่จะเป็นผู้หญิง

P (E) = (0.9 * 0.8) + (0.1 * 0.2) [นี่คือกฎความน่าจะเป็นทั้งหมด: (P (หญิง) * P (AX3 | ผู้หญิง) + P (ชาย) * P (AX3 | ผู้ชาย)] ดังนั้น , P (E) = 0.74

ดังนั้น P (C | A AND B) = (0.8 * 0.9) / 0.74 = 0.97297


1
มีบางข้อความในคำตอบของคุณที่ไม่สมเหตุสมผลกับฉัน (1) P (C | A) = 0.9 โดยการสันนิษฐาน ไม่มีที่ไหนพูดได้ว่า P (C) = 0.9 เราสันนิษฐานว่า P (C) = 0.5 (2) คุณได้รับผลลัพธ์สำหรับ P (E) อย่างไร P (หญิง) = P (ชาย) = 0.5 โดยสมมติว่าคุณเขียน P (หญิง) = 0.9
Michael R. Chernick

ค่าของ P (C) จะอยู่ที่ 0.5 ซึ่งเป็นสิ่งที่ฉันใช้ ค่าสำหรับ P (E) คือความน่าจะเป็นของหลักฐาน 2 หลังจากใช้หลักฐาน 1 (ซึ่งนำไปสู่สมมติฐานใหม่ว่าความน่าจะเป็นที่บุคคลนั้นเป็นเพศหญิงคือ 0.9) P (E) = (ความน่าจะเป็นที่บุคคลนั้นเป็นผู้หญิง (ได้รับ Evience 1) * ความน่าจะเป็นที่บุคคลนั้นมี AX3 ถ้าเป็นผู้หญิง) + (ความน่าจะเป็นที่บุคคลนั้นเป็นผู้ชาย (รับ Evience 1) * ความน่าจะเป็น ถ้าผู้ชาย) = (0.9 * 0.8) + (0.1 * 0.2) = 0.74
RandomAnswer

คำจำกัดความความน่าจะเป็นของ E นั้นค่อนข้างสับสนและคำศัพท์ที่คุณใช้ในการคำนวณมันดูแตกต่างจากที่คุณเขียนไว้ก่อนหน้านี้ มันไม่สำคัญว่า เห็นได้ชัดว่าคำตอบนั้นถูกต้องขึ้นอยู่กับคำตอบที่นำเสนออย่าง Huu
Michael R. Chernick

@Michael ยกเว้นว่า Huu ทำผิดพลาด
whuber

2
คำตอบนี้เป็นเพียงความผิด อาจมีข้อผิดพลาดอื่น ๆ แต่อันนี้จ้องมอง คุณระบุคำตอบที่ชัดเจนสำหรับ P ("มีผมยาว") (P (A)) ของคุณแล้วใช้เพื่อให้คำตอบสุดท้ายของคุณ มีข้อมูลไม่เพียงพอที่จะพิจารณาสิ่งนี้แม้จะสมมติว่า P (F) = 0.5 สายของคุณในการคำนวณ P (A) ดูเหมือนว่ามาจากที่ไหนเลย นี่คือสูตรที่ถูกต้องโดยใช้ Bayes theroem: P (A) = P (A | F) P (F) / P (F | A) ซึ่งใช้สมมติฐานที่คุณได้รับไปที่ P (A) = P (A | F) * 9/5 อย่างไรก็ตามเรายังไม่รู้ P (A | F) ซึ่งอาจเป็นอะไรก็ได้
Bogdanovist

0

การกำหนดคำถามใหม่และการวางหลักเกณฑ์ทั่วไป

ABC01ZผมZผม(X|Y)XY(Aa|BCผม)

  1. (Aa1|B1ผม)=ยู1(Aa2|C2ผม)=ยู2
  2. (Aa1|B1ผม)=ยู1(Aa2|C2ผม)=ยู2(BC|ผม)=(B|ผม)(C|ผม)
  3. (Aa1|B1ผม)=ยู1(Aa2|C2ผม)=ยู2(A0|ผม)=12
  4. (Aa1|B1ผม)=ยู1(Aa2|C2ผม)=ยู2(A0|ผม)=12(BC|ผม)=(B|ผม)(C|ผม)

ผม

(BJCk|ผม)=(BJ|ผม)(Ck|ผม),J=0,1k=0,1

คำตอบ

กรณีที่ 1

(ABC|ผม)(ABC|ผม)

มันแสดงให้เห็นถึงความลึกลับต่าง ๆ ซึ่งหมายความว่าการกระจายการมอบหมายเมื่อข้อมูลไม่ได้กำหนดวิธีการแก้ปัญหาเป็นอย่างใดอย่างหนึ่งของการแจกแจงทั้งหมดที่สอดคล้องกับข้อมูลที่รู้จักมีการเอนโทรปีที่ยิ่งใหญ่ที่สุด การกระจายอื่นใดแสดงว่าเรารู้มากขึ้นกว่าข้อมูลที่รู้จักกันซึ่งแน่นอนว่าเป็นความขัดแย้ง

-Σผม,J,k(AผมBJCk|ผม)LN(AผมBJCk|ผม)
Σผม,J,k(AผมBJCk|ผม)=1
(Aa1|B1ผม)=ยู1กล่าวคือΣk(Aa1B1Ck|ผม)Σผม,k(AผมB1Ck|ผม)=ยู1
(Aa2|C2ผม)=ยู2กล่าวคือΣJ(Aa2BJC2|ผม)Σผม,J(AผมBJC2|ผม)=ยู2

  1. A1
  2. B1
  3. C1

a=1=1=1a1=11=1a2=12=1ยู1=0.9ยู2=0.8(A1|B1C1ผม)0.932. ดังนั้นความน่าจะเป็นที่คนหลังม่านเป็นเพศหญิงเนื่องจากเขา / เธอมีผมยาวและกรุ๊ปเลือด AX3 คือ 0.932

กรณีที่ 2

BC

(B0|Cล.ผม)=(B0|ผม),ล.=0,1
Σผม(AผมB0Cล.|ผม)Σผม,J(AผมBJCล.|ผม)=Σผม,k(AผมB0Ck|ผม),ล.=0,1
(A1|B1C1ผม)0.936

กรณีที่ 3

(A0|I)=12i.e.j,k(A0BjCk|I)=12
This time (A1|B1C1I)0.973, so the probability that the person behind the curtain is female, given that he/she has long hair and blood type AX3, is 0.973.

Case 4

Finally we reintroduce the independence constraints of Case 2, and find that (A1|B1C1I)0.989. Therefore the probability that the person behind the curtain is female, given that he/she has long hair and blood type AX3, is 0.989.


-2

ตอนนี้ฉันเชื่อว่าถ้าเราสมมติอัตราส่วนของชายและหญิงในจำนวนมากแล้วมีคำตอบที่เถียงไม่ได้

A = เหตุการณ์ที่บุคคลนั้นมีผมยาว

B = เหตุการณ์ที่บุคคลนั้นมีกรุ๊ปเลือด AX3

C = เหตุการณ์ที่บุคคลนั้นเป็นเพศหญิง

P (C | A) = 0.9

P (C | B) = 0.8

P (C) = 0.5 (กล่าวคือสมมติอัตราส่วนของผู้ชายและผู้หญิงในจำนวนที่เท่ากัน)

จากนั้น P (C | A และ B) = [P (C | A) x P (C | B) / P (C)] / [[P (C | A) x P (C | B) / P (C )] + [[1-P (C | A)] x [1-P (C | B)] / [1-P (C)]]]

ในกรณีนี้ P (C | A และ B) = 0.972973


P [C | A และ B) = P (A และ B และ C) / P (A และ B) = P (A และ B และ C) / [P (A | B) P (B)] คุณได้สูตรมาอย่างไร
Michael R. Chernick

There is probably a way to add conditions so that you get a unique answer.
Michael R. Chernick

เพื่อเพิ่มความเป็นอิสระของ A และ B สูตรจะลดความซับซ้อนของ P (A และ B และ C} / [P (A) P (B)] = P (B และ C | A) / P (B)
Michael R. Chernick

2
The intent of my question was really for you to justify the formula. I don't understand how it would be derived.
Michael R. Chernick

2
ไม่คำตอบที่ใช้ใน Bayes Rule ไม่ถูกต้อง ฉันไม่แน่ใจว่าทำไมคุณถึงสับสนสูตรของ MC ด้านบนนั้นถูกต้องและไม่สามารถใช้เพื่อให้ได้ผลลัพธ์ใด ๆ นั่นคือสิ่งที่คำตอบของเขากับ Whuber ตอบคำถามนั้น!
Bogdanovist

-2

Note: In order to get a definitive answer, the below answers assume that the probability of a person, a long-haired man, and a long-haired women having AX3 are approximately the same. If more accuracy is desired, this should be verified.

You start out with the knowledge that the person has long hair, so at this point the odds are:

90:10

Note: The ratio of males to females in the general population does not matter to us once we find out the person has long hair. For example, if there were 1 female in a hundred in the general population, a randomly-selected long-haired person would still be a female 90% of the time. The ratio of females to males DOES matter! (see the update below for details)

Next, we learn that the person has AX3. Because AX3 is unrelated to long hair, the ratio of men to women is known to be 50:50, and because of our assumption of the probabilities being the same, we can simply multiply each side of the probability and normalize so that the sum of the sides of the probability equals 100:

(90:10) * (80:20)
==> 7200:200

    Normalize by dividing each side by (7200+200)/100 = 74

==> 7200/74:200/74
==> 97.297.. : 2.702..

Thus, the chance that the person behind the curtain is female is approximately 97.297%.

UPDATE

Here's a further exploration of the problem:

Definitions:

f - number of females
m - number of males
fl - number of females with long hair
ml - number of males with long hair
fx - number of females with AX3
mx - number of males with AX3
flx - number of females with long hair and AX3
mlx - number of males with long hair and AX3
pfl - probability that a female has long hair
pml - probability that a male has long hair
pfx - probability that a female has AX3
pmx - probability that a male has AX3

First, we are given that 90% of long-haired people are females, and 80% of people with AX3 are female, so:

fl = 9 * ml
pfl = fl / f
pml = ml / m 
    = fl / (9 * m)

fx = 4 * mx
pfx = fx / f
pmx = mx / m 
    = fx / (4 * m)

Because we assumed that the probability of AX3 is independent of gender and long hair, our calculated pfx will apply to women with long hair, and pmx will apply to men with long-hair to find the number of them that likely have AX3:

flx = fl * pfx 
    = fl * (fx / f) 
    = (fl * fx) / f
mlx = ml * pmx 
    = (fl / 9) * (fx / (4 * m)) 
    = (fl * fx) / (36 * m)

Thus, the likely ratio of the number of females with long-hair and AX3 to the number of males with long-hair and AX3 is:

flx             :   mlx
(fl * fx) / f   :   (fl * fx) / (36 * m)
1/f             :   1 / (36m)
36m             :   f

Because it is given that there is an equal number of 50:50, you can cancel both sides and end with 36 females to every male. Otherwise, there are 36*m/f females for every male in the specified subgroup. For example, if there were twice as many women as men, there would be 72 females to each male of those that have long-hair and AX3.


1
วิธีการแก้ปัญหานี้ขึ้นอยู่กับการสมมติว่ามีมากกว่าที่ระบุไว้ในปัญหาในปัจจุบัน: ผมยาว AX3 และเพศที่เป็นอิสระ ไม่เช่นนั้นคุณไม่สามารถปรับ pfx ให้เหมาะกับผู้หญิงที่มีผมยาวเป็นต้น
whuber

@whuber: Yes, I do make that assumption. However, isn't the purpose of probability to give the best approximation based on the data that you have? Thus, since you already know that long-hair and AX3 are independent for the general population, you SHOULD carry forward that assumption to males and females until you explicitly learn otherwise. Granted, it is not a universally correct one, but it is the best one you can make until you get more info. Q: With only the current data, if you had to give the % chance that it was a woman behind the curtain, would you really say "between 0 and 100%"?
Briguy37

1
เรามีความแตกต่างที่สำคัญในปรัชญา @Briguy ฉันเชื่ออย่างแรงกล้าว่าจะไม่ตั้งสมมติฐานใด ๆ มันไม่ชัดเจนในสิ่งที่ความรู้สึกสมมติฐานอิสระซึ่งกันและกันคือ "ดีที่สุด": ฉันจะให้มันอาจจะอยู่ในการใช้งานบางอย่าง แต่โดยทั่วไปมันดูอันตรายสำหรับฉัน ฉันต้องการชัดเจนเกี่ยวกับสมมติฐานที่จำเป็นในการแก้ปัญหาเพื่อให้ผู้คนสามารถตัดสินใจได้ว่าการรวบรวมข้อมูลเพื่อตรวจสอบสมมติฐานเหล่านั้นเป็นสิ่งที่คุ้มค่าหรือไม่แทนที่จะคิดว่าสิ่งที่สะดวกสบายทางคณิตศาสตร์เพื่อให้ได้คำตอบ นั่นคือความแตกต่างระหว่างสถิติและคณิตศาสตร์
whuber

เพื่อตอบคำถามของคุณ: ใช่ 0% - 100% เป็นคำตอบที่ฉันต้องการ (ฉันได้ให้คำตอบคล้ายกับคำถามที่เทียบเคียงได้ในเว็บไซต์นี้) ช่วงนั้นสะท้อนถึงความไม่แน่นอนอย่างแม่นยำ ปัญหานี้เป็นเรื่องที่เกี่ยวข้องอย่างใกล้ชิดกับความขัดแย้ง Ellsberg กระดาษต้นฉบับของ Ellsberg เขียนได้ดีและชัดเจน: ฉันแนะนำ
whuber

@whuber: ขอบคุณที่สละเวลาในการสนทนากับฉัน ฉันเห็นประเด็นของคุณเกี่ยวกับความสำคัญของการคิดผ่านและแสดงรายการข้อสันนิษฐานที่ทำไว้และได้ปรับปรุงคำตอบของฉันตามนั้น อย่างไรก็ตามในเรื่องที่เกี่ยวกับคำตอบของคุณฉันเชื่อว่ามันไม่สมบูรณ์ เหตุผลนี้คือคุณสามารถพิจารณากรณีที่ไม่รู้จักทั้งหมดและค้นหาความน่าจะเป็นโดยเฉลี่ยในทุกกรณีเพื่อให้ได้คำตอบสุดท้ายของคุณ EG แม้ว่าทั้งสองจะยังคงเป็นไปได้ แต่ความน่าจะเป็นที่สูงกว่า 50% นั้นแพร่หลายมากกว่าความน่าจะเป็นต่ำกว่า 50% ในทุกกรณีดังนั้นเราจึงคาดเดาได้ดีกว่าว่าเป็นผู้หญิง
Briguy37

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.