นี่เป็นวิธีที่ถูกต้องในการอัพเดทความน่าจะเป็นอย่างต่อเนื่องโดยใช้ทฤษฎีบทของเบย์หรือไม่?


9

สมมติว่าฉันกำลังพยายามหาความน่าจะเป็นที่ไอศครีมที่ชื่นชอบของใครบางคนคือวานิลลา

ฉันรู้ว่าคน ๆ นี้ก็ชอบดูหนังสยองขวัญด้วย

ฉันต้องการหาความน่าจะเป็นที่ไอศครีมที่ชื่นชอบของบุคคลนั้นคือวานิลลาเนื่องจากพวกเขาเพลิดเพลินกับภาพยนตร์สยองขวัญ

ฉันรู้สิ่งต่อไปนี้:

  1. 5%ของผู้คนเลือกวานิลลาเป็นไอศครีมที่ชื่นชอบ (นี่คือของฉัน )P(A)
  2. 10%ของผู้ที่ชื่นชอบไอศครีมวานิลลาก็ชอบภาพยนตร์สยองขวัญเช่นกัน (นี่คือของฉัน )P(B|A)
  3. 1%ของคนที่ชื่นชอบไม่ใช่ไอศกรีมวานิลลาก็ชอบหนังสยองขวัญ (นี่คือของฉัน )P(B|¬A)

ดังนั้นฉันคำนวณแบบนี้: ฉันพบว่า (ปัดเศษเป็นสิบหลักที่ใกล้ที่สุด) มีโอกาสที่ไอศครีมที่ชื่นชอบของแฟนหนังสยองขวัญคือวานิลลา

P(A|B)=0.05×0.1(0.05×0.1)+(0.01×(10.05))
P(A|B)=0.344834.48%

แต่แล้วฉันก็รู้ว่าบุคคลนั้นได้ดูหนังสยองขวัญในช่วง 30 วันที่ผ่านมา นี่คือสิ่งที่ฉันรู้:

  1. 34.48%เป็นความน่าจะเป็นด้านหลังที่วานิลลาเป็นคนชื่นชอบไอศครีมรสชาติ -ในปัญหาต่อไปนี้P(A)
  2. 20%ของผู้ที่ชื่นชอบไอศครีมวานิลลาได้ดูหนังสยองขวัญในช่วง 30 วันที่ผ่านมา
  3. 5%ของผู้ที่ไม่ชอบไอศกรีมวานิลลาได้เห็นภาพยนตร์สยองขวัญในช่วง 30 วันที่ผ่านมา

สิ่งนี้จะให้: เมื่อปัดเศษ

0.3448×0.2(0.3448×0.2)+(0.05×(10.3448))=0.6779

ดังนั้นตอนนี้ฉันเชื่อว่ามีโอกาสที่แฟนหนังสยองขวัญชอบไอศกรีมเพราะพวกเขาเคยดูหนังสยองขวัญในช่วง 30 วันที่ผ่านมา67.79%

แต่เดี๋ยวก่อนมีอีกอย่างหนึ่ง ฉันได้เรียนรู้ด้วยว่าบุคคลนั้นเป็นเจ้าของแมว

นี่คือสิ่งที่ฉันรู้:

  1. 67.79%เป็นความน่าจะเป็นหลังที่ได้รับการปรับปรุงซึ่งวานิลลาเป็นคนชื่นชอบไอศกรีมรสชาติ -ในปัญหาต่อไปนี้P(A)
  2. 40%ของผู้ที่ชื่นชอบไอศครีมวานิลลาก็มีแมวเป็นของตัวเอง
  3. 10%ของผู้ที่ชื่นชอบไม่ใช่ไอศครีมวานิลลาก็มีแมวเป็นของตัวเอง

สิ่งนี้ให้: เมื่อปัดเศษ

0.6779×0.4(0.6779×0.4)+(0.1×(10.6779))=0.8938

โดยทั่วไปคำถามของฉันจะลดลงเป็นอย่างนี้: ฉันได้ปรับปรุงความน่าจะเป็นโดยใช้ทฤษฎีบทของเบย์อย่างถูกต้องหรือไม่? ฉันได้รับสิ่งผิดปกติในวิธีการของฉันหรือไม่?


1
รัก = ชื่นชอบ? คุณไม่ได้โพสต์องศาแห่งความรัก ถ้าคุณรักมันก็เป็นที่ชื่นชอบของคุณ ชี้แจงหากจำเป็น
generic_user

จุดดี. ฉันเปลี่ยน "ความรัก" เป็น "รายการโปรด" มันไม่ถูกต้องตามหลักไวยากรณ์ แต่พูดน้อยกว่าพูดว่า "เลือกวานิลลาเพื่อรสชาติไอศกรีมที่พวกเขาโปรดปราน" ฉันหวังว่าจะล้างสิ่งต่างๆ
user1626730

คำตอบ:


7

สิ่งนี้ไม่ถูกต้อง การอัปเดตตามลำดับของประเภทนี้จะทำงานเฉพาะเมื่อข้อมูลที่คุณได้รับตามลำดับนั้นเป็นอิสระ (เช่นการสังเกต iid ของตัวแปรสุ่ม) หากการสังเกตแต่ละครั้งไม่เป็นอิสระเช่นในกรณีนี้คุณต้องพิจารณาการแจกแจงความน่าจะเป็นร่วม วิธีที่ถูกต้องในการอัปเดตคือการย้อนกลับไปก่อนพบความน่าจะเป็นร่วมที่ใครบางคนรักหนังสยองขวัญได้เห็นภาพยนตร์สยองขวัญในช่วง 30 วันที่ผ่านมาและเป็นเจ้าของแมวที่พวกเขาทำหรือไม่เลือกวานิลลา รสชาติไอศกรีมที่ชื่นชอบแล้วอัปเดตในขั้นตอนเดียว

การอัปเดตตามลำดับเช่นนี้เมื่อข้อมูลของคุณไม่เป็นอิสระจะทำให้ความน่าจะเป็นหลังของคุณสูงหรือต่ำกว่าที่ควรจะเป็น


1
คุณหมายความว่าอย่างไรเมื่อ "ข้อมูลที่คุณได้รับตามลำดับมีความเป็นอิสระ" หากคุณหมายถึง "เป็นอิสระจากเหตุการณ์ที่คุณพยายามคาดการณ์" คุณรู้ไหมว่าฉันจะบอกได้อย่างไรว่าข้อมูลที่ฉันได้รับมีความเป็นอิสระหรือไม่?
user1626730

เงื่อนไขที่เป็นอิสระได้รับเหตุการณ์ที่คุณพยายามที่จะทำนาย หากพวกเขาเป็นอิสระจากเหตุการณ์ที่คุณพยายามคาดการณ์พวกเขาจะไม่ทำอะไรให้คุณดี สำหรับวิธีที่คุณสามารถบอกได้ - คุณต้องคิดว่าข้อมูลของคุณคืออะไร ในกรณีนี้ไม่ว่าจะมีคนดูหนังสยองขวัญใน 30 วันที่ผ่านมาชัดเจนหรือไม่ว่าพวกเขารักหนังสยองขวัญ
Jonathan Christensen

เมื่อคุณพูดว่า "เป็นอิสระตามเงื่อนไข" ฉันเดาว่าคุณหมายถึงว่า P (B) แต่ละคน (เช่นรักหนังสยองขวัญและเป็นเจ้าของแมว) ไม่เกี่ยวข้องกันใช่ไหม ถ้าเป็นเช่นนั้นตัวแปรการเป็นเจ้าของแมวจะไม่ขึ้นอยู่กับความรักในหนังสยองขวัญหรือไม่?
user1626730

ใช่คุณสามารถโต้แย้งว่าการเป็นเจ้าของแมวนั้นเป็นอิสระจากความรักในหนังสยองขวัญ แม้ว่ามันอาจจะไม่ใช่ผู้หญิงที่มีแนวโน้มที่จะรักแมวและมีแนวโน้มที่จะรักภาพยนตร์สยองขวัญน้อยกว่า
Jonathan Christensen

อืมฉันไม่แน่ใจว่าคุณหมายถึงอะไรโดยการเพิ่มบิตเกี่ยวกับผู้หญิงและแมว คุณช่วยอธิบายเพิ่มเติมได้ไหม
user1626730
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.