ฉันตีความคำถามเช่นนี้สมมติว่าการสุ่มตัวอย่างดำเนินการโดยเจตนาราวกับว่าใส่กระดาษขาวจำนวนใบในขวดแต่ละใบมีชื่อกำกับด้วยชื่อของบุคคลหนึ่งคนและคนถูกสุ่มออกมาหลังจากกวนเนื้อหาของโถอย่างละเอียด ก่อนหน้านี้ตั๋วใบมีสีแดง โอกาสที่เป็นสิ่งที่ตรงสองของตั๋วที่เลือกจะเป็นสีแดง? โอกาสที่ตั๋วสองใบส่วนใหญ่จะเป็นสีแดงคืออะไร232 1236323212
สามารถรับสูตรที่แน่นอนได้ แต่เราไม่จำเป็นต้องทำงานทางทฤษฎีมากนัก แต่เราเพียงแค่ติดตามโอกาสเมื่อตั๋วถูกดึงออกจากโถ ในขณะที่ของพวกเขาได้ถูกถอนออกให้โอกาสที่ว่าตั๋วสีแดงได้รับการเห็นเป็นลายลักษณ์อักษรม.) ในการเริ่มต้นโปรดทราบว่าถ้า (คุณไม่มีตั๋วสีแดงก่อนเริ่มใช้งาน) และ (แน่นอนว่าคุณไม่มีตั๋วสีแดง ตอนแรก) ตอนนี้การจับรางวัลครั้งล่าสุดไม่ว่าจะเป็นตั๋วแดงหรือไม่ก็ตาม ในกรณีแรกก่อนหน้านี้เรามีโอกาสที่เห็นอย่างแน่นอนi p ( i , m ) p ( i , 0 ) = 0 i > 0 p ( 0 , 0 ) = 1 p ( i - 1 , m - 1 ) i - 1 363 - m + 1 i ( 12 - i + 1 ) / ( 363 - m + 1 )ม.ผมp ( i , m )p ( i , 0 ) = 0ฉัน> 0p ( 0 , 0 ) = 1p ( i - 1 , m - 1 )ฉัน- 1ตั๋วสีแดง จากนั้นเราก็เกิดขึ้นเพื่อดึงตั๋วสีแดงจากตั๋วที่เหลือทำให้ตั๋วสีแดงจริงๆ เพราะเราถือว่าตั๋วทุกคนมีโอกาสเท่าเทียมกันในทุกขั้นตอนมีโอกาสของการวาดภาพสีแดงแบบนี้เราจึง1) ในอีกกรณีหนึ่งเรามีโอกาสในการได้รับ red tickets อย่างแน่นอนในการจับรางวัลก่อนหน้าและโอกาสที่จะไม่เพิ่มตั๋วสีแดงอีกตัวอย่างในการจับครั้งต่อไปคือ363 - m + 1ผม( 12 - i + 1 ) / ( 363 - m + 1 )i m - 1 ( 363 - m + 1 - 12 + i ) / ( 363 - m + 1 )p ( i , m - 1 )ผมm - 1( 363 - m + 1 - 12 + i ) / ( 363 - m + 1 ). ดังนั้นโดยใช้สัจพจน์พื้นฐานของความน่าจะเป็น (เพื่อปัญญาโอกาสของสองกรณีพิเศษร่วมกันและเพิ่มโอกาสเงื่อนไข)
p ( i , m ) = p ( i - 1 , m - 1 ) ( 12 - i + 1 ) + p ( i , m - 1 ) ( 363 - m + 1 - 12 + i )363 - m + 1.
เราทำซ้ำการคำนวณนี้ซ้ำออกวางเป็นแถวสามเหลี่ยมของค่าของสำหรับและ232 หลังจากการคำนวณเล็กน้อยเราได้รับและตอบคำถามทั้งสองรุ่น ตัวเลขเหล่านี้มีจำนวนน้อย: ไม่ว่าคุณจะมองอย่างไรพวกเขาเป็นเหตุการณ์ที่เกิดขึ้นได้ยาก (หายากกว่าหนึ่งในพัน)0 ≤ i ≤ 12 0 ≤ m ≤ 232 p ( 2 , 232 ) ≈ 0.000849884 p ( 0 , 232 ) + p ( 1 , 232 ) + p ( 2 , 232 ) ≈ 0.000934314p ( i , m )0 ≤ ฉัน≤ 120 ≤ m ≤ 232p ( 2 , 232 ) ≈ 0.000849884p ( 0 , 232 ) + p ( 1 , 232 ) + p ( 2 , 232 ) ≈ 0.000934314
ในการตรวจสอบอีกครั้งฉันทำการออกกำลังกายนี้กับคอมพิวเตอร์ 1,000,000 ครั้ง ใน 932 = 0.000932 ของการทดลองเหล่านี้พบตั๋วสีแดง 2 ใบหรือน้อยกว่า ซึ่งใกล้เคียงกับผลการคำนวณอย่างมากเนื่องจากความผันผวนของการสุ่มตัวอย่างในค่าที่คาดหวังของ 934.3 อยู่ที่ประมาณ 30 (ขึ้นหรือลง) นี่คือวิธีการจำลองใน R:
> population <- c(rep(1,12), rep(0, 363-12)) # 1 is a "red" indicator
> results <- replicate(10^6,
sum(sample(population, 232))) # Count the reds in 10^6 trials
> sum(results <= 2) # How many trials had 2 or fewer reds?
[1] 948
เวลานี้เนื่องจากการทดลองเป็นแบบสุ่มผลลัพธ์จึงเปลี่ยนแปลงเล็กน้อย: พบตั๋วสีแดงสองใบหรือน้อยกว่าใน 948 ของการทดลองล้านครั้ง ที่ยังคงสอดคล้องกับผลทางทฤษฎี)
บทสรุปคือมันไม่น่าเป็นไปได้อย่างมากที่ตั๋วสองใบหรือ 232 ใบจะเป็นสีแดง หากคุณมีกลุ่มตัวอย่างจำนวน 232 คนจาก 363 คนผลลัพธ์นี้เป็นสิ่งบ่งชี้อย่างชัดเจนว่าแบบจำลอง ticket-in-a-jar ไม่ใช่คำอธิบายที่ถูกต้องเกี่ยวกับวิธีการรับตัวอย่าง คำอธิบายทางเลือกรวมถึง (a) ตั๋วสีแดงทำให้ยากต่อการเอาออกจากขวด (เป็น "อคติ" กับพวกเขา) และ (b) ตั๋วถูกสีหลังจากตัวอย่างถูกสังเกต ( สอดแนมข้อมูลหลังการเฉพาะกิจไม่ได้บ่งบอกถึงอคติใด ๆ )
ตัวอย่างของคำอธิบาย (b) ในการดำเนินการจะเป็นคณะลูกขุนสำหรับการพิจารณาคดีฆาตกรรมที่มีชื่อเสียง สมมติว่ามันรวม 363 คน ศาลได้สัมภาษณ์ผู้แทน 232 คน นักข่าวหนังสือพิมพ์ที่มีความทะเยอทะยานอย่างพิถีพิถันตรวจสอบประวัติของทุกคนในสระว่ายน้ำและสังเกตว่า 12 จาก 363 เป็นนักตกปลาทอง แต่เพียงสองคนเท่านั้นที่ถูกสัมภาษณ์ ศาลมีอคติกับนักเล่นปลาทองหรือไม่? อาจจะไม่.