การกระจายความน่าจะเป็นโกศเปลี่ยนไปเมื่อคุณดึงออกมาโดยไม่เปลี่ยนค่าเฉลี่ยหรือไม่


9

สมมติว่าฉันมีโกศที่มีลูกบอลหลากสี N สีและแต่ละสีที่ต่างกันสามารถปรากฏจำนวนครั้งที่แตกต่างกัน (ถ้ามีลูกบอลสีแดง 10 ลูกก็ไม่จำเป็นต้องเป็นลูกบอลสีฟ้า 10 อัน) ถ้าเรารู้เนื้อหาที่แน่นอนของโกศก่อนวาดเราสามารถสร้างการแจกแจงความน่าจะเป็นแบบแยกซึ่งบอกเราถึงความน่าจะเป็นในการวาดลูกบอลแต่ละสี สิ่งที่ฉันสงสัยคือการกระจายตัวเปลี่ยนหลังจากวาดลูก k โดยไม่เปลี่ยนจากโกศโดยเฉลี่ยแล้ว. ฉันเข้าใจว่าเมื่อเราดึงออกมาจากโกศเราสามารถอัปเดตการกระจายด้วยความรู้เกี่ยวกับสิ่งที่ถูกนำออกไป แต่สิ่งที่ฉันอยากรู้คือสิ่งที่เราคาดหวังว่ารูปร่างของการแจกแจงจะเป็นหลังจากที่เราเอาลูก k ออก การกระจายการเปลี่ยนแปลงโดยเฉลี่ยหรือมันยังคงเหมือนเดิมหรือไม่ ถ้ามันไม่เหมือนเดิมเราสามารถเขียนสูตรสำหรับสิ่งที่เราคาดหวังว่าการแจกแจงแบบใหม่จะดูเหมือนโดยเฉลี่ยหลังจากทำการวาด k


1
ฉันอาจจะผิด - แต่นี่เป็นความรู้สึกเหมือนว่ารู้ถึงการกระจายก่อนหน้านี้ แต่ไม่มีข้อมูลเกี่ยวกับความน่าจะเป็น (นอกเหนือจากที่ลูก k ถูกลบ) ในกรณีนั้น - ฉันจะสมมติว่าคนหลังเท่ากับก่อนหน้านี้ เพื่อความเป็นธรรม - มีข้อมูลความน่าจะเป็นที่จำนวนลูกบอลลดลงและ (สำหรับบอลหนึ่งลูกออก) การกระจายจึงเป็นเช่น bimodal ระหว่างความเป็นไปได้ 50% ของสีแดง 9 และ 10 สีดำและ 50% ความเป็นไปได้ของ 10 สีแดงและ 9 สีดำ . ฉันอาจจะผิดที่นี่แม้ว่า
Wouter

สัญชาตญาณของฉันคือมันเป็นเหมือนกรณีหลังที่คุณอธิบาย ฉันไม่สามารถหาใครพูดถึงกระบวนการประเภทนี้ได้
mjnichol

คำตอบ:


7
  1. "การคำนวณโดยตรง": ปล่อยให้มีลูกของสีในโกศ ให้เรามุ่งเน้นไปที่ความน่าจะเป็นในการวาดสีใดสีหนึ่งโดยเฉพาะให้พูดว่าสีขาวบนการจับคู่ที่สอง ให้จำนวนของลูกขาวเป็นn_wให้เป็นสีของลูกบอลที่ได้จากการจับ thnmnwXii

    P(X2=W)=P(X2=W|X1=W)P(X1=W)+P(X2=W|X1=W¯)P(X1=W¯)=nw1n1nwn+nwn1nnwn=nw(nnw+nw1)n(n1)=nwn=P(X1=W)

    แน่นอนว่าอาร์กิวเมนต์เดียวกันนี้ใช้กับสีใด ๆ ในการจับรางวัลครั้งที่สอง เราสามารถใช้อาร์กิวเมนต์ประเภทเดียวกันแบบวนซ้ำได้เมื่อพิจารณาในภายหลัง

    [แน่นอนหนึ่งสามารถทำการคำนวณโดยตรงยิ่งขึ้น พิจารณาดึงครั้งแรกซึ่งประกอบด้วย white ball และ non-white balls (ด้วยความน่าจะเป็นที่กำหนดโดยการแจกแจง hypergeometric) และทำการคำนวณที่สอดคล้องกับการคำนวณแบบง่าย ๆ ข้างบน แต่สำหรับการจับที่ขั้นตอน ; สิ่งหนึ่งได้รับความเรียบง่ายและการยกเลิกที่คล้ายกัน แต่ก็ไม่ได้เป็นความสว่างโดยเฉพาะอย่างยิ่งในการดำเนินการ]kikik+1

  2. อาร์กิวเมนต์ที่สั้นกว่า: พิจารณาการติดฉลากลูกบอลแบบสุ่มด้วยหมายเลขจากนั้นจึงวาดออกตามลำดับที่มีป้ายกำกับ คำถามตอนนี้กลายเป็น "ความน่าจะเป็นที่ฉลากระบุวางอยู่บนลูกบอลสีขาวเหมือนกับความน่าจะเป็นที่ฉลากวางอยู่บนลูกบอลสีขาวหรือไม่"1,2,...,nk1

    ตอนนี้เราเห็นคำตอบต้องเป็น "ใช่" โดยสมมาตรของฉลาก ในทำนองเดียวกันด้วยความสมมาตรของสีลูกมันไม่สำคัญว่าเราจะพูดว่า "สีขาว" ดังนั้นการโต้แย้งว่าฉลากและฉลากมีความน่าจะเป็นแบบเดียวกันกับสีใด ๆ ดังนั้นการกระจายที่การจับ th จึงเหมือนกับการจับครั้งแรกตราบใดที่เราไม่มีข้อมูลเพิ่มเติมจากการจับครั้งก่อน (เช่นตราบเท่าที่ไม่เห็นลูกบอลที่ถูกดึงก่อนหน้านี้)k1k


เกี่ยวข้องอย่างใกล้ชิดกับวิธีที่ 2 ของคุณเป็นอีกหนึ่งข้อโต้แย้งสั้น ๆ : ลองนึกภาพชุดของลำดับที่เป็นไปได้ทั้งหมดที่ลูกบอลสามารถลบออกได้ (เช่นสีน้ำเงินก่อนจากนั้นสีขาวสีขาวและสีขาว ... อาจเป็นลำดับหนึ่ง) หากสำหรับแต่ละลำดับในชุดนี้เราสลับองค์ประกอบและเราเพียงเปลี่ยนชุด ดังนั้นสำหรับลำดับที่มีสีขาว (หรืออะไรก็ตาม) ลูกที่อยู่ในทุกตำแหน่งมีตรงหนึ่งลำดับสอดคล้องกับลูกบอลสีขาวในตำแหน่งที่1ดังนั้นความน่าจะเป็นของลูกบอลสีขาวในตำแหน่งหรือตำแหน่งจะต้องเหมือนกัน ฉันคิดว่านี่เป็นเหตุผลของนีล 1stkthk1k1
Silverfish

@Silverfish ใช่ดูที่มันอาร์กิวเมนต์ที่สองของฉันคือการโต้แย้งแบบเดียวกับอาร์กิวเมนต์การเปลี่ยนรูปของ Neil
Glen_b -Reinstate Monica

ขอบคุณสำหรับคำอธิบาย มันเป็นสิ่งที่ฉันต้องการเห็น!
mjnichol

6

เหตุผลเดียวที่เห็นได้ชัดว่าการกระจายยังคงไม่เปลี่ยนแปลง (หากมีอย่างน้อยหนึ่งลูกเหลือ) คือมีข้อมูลมากเกินไป ลองดึงวัสดุที่เบี่ยงเบนความสนใจออก

ไม่สนใจสักครู่สีของลูกบอลแต่ละลูก มุ่งเน้นไปที่หนึ่งลูก สมมติลูกกำลังจะถูกลบออกสุ่ม (และไม่ได้สังเกต) และจากนั้นเซนต์ลูกจะได้รับการวาดและตั้งข้อสังเกต มันทำให้ไม่แตกต่างกันสิ่งที่สั่งการเลือกเกิดขึ้นในเพื่อให้คุณได้เป็นอย่างดีอาจสังเกตลูกแรกมากวาด (แล้วลบอีกลูกถ้าคุณยืนยัน) เห็นได้ชัดว่าการกระจายยังไม่เปลี่ยนแปลงเพราะจะไม่ได้รับผลกระทบจากการเอาลูกอื่น ๆออกkk+1kk


อาร์กิวเมนต์นี้ - แม้ว่าจะใช้ได้อย่างสมบูรณ์ - อาจทำให้บางคนรู้สึกไม่สบายใจ การวิเคราะห์ต่อไปนี้อาจได้รับการยอมรับว่าเข้มงวดมากขึ้นเพราะไม่ได้ขอให้เราเพิกเฉยต่อคำสั่งคัดเลือก

มุ่งเน้นไปที่ลูกของคุณ มันจะมีความน่าจะเป็นบางอย่างที่จะถูกเลือกเป็นลูกบอลแม้ว่านั้นง่ายต่อการคำนวณ แต่เราไม่จำเป็นต้องรู้คุณค่าของมัน: สิ่งที่สำคัญคือมันจะต้องมีค่าเท่ากันสำหรับลูกบอลแต่ละลูก (เพราะลูกบอลทุกลูกมีค่าเท่ากัน) และมันไม่ใช่ศูนย์ แต่ถ้ามันเป็นศูนย์ไม่มีลูกจะมีความน่าจะเป็นใด ๆ ที่จะถูกเลือก: ดังนั้นตราบใดที่อย่างน้อยหนึ่งซากลูก0pkk+1pkpk0

เอาใจใส่กับสีอีกครั้ง ตามคำนิยามโอกาสที่สีใดสีจะถูกเลือก (หลังจากเอาลูกบอลสุ่มออก) คือผลรวมของโอกาสของลูกบอลสีดั้งเดิมทั้งหมดหารด้วยผลรวมของโอกาสของลูกบอลต้นฉบับทั้งหมด เมื่อแรกเริ่มมีลูกบอลสีและลูกบอลผลรวมค่านั้นคือCkCkCCn

Prk(C)=kcpknpk=kcn.

เมื่อมันไม่ได้ขึ้นอยู่กับ , QEDk<nk


ขอบคุณสำหรับความคิดเห็น มันช่วยให้ฉันเข้าใจกระบวนการพื้นฐานมากขึ้น!
mjnichol

2

ให้การกระจายตัวของการวาดภาพลูกเดียว - หลังจากที่มีการวาดแล้วลูกโดยไม่ต้องเปลี่ยน - มีการกระจายเด็ดขาดได้รับการจัดจำหน่ายมากกว่าการกระจายเด็ดขาดเช่นD_kkE(Dk)Dk

ฉันเดาว่าคุณกำลังถามว่าคงที่หรือไม่E(Dk)

ฉันคิดว่ามันคือ. สมมติว่าคุณวาดลูกบอลทั้งหมดในที่สุด การเรียงสับเปลี่ยนลูกบอลทั้งหมดมีโอกาสเท่ากัน น่าจะเป็นของการวาดภาพเบื้องต้นคือ(D_0) คุณสามารถจัดเรียงตัวเลือกของคุณใหม่เพื่อให้มีการเปลี่ยนแปลงที่เท่าเทียมกันโดยเลือกลูกบอลลูกแรกที่คุณเลือกเป็นคนสุดท้าย ลูกบอลนั้นมีความคาดหวังซึ่งจะต้องเท่ากับเนื่องจากสมมาตร โดยการเหนี่ยวนำเท่ากันทั้งหมดE(D0)E(D1)E(D0)E(Di)


คุณหมายถึงว่าฉันกำลังถามว่าคงที่สำหรับทุก k ใช่ไหม? E(Dk)
mjnichol

@mjnichol ถูกต้อง
Neil G

0

"การกระจายที่คาดหวัง" จะไม่เปลี่ยนแปลง หนึ่งสามารถใช้อาร์กิวเมนต์ martingale! ฉันจะเพิ่มคำตอบดังกล่าวในภายหลัง (ตอนนี้ฉันกำลังเดินทาง)

การแจกแจงแบบมีเงื่อนไขในการดึงก่อนหน้า (สำหรับการจับในภายหลัง) จะเปลี่ยนเฉพาะเมื่อคุณสังเกตการจับการดึงเท่านั้น หากคุณดึงลูกบอลออกจากโกศด้วยมือที่ปิดไว้อย่างแน่นหนาแล้วโยนลูกบอลออกไปโดยไม่สังเกตสีของมัน (ฉันใช้โรงละครดังกล่าวเป็นการสาธิตในชั้นเรียน) การกระจายจะไม่เปลี่ยนแปลง ข้อเท็จจริงนี้มีคำอธิบาย: ความน่าจะเป็นเกี่ยวกับข้อมูลความน่าจะเป็นเป็นแนวคิดของข้อมูล

ดังนั้นความน่าจะเป็นเปลี่ยนแปลงเมื่อคุณได้รับข้อมูลใหม่ (ความน่าจะเป็นตามเงื่อนไขนั่นคือ) การวาดลูกบอลและโยนมันทิ้งไปโดยไม่สังเกตว่ามันไม่ได้ให้ข้อมูลใหม่แก่คุณดังนั้นจึงไม่มีอะไรใหม่ ดังนั้นเมื่อคุณกำหนดเงื่อนไขในชุดข้อมูลจริงที่ไม่ได้เปลี่ยนแปลงดังนั้นการแจกแจงแบบมีเงื่อนไขจะไม่สามารถเปลี่ยนแปลงได้

 EDIT

ตอนนี้ฉันจะไม่ให้รายละเอียดเพิ่มเติมกับคำตอบนี้เพิ่มเพียงหนึ่งการอ้างอิง: Hosam M. Mahmoud: "Pólya Urn Models" (แชปแมนและฮอลล์) ซึ่งปฏิบัติต่อนางแบบโกศเหมือนหนึ่งในคำถามนี้และยังมีโกศทั่วไปอีกมากมาย แบบแผนโดยใช้วิธีการ martingale เพื่อให้ได้ผลลัพธ์ขีด จำกัด แต่วิธีการ martingale ไม่จำเป็นสำหรับคำถามในโพสต์นี้


การกระจาย (สำหรับการจับในภายหลัง) จะไม่เปลี่ยนแปลงแม้ว่าคุณจะสังเกตเห็นการจับ เหตุใดจึงควรสังเกตสิ่งที่เปลี่ยนแปลงอะไร
Neil G

1
@Neil ผมคิดว่าเคอร์วินจะหมายถึงการกระจายเงื่อนไขในการสังเกตดึง
Silverfish

@Silverfish: อ่าเข้าใจแล้ว คุณพูดถูกฉันขอโทษ
Neil G

ฉันจะแก้ไขเพื่อให้ชัดเจนขึ้นเมื่ออยู่ที่บ้านในอีกสองสัปดาห์ สำหรับวันหยุดพักผ่อนใน Venezia ...
kjetil b halvorsen
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.