การทดลอง Bernoulli ที่สัมพันธ์กันการกระจายแบบหลายตัวแปรของ Bernoulli?


15

ฉันลดความซับซ้อนของคำถามการวิจัยที่ฉันมีในที่ทำงาน ลองนึกภาพว่าฉันมี 5 เหรียญและขอเรียกให้ประสบความสำเร็จ เหล่านี้เป็นเหรียญที่มีอคติมากโดยมีโอกาสประสบความสำเร็จ p = 0.1 ตอนนี้ถ้าเหรียญเป็นอิสระแล้วได้รับความน่าจะเป็นของอย่างน้อย 1 หัวหรือมากกว่าง่ายมาก 5 ในสถานการณ์สมมติของฉันการทดลอง Bernoulli ของฉัน (การโยนเหรียญ) ไม่เป็นอิสระ ข้อมูลเดียวที่ฉันสามารถเข้าถึงได้คือความน่าจะเป็นของความสำเร็จ (แต่ละอันคือ p = .1) และความสัมพันธ์เชิงทฤษฎีของเพียร์สันในหมู่ตัวแปรไบนารี1(11/10)5

มีวิธีการคำนวณความน่าจะเป็นของความสำเร็จหนึ่งครั้งหรือมากกว่านั้นกับข้อมูลนี้หรือไม่? ฉันกำลังพยายามหลีกเลี่ยงวิธีการจำลองสถานการณ์เนื่องจากผลลัพธ์ทางทฤษฎีเหล่านี้จะถูกใช้เพื่อเป็นแนวทางในความแม่นยำของการศึกษาแบบจำลอง ฉันได้รับการพิจารณาในการกระจายตัวของ Bernoulli หลายตัวแปร แต่ฉันไม่คิดว่าฉันสามารถระบุได้อย่างเต็มที่กับความสัมพันธ์และโอกาสที่จะประสบความสำเร็จเพียงเล็กน้อยเท่านั้น เพื่อนคนหนึ่งของฉันแนะนำให้สร้างแบบเกาส์เกาส์ด้วยเบอเนลลีขอบ (ใช้แพ็คเกจ R copula) จากนั้นใช้pMvdc()ฟังก์ชั่นบนตัวอย่างขนาดใหญ่เพื่อให้ได้ความน่าจะเป็นที่ฉันต้องการ แต่ฉันไม่แน่ใจว่าจะทำอย่างไรกับมัน


การแจกแจงหลายตัวแปรของเบอร์นูลี่ถูกอธิบายไว้ที่นี่: arxiv.org/abs/1206.1874
ทิม

มีองค์ประกอบทางโลกหรือไม่ระหว่างการทดลองหรือพวกเขาทั้งหมดในแบบคู่ขนาน? หากก่อนหน้านี้คุณสามารถตั้งสมมติฐานที่ทำให้เข้าใจง่ายโดยที่นั้นขึ้นอยู่กับโดยที่ให้ลำดับโมเดล Markov ของคุณหรือไม่ trialitrialinn
Zhubarb

คำตอบ:


17

ไม่นี่เป็นไปไม่ได้เมื่อใดก็ตามที่คุณมีสามเหรียญขึ้นไป

กรณีของสองเหรียญ

ก่อนอื่นเรามาดูกันว่าทำไมมันถึงใช้ได้กับสองเหรียญเพราะนี่จะให้สัญชาตญาณว่าอะไรจะแตกในกรณีที่มีเหรียญเพิ่มขึ้น

Letและหมายถึงตัวแปร Bernoulli กระจายสอดคล้องกับกรณีที่สอง ,(Q) ก่อนอื่นให้จำไว้ว่าความสัมพันธ์ของและคือXYXBer(p)YBer(q)XY

corr(X,Y)=E[XY]E[X]E[Y]Var(X)Var(Y),

และเมื่อคุณรู้ระยะขอบคุณก็รู้E[X]E[Y]Var(X)Var(Y)E[XY]XY=1X=1Y=1

E[XY]=P(X=1,Y=1).

p=P(X=1,Y=0)+P(X=1,Y=1)q=P(X=0,Y=1)+P(X=1,Y=1)P(X=1,Y=1)P(X=1,Y=0)P(X=0,Y=0)

P(X=1,Y=0)+P(X=0,Y=1)+P(X=1,Y=1).

Pij=P(X=i,Y=j)

P11

กรณีของสามเหรียญ

6=3+323=877>6

XYZ

Pijk=P(X=i,Y=j,Z=k).

ในกรณีนี้รูปภาพจากด้านบนจะเป็นดังต่อไปนี้:

ป้อนคำอธิบายรูปภาพที่นี่

มิติได้ถูกชนโดยหนึ่ง: จุดสุดยอดสีแดงกลายเป็นขอบหลายสีและขอบที่ครอบคลุมด้วยสี่เหลี่ยมสีน้ำเงินได้กลายเป็นใบหน้าทั้งหมด ที่นี่ระนาบสีฟ้าบ่งบอกว่าเมื่อรู้ระยะขอบแล้วคุณจะรู้ผลรวมของความน่าจะเป็นที่อยู่ภายใน สำหรับหนึ่งในภาพ

P(X=0)=P000+P010+P001+P011,

corr(X,Y)E[XY]

E[XY]=P(X=1,Y=1)=P110+P111.

ดังนั้นนี่ทำให้ข้อ จำกัด บางอย่างเกี่ยวกับการแจกแจงร่วมที่เป็นไปได้ แต่ตอนนี้เราได้ลดการออกกำลังกายไปเป็นแบบฝึกหัดเชิงผสมของการใส่ตัวเลขลงบนจุดยอดของลูกบาศก์ หากไม่มีความกังวลใจเพิ่มเติมขอให้เรามีการแจกแจงร่วมสองรายการซึ่งมีระยะขอบและความสัมพันธ์เหมือนกัน:

ป้อนคำอธิบายรูปภาพที่นี่

1001/2Ber(1/2)

1P0001P000

P111

Ber(1/10)

เหรียญสี่เหรียญขึ้นไป

ในที่สุดเมื่อเรามีมากกว่าสามเหรียญก็ไม่น่าแปลกใจที่เราสามารถปรุงตัวอย่างที่ล้มเหลวเนื่องจากตอนนี้เรามีความคลาดเคลื่อนที่ใหญ่กว่าระหว่างจำนวนพารามิเตอร์ที่จำเป็นในการอธิบายการกระจายข้อต่อและค่าที่เราจัดให้ ความสัมพันธ์

สำหรับจำนวนของเหรียญที่มากกว่าสามเหรียญใด ๆ คุณสามารถพิจารณาตัวอย่างที่มีสามเหรียญแรกประพฤติตามสองตัวอย่างด้านบนและผลลัพธ์ของเหรียญสองใบสุดท้ายนั้นเป็นอิสระจากเหรียญอื่นทั้งหมด


3

การทดลองของ Bernoulli ที่มีความสัมพันธ์กันนั้นนำไปสู่การแจกแจงแบบเบต้า - ทวินามสำหรับผลลัพธ์ที่ถูกนับ คุณควรพารามิเตอร์การกระจายนี้เพื่อให้ค่าสหสัมพันธ์ที่ระบุแล้วคำนวณความน่าจะเป็นที่คุณต้องการ


Beta-binomial ไม่ใช่เพียงแค่ Binomial เท่านั้นที่มีพารามิเตอร์ความน่าจะเป็นที่ประสบความสำเร็จเป็นตัวแปรสุ่มหลังจากเบต้า สิ่งนี้นำไปใช้กับปัญหาของ OP ได้อย่างไร
AG

1
ใช่นั่นคือลักษณะหนึ่งของการแจกแจง นอกจากนี้ยังเป็นหนึ่งในวิธีการแก้ปัญหาของการทดลองที่มีความสัมพันธ์ของ Bernoulli (ดูตัวอย่างเช่นHisakado et al 2006 )
Ben - Reinstate Monica

ดังนั้นจึงเป็น! upvoted
AG

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.