สูตรความน่าจะเป็นสำหรับการแจกแจงหลายตัวแปร - เบอโนลลี


13

ฉันต้องการสูตรสำหรับความน่าจะเป็นของเหตุการณ์ในการแจกแจงแบบ N-Variate Bernoulliได้รับความน่าจะเป็นสำหรับองค์ประกอบเดี่ยวและคู่ขององค์ประกอบ{IJ} ฉันสามารถให้ค่าเฉลี่ยและความแปรปรวนร่วมของกัน P ( X i = 1 ) = p i P ( X i = 1 X j = 1 ) = p i j XX{0,1}nP(Xi=1)=piP(Xi=1Xj=1)=pijX

ฉันได้เรียนรู้แล้วว่ามีอยู่จริงมีคุณสมบัติเช่นเดียวกับการกระจายจำนวนมากที่มีค่าเฉลี่ยและความแปรปรวนร่วมที่กำหนด ฉันกำลังมองหาที่ยอมรับในเช่นเดียวกับ Gaussian คือการกระจายแบบบัญญัติสำหรับและค่าเฉลี่ยและความแปรปรวนร่วมที่กำหนด { 0 , 1 } n R n{0,1}n{0,1}nRn

คำตอบ:


11

ตัวแปรสุ่มที่รับค่าในเป็นตัวแปรสุ่มแบบแยก การกระจายของมันจะถูกอธิบายอย่างเต็มที่โดยน่าจะเป็น กับ n ความน่าจะเป็นและคุณให้เป็นผลรวมของสำหรับบางดัชนี{i}{0,1}npi=P(X=i)i{0,1}npipijpii

ตอนนี้ดูเหมือนว่าคุณต้องการอธิบายโดยใช้และเท่านั้น มันเป็นไปไม่ได้โดยไม่ต้องสมมติว่าคุณสมบัติบางอย่างบน{i}} หากต้องการดูลองที่จะได้รับว่าลักษณะการทำงานของXถ้าเรารับเราจะได้pipipijpiXn=3

Eei(t1X1+t2X2+t3X3)=p000+p100eit1+p010eit2+p001eit3+p110ei(t1+t2)+p101ei(t1+t3)+p011ei(t2+t3)+p111ei(t1+t2+t3)
เป็นไปไม่ได้ที่จะจัดเรียงนิพจน์นี้ใหม่เพื่อให้หายไป สำหรับตัวแปรสุ่ม gaussian ฟังก์ชันคุณสมบัติขึ้นอยู่กับพารามิเตอร์ค่าเฉลี่ยและความแปรปรวนร่วมเท่านั้น ฟังก์ชั่นลักษณะเฉพาะกำหนดการแจกแจงแบบเฉพาะดังนั้นนี่คือสาเหตุที่เกาส์นสามารถอธิบายได้อย่างไม่เหมือนใครโดยใช้ค่าเฉลี่ยและความแปรปรวนร่วมเท่านั้น อย่างที่เราเห็นสำหรับตัวแปรสุ่มนี่ไม่ใช่กรณีpiX

 


10

ดูกระดาษต่อไปนี้:

JL Teugels, การแสดงบางส่วนของหลายตัวแปร Bernoulli และทวินามกระจาย , วารสารการวิเคราะห์หลายตัวแปรฉบับ 32, ไม่มี 2, ก.พ. 1990, 256–268

นี่คือนามธรรม:

Multivariate แต่ vectorized version สำหรับ Bernoulli และการแจกแจงแบบทวินามถูกสร้างขึ้นโดยใช้แนวคิดของผลิตภัณฑ์ Kronecker จากเมทริกซ์แคลคูลัส การแจกแจงตัวแปรหลายตัว Bernoulli เป็นการสร้างแบบจำลองที่กำหนดพารามิเตอร์ซึ่งเป็นทางเลือกสำหรับโมเดลเชิงเส้นล็อกแบบดั้งเดิมสำหรับตัวแปรไบนารี


2
ขอบคุณที่แบ่งปัน Hamed ยินดีต้อนรับสู่เว็บไซต์ของเรา!
whuber

1

ฉันไม่รู้ว่าการกระจายตัวที่เกิดขึ้นนั้นเรียกว่าอะไรหรือแม้กระทั่งมีชื่อ แต่มันก็ทำให้ฉันเห็นได้ชัดว่าวิธีตั้งค่านี้คือคิดว่าแบบจำลองที่คุณจะใช้เป็นแบบจำลอง 2 × 2 × 2 × …× 2 ตารางโดยใช้แบบจำลองการบันทึกเชิงเส้น (ปัวซองการถดถอย) เมื่อคุณทราบว่าการโต้ตอบลำดับที่ 1 เท่านั้นเป็นธรรมดาที่จะถือว่าการโต้ตอบลำดับสูงกว่าทั้งหมดเป็นศูนย์

การใช้รูปแบบของผู้ถามนี่ทำให้แบบจำลอง:

P(X1=x1,X2=x2,,Xn=xn)=i[pixi(1pi)1xij<i(pijpipj)xixj]

สูตรนี้มีปัญหาเกี่ยวกับสัญกรณ์: มีอยู่ทางซ้ายและขวา ด้านขวาทำให้ไม่มีการอ้างอิงที่ทุกห้อย{i} นอกจากนี้ยังคงตีความว่าเป็นความน่าจะเป็น (ในคำถามเดิม) rhs ชัดเจนว่าเป็นบวกในขณะที่ lhs ไม่สามารถบวก pipi
whuber

@whuber ค่อนข้างถูกต้อง! ฉันติดโมเดลที่ฉันกำหนดไว้ในย่อหน้าแรก แต่สมการของฉันถูกทำให้แน่นหลายวิธี ... ไปเพื่อแสดงว่าฉันไม่ได้ใช้การสร้างแบบจำลองเชิงเส้นตรงของตารางฉุกเฉินตั้งแต่ปริญญาโทและฉันไม่ได้ มีโน๊ตหรือหนังสือมาส่ง ฉันเชื่อว่าฉันคงตอนนี้แล้ว แจ้งให้เราทราบหากคุณเห็นด้วย! Apols สำหรับความล่าช้า บางวันสมองของฉันไม่ได้ทำพีชคณิต
onestop

1
ฉันไม่คิดว่ามันจะใช้งานได้ สมมติและเนบราสก้าเจ นี่คือการรวมกันที่ถูกต้องของความน่าจะเป็นเมื่อเป็นตัวแปรสุ่มและและทั้งหมด ยังคงสูตรข้างต้นจะเป็น 0 สำหรับกิจกรรมทั้งหมด ยังคงขอบคุณสำหรับการช่วยเหลือ! P ฉันJ = 0 ฉันJ ฉัน{ 1 , . . , n } X I = 1 X j = 0 j Ipi=1/npij=0ijI{1,...,n}XI=1Xj=0jI
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.