สืบทอดการแจกแจงแบบมีเงื่อนไขของการแจกแจงปกติหลายตัวแปร


114

เรามีเวกเตอร์ปกติหลายตัวแปรSigma) พิจารณาการแบ่งและลงใน YN(μ,Σ)μY

μ=[μ1μ2]
Y=[y1y2]

กับพาร์ติชันที่คล้ายกันของΣเป็น

[Σ11Σ12Σ21Σ22]
จากนั้น(y1|y2=a)การแจกแจงแบบมีเงื่อนไขของพาร์ติชั่นแรกที่ได้รับสองคือ N(μ¯,Σ¯)มีค่าเฉลี่ย
μ¯=μ1+Σ12Σ221(aμ2)
และเมทริกซ์ความแปรปรวนร่วม
Σ¯=Σ11Σ12Σ221Σ21

ที่จริงแล้วผลลัพธ์เหล่านี้มีให้ใน Wikipedia ด้วย แต่ฉันไม่รู้ว่าμ¯และΣ¯มาจากไหน ผลลัพธ์เหล่านี้มีความสำคัญเนื่องจากพวกเขาเป็นสูตรทางสถิติที่สำคัญสำหรับ deriving กรองคาลมาน ใครบ้างจะให้ขั้นตอนที่ได้มาของฉันμ¯และΣ¯ขอบคุณมาก!


24
ความคิดที่จะใช้ความหมายของเงื่อนไขความหนาแน่น(ก)} คุณรู้ไหมว่าข้อต่อเป็นตัวแปรปกติและว่าส่วนปลายเป็นเรื่องปกติแล้วคุณต้องเปลี่ยนค่าและทำพีชคณิตอันไม่พึงประสงค์ หมายเหตุเหล่านี้อาจช่วยได้บ้าง นี่คือหลักฐานที่สมบูรณ์ fY1,Y2fY2f(y1|y2=a)=fY1,Y2(y1,a)fY2(a)fY1,Y2fY2

1
ลิงก์ที่สองของคุณตอบคำถาม (+1) ทำไมไม่คิดว่ามันเป็นคำตอบ @Procrastinator?
gui11aume

1
ฉันไม่ได้ตระหนักถึงมัน แต่ฉันคิดว่าฉันใช้สมการนี้ใน PCA ที่มีเงื่อนไข PCA แบบมีเงื่อนไขจำเป็นต้องมีการแปลงที่คำนวณหาค่าความแปรปรวนร่วมแบบมีเงื่อนไขซึ่งให้ทางเลือกของ A.(IA(AA)1A)Σ
John

@Procrastinator - แนวทางของคุณต้องการความรู้เกี่ยวกับตัวตนของเมทริกซ์วูดเบอรีและความรู้เกี่ยวกับการผกผันบล็อกที่ชาญฉลาด สิ่งเหล่านี้ส่งผลให้พีชคณิตเมทริกซ์ซับซ้อนโดยไม่จำเป็น
ความน่าจะเป็นที่เป็นไปได้

2
@probabilityislogic ที่จริงแล้วผลลัพธ์ได้รับการพิสูจน์ในลิงก์ที่ฉันให้ไว้ แต่มันก็น่านับถือถ้าคุณพบว่ามันซับซ้อนกว่าวิธีอื่น นอกจากนี้ผมก็ไม่ได้พยายามที่จะให้เป็นทางออกที่ดีที่สุดของฉันในการแสดงความคิดเห็น นอกจากนี้ความคิดเห็นของฉันยังอยู่ก่อนหน้าคำตอบของมาโคร (ซึ่งฉันอัปเกรดอย่างที่คุณเห็น)

คำตอบ:


111

คุณสามารถพิสูจน์ได้โดยการคำนวณความหนาแน่นของเงื่อนไขอย่างชัดเจนโดยใช้กำลังดุร้ายเช่นในลิงก์ของ Procrastinator (+1) ในความคิดเห็น แต่ก็มีทฤษฎีบทที่บอกว่าการแจกแจงแบบมีเงื่อนไขทั้งหมดของการแจกแจงแบบหลายตัวแปรตามปกตินั้นเป็นเรื่องปกติ ดังนั้นสิ่งที่เหลืออยู่ก็คือการคำนวณเมทริกซ์ค่าเฉลี่ยและเมทริกซ์ความแปรปรวนร่วม ฉันจำได้ว่าเราได้สิ่งนี้ในคลาสอนุกรมเวลาในวิทยาลัยโดยการกำหนดตัวแปรที่สามอย่างชาญฉลาดและใช้คุณสมบัติของมันเพื่อให้ได้ผลลัพธ์มากกว่าการแก้ปัญหากำลังดุร้ายในลิงค์ (ตราบใดที่คุณพอใจกับพีชคณิตเมทริกซ์) ฉันไปจากความทรงจำ แต่มันเป็นอะไรแบบนี้:


ให้เป็นพาร์ติชั่นแรกและที่สอง ตอนนี้กำหนดโดยที่x 2 z = x 1 + A x 2 A =- Σ 12 Σ - 1 22x1x2z=x1+Ax2A=Σ12Σ221 . ตอนนี้เราสามารถเขียน

cov(z,x2)=cov(x1,x2)+cov(Ax2,x2)=Σ12+Avar(x2)=Σ12Σ12Σ221Σ22=0

ดังนั้นและมี uncorrelated และเนื่องจากพวกเขามีกันปกติพวกเขามีความเป็นอิสระ ตอนนี้เห็นได้ชัดว่าx 2zx2E(z)=μ1+Aμ2ดังนั้นจึงเป็นไปตามนั้น

E(x1|x2)=E(zAx2|x2)=E(z|x2)E(Ax2|x2)=E(z)Ax2=μ1+A(μ2x2)=μ1+Σ12Σ221(x2μ2)

ซึ่งพิสูจน์ส่วนแรก สำหรับเมทริกซ์ความแปรปรวนร่วมทราบว่า

var(x1|x2)=var(zAx2|x2)=var(z|x2)+var(Ax2|x2)Acov(z,x2)cov(z,x2)A=var(z|x2)=var(z)

ตอนนี้เราเกือบจะเสร็จแล้ว:

var(x1|x2)=var(z)=var(x1+Ax2)=var(x1)+Avar(x2)A+Acov(x1,x2)+cov(x2,x1)A=Σ11+Σ12Σ221Σ22Σ221Σ212Σ12Σ221Σ21=Σ11+Σ12Σ221Σ212Σ12Σ221Σ21=Σ11Σ12Σ221Σ21

ซึ่งพิสูจน์ส่วนที่สอง

หมายเหตุ:สำหรับผู้ที่ไม่คุ้นเคยกับพีชคณิตเมทริกซ์ใช้ที่นี่นี้เป็นทรัพยากรที่ดี

แก้ไข:หนึ่งคุณสมบัติที่ใช้ที่นี่สิ่งนี้ไม่ได้อยู่ในตำราอาหารเมทริกซ์ (good catch @FlyingPig) คือคุณสมบัติ 6 ในหน้าวิกิพีเดียเกี่ยวกับเมทริกซ์ความแปรปรวนร่วม:ซึ่งเป็นสองเวกเตอร์สุ่ม ,สำหรับ scalars แน่นอนแต่สำหรับเวกเตอร์พวกมันต่างกันตราบเท่าที่เมทริกซ์จัดเรียงต่างกันv a r ( x + y ) = v a r ( x ) + v a r ( yx,y

var(x+y)=var(x)+var(y)+cov(x,y)+cov(y,x)
cov(X,Y)=cov(Y,X)

ขอบคุณสำหรับวิธีการอันยอดเยี่ยมนี้! มีพีชคณิตเมทริกซ์หนึ่งตัวที่ฉันไม่คุ้นเคยฉันจะหาสูตรสำหรับการเปิดที่ไหน ฉันไม่พบมันในลิงค์ที่คุณส่ง var(x1+Ax2)
หมูบินได้

@ Flyingpig ยินดีต้อนรับ ฉันเชื่อว่านี่เป็นผลมาจากสมการ , รวมกับคุณสมบัติเพิ่มเติมของความแปรปรวนของผลรวมของเวกเตอร์สุ่มที่ไม่ได้เขียนใน Matrix Cookbook - ฉันได้เพิ่มข้อเท็จจริงนี้ลงในคำตอบของฉัน - ขอบคุณสำหรับการจับ ที่! (291),(292)
มาโคร

13
นี่เป็นคำตอบที่ดีมาก (+1) แต่สามารถปรับปรุงได้ในแง่ของการเรียงลำดับของวิธีการ เราเริ่มต้นด้วยการบอกว่าเราต้องการการรวมกันเชิงเส้นของเวกเตอร์ทั้งที่เป็นอิสระ / uncorrelated กับx_2นี้เป็นเพราะเราสามารถใช้ความจริงที่ว่าซึ่งหมายความว่าและ(z) เหล่านี้ในการเปิดนำไปสู่การแสดงออกสำหรับและx_2) ซึ่งหมายความว่าเราควรจะใช้เวลาฉัน ตอนนี้เราต้อง 0 หากz=Cx=C1x1+C2x2x2p(z|x2)=p(z)var(z|x2)=var(z)E(z|x2)=E(z)var(C1x1|x2)E(C1x1|x2)C1=Icov(z,x2)=Σ12+C2Σ22=0Σ22กลับกันเราก็มีC2=Σ12Σ2211}
ความน่าจะเป็นที่เป็นไปได้

1
@jakeoung - ไม่ได้พิสูจน์ว่ามันตั้งค่าเป็นค่านี้เพื่อให้เราได้รับการแสดงออกที่มีตัวแปรที่เราต้องการรู้เกี่ยวกับ C1=I
ความน่าจะเป็นทาง

1
@ jakeoung ฉันยังไม่เข้าใจคำพูดนั้นมากนัก ผมเข้าใจในลักษณะนี้: ถ้าแล้ว 0 ดังนั้นค่าของจึงเป็นมาตราส่วนโดยพลการ ดังนั้นเราจึงตั้งเพื่อความเรียบง่าย cov(z,x2)=0cov(C11z,x2)=C11cov(z,x2)=0C1C1=I
Ken T

6

คำตอบของมาโครนั้นยอดเยี่ยม แต่นี่เป็นวิธีที่ง่ายกว่าซึ่งไม่ต้องการให้คุณใช้ทฤษฎีบทภายนอกใด ๆ เพื่อยืนยันการแจกแจงแบบมีเงื่อนไข มันเกี่ยวข้องกับการเขียนระยะทาง Mahanalobis ในรูปแบบที่แยกตัวแปรอาร์กิวเมนต์สำหรับคำสั่งการปรับอากาศและจากนั้นจึงแยกตัวประกอบความหนาแน่นปกติตามลำดับ


เขียนใหม่ระยะทาง Mahanalobis สำหรับเวกเตอร์แบบมีเงื่อนไข: การสืบทอดนี้ใช้สูตรเมทริกซ์ผกผันที่ใช้Schur complement {21} ก่อนอื่นเราใช้สูตรผกผัน Blockwiseเพื่อเขียนเมทริกซ์ผกผันแปรปรวนดังนี้ΣS=Σ11Σ12Σ221Σ21

Σ1=[Σ11Σ12Σ21Σ22]1=[Σ11Σ12Σ21Σ22],

ที่อยู่:

Σ11=ΣS1 Σ12=ΣS1Σ12Σ221,Σ21=Σ221Σ12ΣS1Σ22=Σ221Σ12ΣS1Σ12Σ221. 

การใช้สูตรนี้เราสามารถเขียนระยะทาง Mahanalobis เป็น:

(yμ)TΣ1(yμ)=[y1μ1y2μ2]T[Σ11Σ12Σ21Σ22][y1μ1y2μ2]=(y1μ1)TΣ11(y1μ1)+(y1μ1)TΣ12(y2μ2)+(y2μ2)TΣ21(y1μ1)+(y2μ2)TΣ22(y2μ2)=(y1(μ1+Σ12Σ221(y2μ2)))TΣS1(y1(μ1+Σ12Σ221(y2μ2)))=(y1μ)TΣ1(y1μ),

ที่อยู่:

μμ1+Σ12Σ221(y2μ2),ΣΣ11Σ12Σ221Σ21.

โปรดทราบว่าผลลัพธ์นี้เป็นผลลัพธ์ทั่วไปที่ไม่ถือว่าปกติของเวกเตอร์สุ่ม มันให้วิธีที่มีประโยชน์ในการกำหนดกรอบระยะทาง Mahanalobis อีกครั้งเพื่อให้มันเป็นรูปแบบสมการกำลังสองที่เกี่ยวกับเวกเตอร์เพียงอันเดียวในการสลายตัว (ที่มีการดูดซึมเข้าสู่เวกเตอร์เฉลี่ยและเมทริกซ์แปรปรวน)


ได้รับการแจกแจงแบบมีเงื่อนไข:ตอนนี้เรามีรูปแบบข้างต้นสำหรับระยะทาง Mahanalobis ที่เหลือก็ง่าย เรามี:

p(y1|y2,μ,Σ)y1p(y1,y2|μ,Σ)=N(y|μ,Σ)y1exp(12(yμ)TΣ1(yμ))=exp(12(y1μ)TΣ1(y1μ))y1N(y1|μ,Σ).

นี่เป็นการพิสูจน์ว่าการแจกแจงแบบมีเงื่อนไขเป็นหลายตัวแปรปกติด้วยเวกเตอร์ค่าเฉลี่ยตามเงื่อนไขที่ระบุและเมทริกซ์ความแปรปรวนแบบมีเงื่อนไข

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.