ความเป็นมาของ Normal-Wishart หลัง


11

ฉันทำงานเกี่ยวกับการสืบทอดของ Normal-Wishart หลัง แต่ฉันติดอยู่ที่หนึ่งในพารามิเตอร์ (ด้านหลังของเมทริกซ์ระดับดูที่ด้านล่าง)

สำหรับบริบทและความสมบูรณ์นี่คือแบบจำลองและส่วนที่เหลือของการพิสูจน์:

xiN(μ,Λ)μN(μ0,(κ0Λ)1)ΛW(υ0,W0)

รูปแบบที่ขยายของแต่ละปัจจัยทั้งสามคือ (ขึ้นอยู่กับค่าคงที่สัดส่วน) คือ:

  • โอกาส:

    N(xi|μ,Λ)|Λ|N/2exp(12i=1N(xiTΛxi2μTΛxi+μTΛμ))
  • ปกติก่อนหน้า:

    N(μ|(μ0,κ0Λ)1)|Λ|1/2exp(12(μTκ0Λμ2μTκ0Λμ0+μ0Tκ0Λμ0))
  • Wishart ก่อนหน้า:

    W(Λ|υ0,W0)|Λ|υ0D12exp(12tr(W01Λ))

เราต้องการหลังปกติ - Wishart ( ) ซึ่งสามารถย่อยสลายได้ เช่นเดียวกับ :N ( μ | μ , κ Λ ) W ( Λ | υ , W )μ,Λ|μ,κ,υ,WN(μ|μ,κΛ)W(Λ|υ,W)

ความไร้เดียงสาของเสรีภาพυ

โดยการรวมปัจจัยแรกของความน่าจะเป็นและ Wishart ทำให้เราได้ปัจจัยแรกของปัจจัย Wishart ในหลัง: และดังนั้นเราจึงมีพารามิเตอร์แรกของหลัง: υ=υ0+N

|Λ|υ0+ND12
υ=υ0+N

สเกลแฟกเตอร์κ

เราระบุองค์ประกอบที่ล้อมรอบด้วยและเพื่อค้นหาผู้ที่ก่อนหน้านี้ได้รับการอัปเดตโดยโอกาส: ดังนั้นเราจึงมีพารามิเตอร์ตัวที่สอง: μ κ 0 Λ μ T ( ( κ 0 + N ) Λ ) μ κ ' = κ 0 + NμTμκ0Λ

μT((κ0+N)Λ)μ
κ=κ0+N

Meanμ

พารามิเตอร์ที่สามมาจากการระบุสิ่งที่อยู่ภายใน : ดังนั้นเราจึงได้พารามิเตอร์ที่สาม: 2 μ T ( Λ N ¯ x + κ 0 Λ μ 0 )2μT...

2μT(ΛNx¯+κ0Λμ0)=2μTκΛμ(ΛNx¯+κ0Λμ0)=κΛμ(Nx¯+κ0μ0)=κμ
μ=1k(Nx¯+κ0μ0)

สเกลเมทริกซ์W

และพารามิเตอร์ที่สี่มาจากการทำงานกับพารามิเตอร์ที่เหลือ:

tr(W1Λ)=tr(W01Λ)+i=1NxiTΛxi+μ0Tκ0Λμ0=tr(W01Λ)+i=1Ntr(xiTΛxi)+tr(μ0Tκ0Λμ0)=tr(W01Λ+i=1NxiTΛxi+μ0Tκ0Λμ0)

วิธีที่จะไปจากที่นี่ (ถ้าผมทำผิดพลาดใด ๆ เพื่อให้ห่างไกล) และได้รับการแก้ปัญหามาตรฐาน ?W

แก้ไข 1 :

ตอนนี้เราจัดเรียงเงื่อนไขใหม่เพิ่มและย่อส่วนปัจจัยบางอย่างเพื่อให้ได้สองสี่เหลี่ยมจัตุรัสดังในโซลูชันมาตรฐาน:

tr(W1Λ)=tr(W1Λ+i=1N(xiTΛxi+x¯TΛx¯2xiTΛx¯)+κ0(μ0TΛμ0+x¯TΛx¯2x¯TΛμ0)i=1Nx¯TΛx¯+2i=1NxiTΛx¯κ0x¯TΛx¯+2κ0x¯TΛμ0)=tr(W1Λ+i=1N(xix¯)Λ(xix¯)T+κ0(x¯μ0)Λ(x¯μ0)TNx¯Λx¯T+2Nx¯Λx¯Tκ0x¯Λx¯T+2κ0x¯Λμ0T)

เราลดความซับซ้อนของปัจจัยที่เหลือจากสี่เหลี่ยม:

tr(W1Λ)=tr(W1Λ+i=1N(xix¯)TΛ(xix¯)+κ0(x¯μ0)TΛ(x¯μ0)+(Nκ0)x¯TΛx¯+2κ0x¯TΛμ0)

แก้ไข 2 ( ติดตามด้วยคำตอบของ @bdeonovic )

ร่องรอยคือเป็นวงกลมเพื่อ(CAB) จากนั้น: แล้ว: tr(ABC)=tr(BCA)=tr(CAB)

tr(W1Λ)=tr(W1Λ+i=1N(xix¯)(xix¯)TΛ+κ0(x¯μ0)(x¯μ0)TΛ+(Nκ0)x¯x¯TΛ+2κ0x¯μ0TΛ)
tr(W1)=tr(W1+i=1N(xix¯)(xix¯)T+κ0(x¯μ0)(x¯μ0)T+(Nκ0)x¯x¯T+2κ0x¯μ0T)

เกือบ! แต่ก็ยังไม่ได้มี เป้าหมายคือ:

W1+i=1N(xix¯)(xix¯)T+κ0Nκ0+N(x¯μ0)(x¯μ0)T

คำตอบ:


4

ร่องรอยคือเป็นวงกลมเพื่อ(CAB) นอกจากนี้ยังมีร่องรอยกระจายมากกว่านอกจากนี้เพื่อให้(B) ด้วยข้อเท็จจริงเหล่านี้คุณจะสามารถวนรอบคำไปทางด้านหลังในเงื่อนไขการสืบค้นกลับรวมคำศัพท์การสืบค้นเข้าด้วยกัน ผลลัพธ์ควรมีลักษณะคล้ายtr(ABC)=tr(BCA)=tr(CAB)tr(A+B)=tr(A)+tr(B)Λ

W1=W1+i=1Nxixi+μ0μ0

ขอบคุณ! แต่ผมไม่เห็นว่าจะได้รับจากที่นั่นไปผลมาตรฐาน ( en.wikipedia.org/wiki/Conjugate_prior ) ซึ่งมีและ\ ฉันไม่มีแม้แต่เครื่องหมายลบ: O(xix¯)x¯μ0
alberto

3

โอกาสก่อนคือ ×

|Λ|N/2exp{12(i=1NxiTΛxiNx¯TΛμμTΛNx¯+NμTΛμ)}×|Λ|(ν0D1)/2exp{12tr(W01Λ)}×|Λ|1/2exp{κ02(μTΛμμTΛμ0μ0TΛμ+μ0TΛμ0)}.
สิ่งนี้สามารถเขียนใหม่เป็น เราสามารถเขียนใหม่ได้
|Λ|1/2|Λ|(ν0+ND1)/2×exp{12((κ0+N)μTΛμμTΛ(κ0μ0+Nx¯)(κ0μ0+Nx¯)TΛμ+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ))}
(κ0+N)μTΛμμTΛ(κ0μ0+Nx¯)(κ0μ0+Nx¯)TΛμ+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ)
ดังต่อไปนี้โดยการเพิ่มและลบคำ:
(κ0+N)μTΛμμTΛ(κ0μ0+Nx¯)(κ0μ0+Nx¯)TΛμ+1κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)1κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ).
เส้นบนสองเส้นนี้แยกตัวเป็น
(κ0+N)(μκ0μ+Nx¯κ0+N)TΛ(μκ0μ+Nx¯κ0+N).

การเพิ่มและลบ , ต่อไปนี้: สามารถเขียนใหม่เป็น Nx¯TΛx¯

1κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ)
i=1N(xiTΛxixiTΛx¯x¯TΛxi+x¯TΛx¯)+Nx¯TΛx¯+κ0μ0TΛμ01κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)+tr(W01Λ).
ระยะเวลารวม
i=1N(xiTΛxixiTΛx¯x¯TΛxi+x¯TΛx¯)
เท่ากับ ตอนนี้ สามารถขยายได้
i=1N(xix¯)TΛ(xix¯).
Nx¯TΛx¯+κ0μ0TΛμ01κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)
Nx¯TΛx¯+κ0μ0TΛμ01κ0+N(κ02μ0TΛμ0+Nκ0μ0TΛx¯0+Nκ0x¯TΛμ0+N2x¯TΛx¯),
ซึ่งเท่ากับ
Nκ0κ0+N(x¯TΛx¯x¯TΛμ0μ0TΛx¯+μ0TΛμ0)=Nκ0κ0+N(x¯μ0)TΛ(x¯μ0).

คำสองคำต่อไปนี้เป็นสเกลาร์: และเซนต์คิตส์และเนวิสมีค่าเท่ากับร่องรอยดังนั้น

i=1N(xix¯)TΛ(xix¯),Nκ0κ0+N(x¯μ0)TΛ(x¯μ0).
tr(W01Λ)+i=1N(xix¯)TΛ(xix¯)+Nκ0κ0+N(x¯μ0)TΛ(x¯μ0)
สามารถเขียนใหม่เป็น เนื่องจากผลรวมข้างต้นเท่ากับ
tr(W01Λ)+tr(i=1N(xix¯)TΛ(xix¯))+tr(Nκ0κ0+N(x¯μ0)TΛ(x¯μ0)).
tr(ABC)=tr(CAB)
tr(W01Λ)+tr(i=1N(xix¯)(xix¯)TΛ)+tr(Nκ0κ0+N(x¯μ0)(x¯μ0)TΛ).
การใช้ข้อเท็จจริงที่ว่าเราสามารถเขียนผลรวมเป็น tr(A+B)=tr(A)+tr(B)
tr(W01Λ+i=1N(xix¯)(xix¯)TΛ+Nκ0κ0+N(x¯μ0)(x¯μ0)TΛ)=tr((W01+i=1N(xix¯)(xix¯)T+Nκ0κ0+N(x¯μ0)(x¯μ0)T)Λ).

การรวมทั้งหมดเข้าด้วยกันถ้าเราปล่อยเรามีโอกาสที่ก่อนเท่ากับ S=i=1N(xix¯)(xix¯)T×

|Λ|1/2exp{κ0+N2(μκ0μ+Nx¯κ0+N)TΛ(μκ0μ+Nx¯κ0+N)}×|Λ|(ν0+ND1)/2exp{12tr((W01+S+Nκ0κ0+N(x¯μ0)(x¯μ0)T)Λ)},
ตามที่ต้องการ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.