ในทางปฏิบัติเมทริกซ์ความแปรปรวนร่วมแบบสุ่มถูกคำนวณในรูปแบบเอฟเฟกต์ผสมอย่างไร


19

โดยพื้นฐานสิ่งที่ฉันสงสัยว่าโครงสร้างความแปรปรวนร่วมนั้นมีการบังคับใช้แตกต่างกันอย่างไรและวิธีคำนวณค่าภายในเมทริกซ์เหล่านี้อย่างไร ฟังก์ชั่นเช่น lme () ช่วยให้เราสามารถเลือกโครงสร้างที่เราต้องการได้ แต่ฉันชอบที่จะรู้ว่ามันเป็นอย่างไร

พิจารณาผลกระทบเชิงเส้นผสมรุ่นYY=Xβ+Zยู+ε

ที่ไหนและR) นอกจากนี้:ϵ d N ( 0 , R )ยู~dยังไม่มีข้อความ(0,D)ε~dยังไม่มีข้อความ(0,R)

VaR(Y|X,Z,β,ยู)=R

VaR(Y|X,β)=Z'DZ+R=V

เพื่อความง่ายเราจะถือว่าRR=σ2ผมn

โดยพื้นฐานแล้วคำถามของฉันคือ:ประมาณจากข้อมูลสำหรับการกำหนดพารามิเตอร์ต่างๆอย่างไร พูดว่าถ้าเราสมมติว่าเป็นเส้นทแยงมุม (เอฟเฟกต์สุ่มมีความเป็นอิสระ) หรือแปรสภาพอย่างสมบูรณ์ (กรณีที่ฉันสนใจมากขึ้นในขณะนี้) หรือการกำหนดพารามิเตอร์อื่น ๆ อีกมากมาย? มีตัวประมาณ / สมการอย่างง่ายสำหรับสิ่งเหล่านี้หรือไม่? (ไม่ต้องสงสัยเลยว่าจะถูกประเมินซ้ำ ๆ )D DDDD

แก้ไข: จากหนังสือ Variance Components (Searle, Casella, McCulloch 2006) ฉันได้จัดการให้เปล่งประกายต่อไปนี้:

ถ้าดังนั้นองค์ประกอบความแปรปรวนจะได้รับการปรับปรุงและคำนวณดังนี้D=σยู2ผมQ

σยู2(k+1)=ยู^Tยู^σยู2(k)ติดตาม(V-1ZTZ)

σอี2(k+1)=Y'(Y-Xβ^(k)-Zยู^(k))/n

โดยที่และคือการอัพเดตลำดับตามลำดับ U (k)kβ^(k)ยู^(k)k

มีสูตรทั่วไปหรือไม่เมื่อถูกบล็อกในแนวทแยงหรือแปรอย่างเต็มที่? ฉันคาดเดาในกรณีที่มีการปรับพารามิเตอร์อย่างสมบูรณ์การสลายตัวของ Cholesky ใช้เพื่อให้แน่ใจว่ามีความชัดเจนและสมมาตรเป็นบวกD


2
arxiv.org/pdf/1406.5823 (ในการกดที่Journal of Statistics Software ) อาจมีประโยชน์ ...
Ben Bolker

คำตอบ:


8

The Goldstein .pdf @probabilityislogic linked เป็นเอกสารที่ยอดเยี่ยม นี่คือรายการของข้อมูลอ้างอิงบางส่วนที่พูดถึงคำถามเฉพาะของคุณ:

Harville 1976: ขยายของ Gauss-มาร์คอฟทฤษฎีบทที่จะรวมถึงการประมาณค่าของผลการสุ่ม

Harville 1977: ความน่าจะเป็นสูงสุดวิธีการประมาณค่าความแปรปรวนองค์ประกอบและปัญหาที่เกี่ยวข้อง

สกอตแลนด์และ Ware 1982: รุ่นสุ่มผลสำหรับข้อมูลระยะยาว

McCulloch, 1997: อัลกอริธึมโอกาสสูงสุดสำหรับโมเดลเชิงเส้นผสมทั่วไป

ส่วนที่ตัดตอนมาจากคู่มือผู้ใช้ SAS สำหรับกระบวนการ MIXEDมีข้อมูลที่ดีเกี่ยวกับการประมาณค่าความแปรปรวนร่วมและแหล่งข้อมูลอื่น ๆ อีกมากมาย (เริ่มต้นในหน้า 3968)

มีหนังสือคุณภาพจำนวนมากเกี่ยวกับการวิเคราะห์ข้อมูลตามยาว / ซ้ำ แต่นี่เป็นรายละเอียดเกี่ยวกับการนำไปใช้ใน R (จากผู้เขียนlme4และnlme):

Pinheiro และเบตส์ 2000: ผสมผลกระทบในรุ่น S และ S-PLUS

แก้ไข : กระดาษหนึ่งที่เกี่ยวข้องมากขึ้น: Lindstrom และเบตส์ 1988: Newton-Raphson และ EM อัลกอริทึมสำหรับการเชิงเส้นหลากหลายรูปแบบผลข้อมูลซ้ำมาตรการ

แก้ไข 2 : และอื่น: Jennrich และ Schluchter 1986: ไม่สมดุลซ้ำ-มาตรการรุ่นที่มีโครงสร้างเมทริกซ์ความแปรปรวนร่วม


ฉันได้ดูที่ Pinheiro และ Bates โดยเฉพาะตอนที่ 2 (ในทางทฤษฎีและการคำนวณ) แต่ฉันดูเหมือนจะไม่ได้พูดอะไรเลยว่าโครงสร้างความแปรปรวนร่วมนั้นมีการบังคับใช้และประเมินอย่างไร ฉันจะข้ามมันอีกครั้งในไม่ช้า ฉันมีเอกสารเหล่านี้อยู่ที่นี่ฉันจะต้องอ่านอีกครั้ง ไชโย
dcl

1
@dcl มองย้อนกลับไปผ่านบทที่ 2 ของ P & B, ผมไม่เห็นว่าพวกเขาอาจจะ glossing กว่าบางส่วนของขั้นตอนที่คุณมีความสนใจใน (พวกเขาพูดถึงการเพิ่มประสิทธิภาพของการเข้าสู่ระบบโอกาส WRT พารามิเตอร์แปรปรวน แต่ไม่ได้บอกว่าวิธีการ ) ที่ถูกกล่าวว่าส่วน 2.2.8 อาจเป็นส่วนที่ตอบคำถามของคุณดีที่สุด

1
@dcl เพิ่มแหล่งข้อมูลอีกหนึ่งแหล่งที่อาจช่วยได้

ขอบคุณสำหรับลิงค์ ฉันเคยดูเอกสารเหล่านี้ในอดีตที่ผ่านมาบางส่วนได้รับเทคนิคสำหรับฉัน ฉันจะมีอีกหนึ่งการค้นหาผ่านพวกเขาตอนนี้ แต่จากการเหลียวมองครั้งแรกฉันไม่สามารถหาสิ่งที่ฉันต้องการได้
dcl

1
@dcl ขออภัยในผนังของลิงก์ แต่คำถามของคุณคือคำถามที่บุคคลสามารถใช้การบรรยายเต็มรูปแบบสองสามครั้งในการอภิปราย (เป็นคำถามที่ดีมากที่ได้รับการกวาดใต้พรมเมื่อเรียนรู้เกี่ยวกับรูปแบบผสมแบบผสมครั้งแรก) นอกเหนือจากการว่ายผ่านวรรณคดีสิ่งหนึ่งที่คุณสามารถทำได้คือการดูซอร์สโค้ดเพื่อlme4ดูว่ามันเกี่ยวข้องกับการประมาณนี้อย่างไร

7

Harvey Goldsteinไม่ใช่จุดเริ่มต้นที่ดี

เช่นเดียวกับวิธีการประเมินที่ซับซ้อนที่สุดมันแตกต่างกันไปตามแพคเกจซอฟต์แวร์ อย่างไรก็ตามบ่อยครั้งสิ่งที่ทำอยู่ในขั้นตอนต่อไปนี้:

  1. เลือกค่าเริ่มต้นสำหรับ (พูดD 0 ) และR (พูดR 0 ) ตั้งค่าi = 1DD0RR0ผม=1
  2. เงื่อนไขในและR = R ฉัน- 1ประมาณการβและยูและε โทรประมาณการเบต้าฉันและU ฉันและεฉันD=Dผม-1R=Rผม-1βยูεβผมยูผมεผม
  3. เงื่อนไขในและและประมาณการและRเรียกค่าประมาณและคุณ= คุณฉัน ϵ = ϵ ฉัน D R D ฉันR ฉันβ=βผมยู=ยูผมε=εผมDRDผมRผม
  4. ตรวจสอบการบรรจบกัน หากไม่รวมกันให้ตั้งค่าและกลับไปที่ขั้นตอนที่ 2ผม=ผม+1

วิธีที่ง่ายและรวดเร็วหนึ่งวิธีคือ IGLS ซึ่งขึ้นอยู่กับการวนซ้ำระหว่างโพรซีเดอร์กำลังสองน้อยที่สุดสองขั้นและอธิบายรายละเอียดในบทที่สอง ข้อเสียคือมันไม่ทำงานได้ดีสำหรับองค์ประกอบความแปรปรวนใกล้กับศูนย์


ฉันรู้ว่านี่เป็นวิธีการทั่วไป แต่มีการประเมิน D และ R อย่างไรสมการใดบ้างที่ใช้สำหรับโครงสร้างต่างๆ ค่าเริ่มต้นที่ดีคืออะไร ฉันจะตรวจสอบ pdf ตอนนี้ไชโย
dcl

1

บทความต่อไปนี้ให้โซลูชันแบบปิดสำหรับ D:


1

สองอ้างอิงอื่น ๆ ที่อาจเป็นประโยชน์องค์ประกอบความแปรปรวนโดยเซิลและอัลลินช์และวอลช์และพันธุศาสตร์และการวิเคราะห์เชิงปริมาณลักษณะ หนังสือ Lynch and Walsh ให้อัลกอริทึมทีละขั้นตอนถ้าฉันจำได้ถูกต้อง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.