ข้อมูลประกอบ:ขณะนี้ฉันกำลังทำงานเปรียบเทียบรูปแบบลำดับชั้นแบบเบย์ต่างๆ ข้อมูลมีตัวเลขของการวัดเป็นอยู่ที่ดีสำหรับผู้เข้าร่วมและเวลาที่ jฉันมีผู้เข้าร่วมประมาณ 1,000 คนและผู้สังเกตการณ์ 5 ถึง 10 คนต่อผู้เข้าร่วม
เช่นเดียวกับชุดข้อมูลระยะยาวส่วนใหญ่ฉันคาดหวังว่าจะเห็นรูปแบบความสัมพันธ์อัตโนมัติซึ่งการสังเกตที่ใกล้เวลาจะมีความสัมพันธ์มากกว่ารูปแบบอื่น ๆ ลดความซับซ้อนของบางสิ่งบางอย่างโมเดลพื้นฐานมีดังนี้:
ฉันกำลังเปรียบเทียบรุ่นที่ไม่มีความล่าช้า:
ด้วยความล่าช้าแบบ:
ผลลัพธ์ที่ฉันได้รับบ่งชี้ว่า:
- พารามิเตอร์ lag มีค่าประมาณ. 18, 95% CI [.14, .21] คือมันไม่ใช่ศูนย์
- ความเบี่ยงเบนเฉลี่ยและ DIC เพิ่มขึ้นหลายร้อยเมื่อความล่าช้ารวมอยู่ในโมเดล
- การตรวจสอบการคาดการณ์หลังแสดงให้เห็นว่าการรวมเอฟเฟกต์ความล่าช้าแบบจำลองสามารถกู้คืนความสัมพันธ์อัตโนมัติในข้อมูลได้ดีขึ้น
ดังนั้นโดยสรุปพารามิเตอร์ lag ที่ไม่เป็นศูนย์และการตรวจสอบการทำนายหลังแนะนำโมเดล lag จะดีกว่า ยังหมายถึงความเบี่ยงเบนและ DIC แนะนำว่าแบบจำลองความล่าช้านั้นดีกว่า ปริศนานี้ฉัน
ประสบการณ์ทั่วไปของฉันคือถ้าคุณเพิ่มพารามิเตอร์ที่มีประโยชน์อย่างน้อยก็ควรลดความเบี่ยงเบนเฉลี่ย (แม้ว่าหลังจากการลงโทษที่ซับซ้อน DIC จะไม่ได้รับการปรับปรุง) นอกจากนี้ค่าศูนย์สำหรับพารามิเตอร์ความล่าช้าจะบรรลุความเบี่ยงเบนเช่นเดียวกับรุ่นที่ไม่มีความล่าช้า
คำถาม
ทำไมการเพิ่มเอฟเฟกต์ความล่าช้าจึงเพิ่มความเบี่ยงเบนในโมเดลลำดับชั้นแบบเบย์แม้ว่าพารามิเตอร์ lag จะไม่เป็นศูนย์และปรับปรุงการตรวจสอบการคาดการณ์หลัง
ความคิดเริ่มต้น
- ฉันได้ทำการตรวจสอบคอนเวอร์เจนซ์จำนวนมาก(เช่นการดูที่ร่องรอยการตรวจสอบความแปรปรวนในผลเบี่ยงเบนข้ามเครือข่ายและการวิ่งข้าม) และทั้งสองรุ่นดูเหมือนจะมาบรรจบกันที่ด้านหลัง
- ฉันได้ตรวจสอบโค้ดแล้วโดยที่ฉันบังคับให้เอฟเฟกต์ความล่าช้าเป็นศูนย์และสิ่งนี้ก็กู้คืนความเบี่ยงเบนของโมเดลที่ไม่ล้าหลัง
- ฉันยังดูที่ค่าเบี่ยงเบนมาตรฐานลบค่าปรับซึ่งควรให้ค่าเบี่ยงเบนตามค่าที่คาดไว้และสิ่งเหล่านี้ก็ทำให้แบบจำลองความล่าช้าปรากฏแย่ลงด้วย
- อาจมีปัญหาบางอย่างเกี่ยวกับวิธีที่ฉันประเมินจุดเวลาโดยนัยก่อนการสังเกตครั้งแรก
- บางทีความล่าช้าในข้อมูลนี้อาจไม่ดีพอ
- ฉันพยายามประเมินรูปแบบการใช้ liklihood สูงสุดใช้กับ
lme
correlation=corAR1()
ค่าประมาณของพารามิเตอร์ lag นั้นคล้ายกันมาก ในกรณีนี้รูปแบบความล่าช้ามีความเป็นไปได้สูงกว่าและ AIC ขนาดเล็ก (ประมาณ 100) มากกว่าแบบไม่มีความล่าช้า (กล่าวคือมันบอกแบบจำลองความล่าช้าได้ดีกว่า) ดังนั้นสิ่งนี้จึงเป็นการเสริมแนวคิดที่ว่าการเพิ่มความล่าช้าควรลดความเบี่ยงเบนในโมเดลเบย์ - อาจมีบางสิ่งที่พิเศษเกี่ยวกับสิ่งที่เหลืออยู่แบบเบย์ หากตัวแบบล้าหลังใช้ความแตกต่างระหว่างคำทำนายกับ y จริง ณ จุดเวลาก่อนหน้าปริมาณนี้จะไม่แน่นอน ดังนั้นผลความล่าช้าจะดำเนินการในช่วงเวลาที่น่าเชื่อถือของค่าที่เหลือดังกล่าว