ทำไมการเพิ่มเอฟเฟกต์ความล่าช้าจึงเพิ่มความเบี่ยงเบนในโมเดลลำดับชั้นแบบเบย์?


14

ข้อมูลประกอบ:ขณะนี้ฉันกำลังทำงานเปรียบเทียบรูปแบบลำดับชั้นแบบเบย์ต่างๆ ข้อมูลyijมีตัวเลขของการวัดเป็นอยู่ที่ดีสำหรับผู้เข้าร่วมiและเวลาที่ jjฉันมีผู้เข้าร่วมประมาณ 1,000 คนและผู้สังเกตการณ์ 5 ถึง 10 คนต่อผู้เข้าร่วม

เช่นเดียวกับชุดข้อมูลระยะยาวส่วนใหญ่ฉันคาดหวังว่าจะเห็นรูปแบบความสัมพันธ์อัตโนมัติซึ่งการสังเกตที่ใกล้เวลาจะมีความสัมพันธ์มากกว่ารูปแบบอื่น ๆ ลดความซับซ้อนของบางสิ่งบางอย่างโมเดลพื้นฐานมีดังนี้:

yijN(μij,σ2)

ฉันกำลังเปรียบเทียบรุ่นที่ไม่มีความล่าช้า:

μij=β0i

ด้วยความล่าช้าแบบ:

μij=β0i+β1(yi(j1)β0i)

β0iβ1yi0

ผลลัพธ์ที่ฉันได้รับบ่งชี้ว่า:

  • พารามิเตอร์ lag มีค่าประมาณ. 18, 95% CI [.14, .21] คือมันไม่ใช่ศูนย์
  • ความเบี่ยงเบนเฉลี่ยและ DIC เพิ่มขึ้นหลายร้อยเมื่อความล่าช้ารวมอยู่ในโมเดล
  • การตรวจสอบการคาดการณ์หลังแสดงให้เห็นว่าการรวมเอฟเฟกต์ความล่าช้าแบบจำลองสามารถกู้คืนความสัมพันธ์อัตโนมัติในข้อมูลได้ดีขึ้น

ดังนั้นโดยสรุปพารามิเตอร์ lag ที่ไม่เป็นศูนย์และการตรวจสอบการทำนายหลังแนะนำโมเดล lag จะดีกว่า ยังหมายถึงความเบี่ยงเบนและ DIC แนะนำว่าแบบจำลองความล่าช้านั้นดีกว่า ปริศนานี้ฉัน

ประสบการณ์ทั่วไปของฉันคือถ้าคุณเพิ่มพารามิเตอร์ที่มีประโยชน์อย่างน้อยก็ควรลดความเบี่ยงเบนเฉลี่ย (แม้ว่าหลังจากการลงโทษที่ซับซ้อน DIC จะไม่ได้รับการปรับปรุง) นอกจากนี้ค่าศูนย์สำหรับพารามิเตอร์ความล่าช้าจะบรรลุความเบี่ยงเบนเช่นเดียวกับรุ่นที่ไม่มีความล่าช้า

คำถาม

ทำไมการเพิ่มเอฟเฟกต์ความล่าช้าจึงเพิ่มความเบี่ยงเบนในโมเดลลำดับชั้นแบบเบย์แม้ว่าพารามิเตอร์ lag จะไม่เป็นศูนย์และปรับปรุงการตรวจสอบการคาดการณ์หลัง

ความคิดเริ่มต้น

  • ฉันได้ทำการตรวจสอบคอนเวอร์เจนซ์จำนวนมาก(เช่นการดูที่ร่องรอยการตรวจสอบความแปรปรวนในผลเบี่ยงเบนข้ามเครือข่ายและการวิ่งข้าม) และทั้งสองรุ่นดูเหมือนจะมาบรรจบกันที่ด้านหลัง
  • ฉันได้ตรวจสอบโค้ดแล้วโดยที่ฉันบังคับให้เอฟเฟกต์ความล่าช้าเป็นศูนย์และสิ่งนี้ก็กู้คืนความเบี่ยงเบนของโมเดลที่ไม่ล้าหลัง
  • ฉันยังดูที่ค่าเบี่ยงเบนมาตรฐานลบค่าปรับซึ่งควรให้ค่าเบี่ยงเบนตามค่าที่คาดไว้และสิ่งเหล่านี้ก็ทำให้แบบจำลองความล่าช้าปรากฏแย่ลงด้วย
  • β0i
  • อาจมีปัญหาบางอย่างเกี่ยวกับวิธีที่ฉันประเมินจุดเวลาโดยนัยก่อนการสังเกตครั้งแรก
  • บางทีความล่าช้าในข้อมูลนี้อาจไม่ดีพอ
  • ฉันพยายามประเมินรูปแบบการใช้ liklihood สูงสุดใช้กับlme correlation=corAR1()ค่าประมาณของพารามิเตอร์ lag นั้นคล้ายกันมาก ในกรณีนี้รูปแบบความล่าช้ามีความเป็นไปได้สูงกว่าและ AIC ขนาดเล็ก (ประมาณ 100) มากกว่าแบบไม่มีความล่าช้า (กล่าวคือมันบอกแบบจำลองความล่าช้าได้ดีกว่า) ดังนั้นสิ่งนี้จึงเป็นการเสริมแนวคิดที่ว่าการเพิ่มความล่าช้าควรลดความเบี่ยงเบนในโมเดลเบย์
  • อาจมีบางสิ่งที่พิเศษเกี่ยวกับสิ่งที่เหลืออยู่แบบเบย์ หากตัวแบบล้าหลังใช้ความแตกต่างระหว่างคำทำนายกับ y จริง ณ จุดเวลาก่อนหน้าปริมาณนี้จะไม่แน่นอน ดังนั้นผลความล่าช้าจะดำเนินการในช่วงเวลาที่น่าเชื่อถือของค่าที่เหลือดังกล่าว

คุณบอกว่าพารามิเตอร์ lag มีค่าประมาณ. 18 คุณเรียนรู้พารามิเตอร์ล่าช้าหรือไม่ ถ้าใช่คุณเคยใช้อะไรมาก่อน
ประชุมสุดยอด

N(β0i,σ2)

คำตอบ:


1

นี่คือความคิดของฉัน:

  • แทนที่จะเป็น DIC, BIC, AIC ฉันแนะนำให้ทำงานโดยตรงกับความเป็นไปได้เล็กน้อย (หรือที่เรียกว่าหลักฐาน ) ถ้าคุณสามารถจ่ายได้ ยิ่งมีหลักฐานมากเท่าไหร่ก็ยิ่งมีโอกาสมากขึ้นเท่านั้นที่จะเป็นคลาสโมเดลของคุณ มันอาจไม่ได้สร้างความแตกต่างมากนัก แต่ DIC, BIC, AIC นั้นเป็นเพียงการประมาณเท่านั้น
  • 0.18
  • ไปอีกขั้นหนึ่ง: ทำตัวแบบที่ไม่คำนึงถึงความล่าช้า (c) และคำนวณความเป็นไปได้ที่จะเกิดขึ้น จากนั้นให้นำคลาสโมเดลของคุณ (d) ที่รวมเอฟเฟกต์ความล่าช้าและมีพารามิเตอร์ก่อนหน้ากับความล่าช้า คำนวณความเป็นไปได้ที่ขอบของ (d) คุณจะคาดหวังว่า (ง) มีขนาดใหญ่น่าจะร่อแร่ แล้วถ้าคุณทำไม่ได้ล่ะ:

    (1) ความเป็นไปได้เล็กน้อยที่จะพิจารณาระดับโมเดลโดยรวม ซึ่งรวมถึงเอฟเฟกต์ความล่าช้าจำนวนพารามิเตอร์ความน่าจะเป็นก่อนหน้านี้

    (2) การเปรียบเทียบแบบจำลองที่มีจำนวนพารามิเตอร์ที่แตกต่างกันจะละเอียดอ่อนอยู่เสมอหากมีความไม่แน่นอนอย่างมากในก่อนหน้าของพารามิเตอร์เพิ่มเติม

    (3) หากคุณระบุความไม่แน่นอนในพารามิเตอร์ lag ก่อนหน้าของคุณที่มีขนาดใหญ่เกินสมควรคุณจะลงโทษคลาสโมเดลทั้งหมด

    (4) ข้อมูลที่สนับสนุนความน่าจะเป็นที่เท่าเทียมกันสำหรับความล่าช้าในเชิงลบและความล่าช้าในเชิงบวกคืออะไร ฉันเชื่อว่ามันไม่น่าเป็นไปได้ที่จะสังเกตเห็นความล่าช้าด้านลบและสิ่งนี้ควรรวมอยู่ในก่อนหน้านี้

    (5) ก่อนหน้านี้ที่คุณเลือกใช้กับพารามิเตอร์ lag ของคุณเป็นแบบเดียวกัน โดยทั่วไปจะไม่เป็นตัวเลือกที่ดี: คุณแน่ใจหรือไม่ว่าพารามิเตอร์ของคุณต้องอยู่ภายในขอบเขตที่ระบุ แต่ละค่าความล่าช้าภายในขอบเขตมีโอกาสเท่ากันจริง ๆ หรือไม่? คำแนะนำของฉัน: ไปกับเบต้ากระจาย (ถ้าคุณแน่ใจว่าล่าช้าเป็นที่สิ้นสุดหรือกับระบบปกติถ้าคุณสามารถยกเว้นค่าน้อยกว่าศูนย์

    (6) นี่เป็นตัวอย่างโดยเฉพาะเมื่อการใช้งานของนักบวชที่ไม่ให้ข้อมูลไม่ดี (ดูที่ความเป็นไปได้เล็กน้อย ): คุณมักจะชอบแบบจำลองที่มีพารามิเตอร์ที่ไม่แน่นอนจำนวนน้อย ไม่สำคัญว่าตัวแบบที่ดีหรือไม่ดีจะมีพารามิเตอร์มากขึ้นสามารถทำได้อย่างไร

ฉันหวังว่าความคิดของฉันจะทำให้คุณมีความคิดใหม่คำใบ้?!


ขอบคุณสำหรับเคล็ดลับ เพียงแค่ปัดเศษสิ่งต่างๆออกไปฉันพยายาม จำกัด พารามิเตอร์ lag เพื่อให้ได้ค่าของค่าเฉลี่ยของคนหลัง (เช่น 0.18) รุ่นที่ไม่มีความล่าช้ายังคงมีค่าเบี่ยงเบนเฉลี่ยที่น้อยกว่า
Jeromy Anglim
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.