สิ่งนี้อาจชัดเจนขึ้นโดยการเขียนสูตรโมเดลสำหรับแต่ละโมเดลทั้งสามนี้ ให้เป็นข้อสังเกตสำหรับ person iในไซต์jในแต่ละรุ่นและกำหนดA i j , T i j แบบอะนาล็อกเพื่ออ้างอิงตัวแปรในโมเดลของคุณYฉันเจผมJAฉันเจ, Tฉันเจ
glmer(counts ~ A + T, data=data, family="Poisson")
เป็นรูปแบบ
เข้าสู่ระบบ( E( Yฉันเจ) ) = β0+ β1Aฉันเจ+ β2Tฉันเจ
ซึ่งเป็นเพียงรูปแบบการถดถอยปัวซองสามัญ
glmer(counts ~ (A + T|Site), data=data, family="Poisson")
เป็นรูปแบบ
เข้าสู่ระบบ( E( Yฉันเจ) ) = α0+ ηj 0+ ηj 1Aฉันเจ+ ηj 2Tฉันเจ
โดยที่เป็นเอฟเฟกต์แบบสุ่มที่ใช้ร่วมกันโดยการสังเกตแต่ละครั้งที่ทำโดยบุคคลจากไซต์j ) )คือα 0สำหรับไซต์ทั้งหมด มีการสุ่มชดเชย ( η J 0ηj=(ηj0,ηj1,ηj2)∼N(0,Σ)jเจผลกระทบสุ่มเหล่านี้จะได้รับอนุญาตให้มีลักษณะร่วมกันได้อย่างอิสระ (คือไม่มีข้อ จำกัด จะทำใน ) ในรูปแบบที่คุณระบุ ในการกำหนดความเป็นอิสระคุณต้องวางมันไว้ในวงเล็บที่แตกต่างกันเช่นทำมัน รุ่นนี้จะถือว่าบันทึกนั้น( E ( Y i j)Σ(A-1|Site) + (T-1|Site) + (1|Site)
log(E(Yij))α0ηj0 ) และมีความสัมพันธ์เชิงเส้นสุ่มที่มีทั้งฉันJ , T ฉันเจAij,Tij
glmer(counts ~ A + T + (T|Site), data=data, family="Poisson")
เป็นรูปแบบ
log(E(Yij))=(θ0+γj0)+θ1Aij+(θ2+γj1)Tij
ดังนั้นตอนนี้มีความสัมพันธ์ "เฉลี่ย" กับA i j , T i j ที่กำหนดโดยเอฟเฟกต์คงที่θ 0 , θ 1 , θ 2แต่ความสัมพันธ์นั้นแตกต่างกันสำหรับแต่ละไซต์และความแตกต่างเหล่านั้น ถูกจับโดยเอฟเฟกต์แบบสุ่มγ j 0 , γ j 1 , γ j 2log(E(Yij))Aij,Tijθ0,θ1,θ2γj0,γj1,γj2. นั่นคือพื้นฐานจะถูกเปลี่ยนแบบสุ่มและความลาดชันของตัวแปรทั้งสองจะถูกเปลี่ยนแบบสุ่มและทุกคนจากไซต์เดียวกันจะแชร์การเปลี่ยนแปลงแบบสุ่มเดียวกัน
T คืออะไร มันเป็นผลแบบสุ่มหรือไม่? ผลคงที่? การทำให้สำเร็จด้วยการใส่ T ในทั้งสองแห่งคืออะไร
เป็นหนึ่งในโควาเรียตของคุณ มันไม่ใช่เอฟเฟกต์แบบสุ่ม -เป็นเอฟเฟกต์แบบสุ่ม มีเอฟเฟกต์คงที่ของ Tที่แตกต่างกันขึ้นอยู่กับเอฟเฟกต์แบบสุ่มที่กำหนดโดย- γ j 1ในโมเดลด้านบน อะไรคือความสำเร็จโดยรวมทั้งผลการสุ่มนี้คือการอนุญาตให้มีความแตกต่างระหว่างเว็บไซต์ในความสัมพันธ์ระหว่าง Tและเข้าสู่ระบบ( E ( Y ฉันเจ ) )TSite
TSite
γj 1Tเข้าสู่ระบบ( E( Yฉันเจ) )
เมื่อใดควรปรากฏบางสิ่งในส่วนลักษณะพิเศษแบบสุ่มของสูตรโมเดล
นี่เป็นเรื่องของสิ่งที่สมเหตุสมผลในบริบทของแอปพลิเคชัน
เกี่ยวกับการสกัดกั้น - คุณควรเก็บการสกัดกั้นไว้ที่นั่นด้วยเหตุผลหลายประการ (ดูเช่นที่นี่ ) Re: การสกัดกั้นแบบสุ่ม, , สิ่งนี้ทำหน้าที่เป็นหลักในการกระตุ้นความสัมพันธ์ระหว่างการสังเกตที่เกิดขึ้นในไซต์เดียวกัน หากมันไม่สมเหตุสมผลที่ความสัมพันธ์ดังกล่าวจะมีอยู่จริงก็ควรจะยกเว้นผลกระทบแบบสุ่มγj 0
เกี่ยวกับการสุ่มลาดแบบจำลองที่มีการสุ่มลาดเท่านั้นและไม่มีความลาดชันคงที่สะท้อนถึงความเชื่อที่ว่าในแต่ละไซต์มีความสัมพันธ์ระหว่างและโควาเรียตของคุณสำหรับแต่ละไซต์ แต่ถ้าคุณเฉลี่ย ผลกระทบในทุกเว็บไซต์แล้วไม่มีความสัมพันธ์ ตัวอย่างเช่นหากคุณมีความชันแบบสุ่มในTแต่ไม่มีความชันคงที่นี่จะเหมือนกับการบอกว่าโดยเฉลี่ยแล้วจะไม่มีผลกระทบ (เช่นไม่มีแนวโน้มทางโลกในข้อมูล) แต่แต่ละคนจะมุ่งไปในทิศทางที่สุ่มตลอดเวลา ซึ่งอาจทำให้รู้สึก อีกครั้งมันขึ้นอยู่กับแอปพลิเคชันเข้าสู่ระบบ( E( Yฉันเจ) )TSite
โปรดทราบว่าคุณสามารถใส่แบบจำลองที่มีและไม่มีเอฟเฟกต์แบบสุ่มเพื่อดูว่าสิ่งนี้กำลังเกิดขึ้นหรือไม่คุณไม่ควรเห็นผลใด ๆ ในโมเดลที่ตายตัว ฉันต้องเตือนคุณว่าการตัดสินใจเช่นนี้มักจะทำได้ดีกว่าโดยอาศัยความเข้าใจในแอปพลิเคชันมากกว่าผ่านการเลือกรุ่น