ปรีชาญาณเกี่ยวกับการประมาณค่าพารามิเตอร์ในตัวแบบผสม (พารามิเตอร์ความแปรปรวนกับโหมดเงื่อนไข)


15

ฉันได้อ่านหลายครั้งแล้วว่าเอฟเฟกต์แบบสุ่ม (BLUPs / โหมดเงื่อนไขสำหรับ, พูด, ตัวแบบ) ไม่ใช่พารามิเตอร์ของโมเดลเอฟเฟกต์แบบเชิงเส้น แต่สามารถได้มาจากค่าความแปรปรวน / ตัวแปรความแปรปรวนร่วมโดยประมาณ เช่นReinhold Kliegl และคณะ รัฐ(2011) :

เอฟเฟกต์แบบสุ่มคือการเบี่ยงเบนของอาสาสมัครจาก RT เฉลี่ยที่ยิ่งใหญ่และการเบี่ยงเบนของอาสาสมัครจากพารามิเตอร์เอฟเฟกต์คงที่ พวกเขาจะถือว่าเป็นอิสระและกระจายตามปกติด้วยค่าเฉลี่ยของ 0 มันเป็นสิ่งสำคัญที่จะต้องตระหนักว่าผลกระทบแบบสุ่มเหล่านี้ไม่ได้เป็น พารามิเตอร์ของ LMM - เพียงผลต่างและความแปรปรวนร่วมของพวกเขาคือ [... ] พารามิเตอร์ LMM ร่วมกับข้อมูลของอาสาสมัครสามารถใช้เพื่อสร้าง“ การคาดการณ์” (โหมดตามเงื่อนไข) ของเอฟเฟกต์แบบสุ่มสำหรับแต่ละเรื่อง

ใครสามารถให้คำอธิบายที่เข้าใจง่ายว่าพารามิเตอร์ความแปรปรวน (ร่วม) ของเอฟเฟกต์แบบสุ่มสามารถประมาณได้โดยไม่ต้องใช้ / ประเมินผลของการสุ่ม

คำตอบ:


6

พิจารณาเชิงเส้นอย่างง่ายรูปแบบผสมเช่นรูปแบบการตัดแบบสุ่มที่เราประมาณการขึ้นของที่บนxในวิชาที่แตกต่างกันและคิดว่าแต่ละเรื่องมีการสกัดกั้นการสุ่มของตัวเอง: Y = + x + ฉัน + ε นี่ดักฉันย่อมมาจากการกระจายแบบเกาส์ฉัน ~ N ( 0 , τ 2 )และสุ่มเสียงยังเป็นแบบเกาส์ε ~ N ( 0 , σ 2Yx

Y=a+x+ผม+ε.
ผม
ผม~ยังไม่มีข้อความ(0,τ2)
ในไวยากรณ์รุ่นนี้จะได้รับการเขียนเป็น
ε~ยังไม่มีข้อความ(0,σ2).
lme4y ~ x + (1|subject)

มันเป็นคำแนะนำในการเขียนข้างต้นดังต่อไปนี้:

y~ยังไม่มีข้อความ(a+x+,σ2)~ยังไม่มีข้อความ(0,τ2)

นี่เป็นวิธีที่เป็นทางการมากขึ้นในการระบุรูปแบบความน่าจะเป็นแบบเดียวกัน จากสูตรนี้เราสามารถเห็นได้โดยตรงว่าเอฟเฟ็กต์แบบสุ่มไม่ใช่ "พารามิเตอร์": มันเป็นตัวแปรสุ่มที่ไม่ได้สังเกตเห็น แล้วเราจะประมาณค่าพารามิเตอร์ความแปรปรวนโดยไม่ทราบค่าของc ได้อย่างไร?ผม

โปรดทราบว่าสมการแรกข้างต้นอธิบายเงื่อนไขการกระจายของได้รับค ถ้าเรารู้ว่าการกระจายของและY | แล้วเราสามารถทำงานออกที่ไม่มีเงื่อนไขการกระจายของYโดยการบูรณาการมากกว่าค คุณอาจจะรู้ว่ามันเป็นกฎหมายของความน่าจะเป็นทั้งหมด หากการแจกแจงทั้งคู่เป็นแบบเกาส์เซียนการแจกแจงแบบไม่มีเงื่อนไขที่เกิดนั้นก็คือแบบเกาส์เซียนYY|Y

ยังไม่มีข้อความ(a+x,σ2+τ2)nY

yN(a+bx,Σ)
Σ=σ2ผมn+τ2ผมยังไม่มีข้อความ1Mσ2τ2ผม

aτ2σ2ผมผม


1
Y~ยังไม่มีข้อความ(a+x,σ2ผม)
Y~ยังไม่มีข้อความ(a+x,Σ)
Sextus Empiricus


ฉันคิดว่าฉันไม่ได้รับขั้นตอนการรวมระบบ ในฐานะที่เป็น @Martijn Weterings ชี้ให้เห็นตัวอย่าง (รหัส R) หรือการอ้างอิงหนึ่งสามารถพบว่ามันจะดี!
statmerkur

ขอบคุณที่ยอมรับคำตอบของฉันและมอบรางวัลให้แก่ @statmerkur แต่มันก็แย่เกินไปที่มันจะไม่ชัดเจน ฉันจะพยายามคิดถึงตัวอย่าง ฉันจะ ping คุณเมื่อฉันอัปเดตคำตอบ
อะมีบาพูดว่า Reinstate Monica

@statmerkur ในคำตอบสำหรับคำถามนี้ฉันแสดงให้เห็นถึงการคำนวณแบบจำลองเอฟเฟกต์แบบแมนนวล (ด้วยตนเองในแง่ของการเขียนฟังก์ชั่นความน่าจะเป็นการเพิ่มประสิทธิภาพยังทำโดยฟังก์ชั่นการเพิ่มประสิทธิภาพมาตรฐานใน R) stats.stackexchange.com/a/ 337348/164061
Sextus Empiricus

0

คุณสามารถประมาณค่าความแปรปรวนและพารามิเตอร์ความแปรปรวนร่วมได้อย่างง่ายดายโดยไม่ต้องอาศัยเอฟเฟกต์แบบสุ่มโดยใช้เอฟเฟกต์คงที่ (ดูที่นี่สำหรับการอภิปรายเอฟเฟกต์คงที่และเอฟเฟ็กต์แบบสุ่ม;

เอฟเฟกต์คงที่สามารถทำได้ง่าย ๆ โดยการเพิ่มตัวแปรตัวบ่งชี้ (ไบนารี) สำหรับแต่ละกลุ่ม (หรือแต่ละช่วงเวลาหรือสิ่งที่คุณคิดว่าจะใช้เป็นเอฟเฟกต์แบบสุ่มซึ่งเทียบเท่ากับการแปลงภายใน) สิ่งนี้ช่วยให้คุณสามารถประเมินผลกระทบคงที่ได้อย่างง่ายดาย (ซึ่งสามารถดูได้เป็นพารามิเตอร์)

สมมติฐานผลกระทบคงที่ไม่ต้องการให้คุณทำการสันนิษฐานจากการกระจายของผลกระทบคงที่คุณสามารถประเมินความแปรปรวนของผลกระทบคงที่ได้อย่างง่ายดาย (แม้ว่าเสียงนี้จะดังมากหากจำนวนการสังเกตภายในแต่ละกลุ่มมีขนาดเล็ก อคติสำหรับค่าใช้จ่ายของความแปรปรวนที่ใหญ่กว่ามากเมื่อเทียบกับเอฟเฟ็กต์แบบสุ่มเพราะคุณสูญเสียอิสรภาพหนึ่งระดับสำหรับแต่ละกลุ่มผ่านการเพิ่มตัวแปรตัวบ่งชี้เหล่านี้) คุณยังสามารถประมาณค่าความแปรปรวนร่วมระหว่างชุดเอฟเฟกต์คงที่หรือชุดเอฟเฟกต์คงที่และชุดอื่น ๆ เราได้ทำสิ่งนั้นในบทความที่เรียกว่าCompetitive Balance และ Assortative Matching ใน German Bundesligaเพื่อประเมินว่านักฟุตบอลที่ดีกว่าเล่นมากขึ้นสำหรับทีมที่ดีกว่าหรือไม่

ผลกระทบแบบสุ่มจำเป็นต้องมีสมมติฐานก่อนหน้าเกี่ยวกับความแปรปรวนร่วม ในโมเดลสุ่มเอฟเฟกต์แบบคลาสสิกคุณถือว่าการสุ่มเอฟเฟ็กต์เป็นเหมือนข้อผิดพลาดและเป็นอิสระจาก covariates อื่น ๆ (เพื่อให้คุณสามารถละเว้นพวกมันและใช้ OLS และรับการประมาณค่าที่ไม่มีประสิทธิภาพสำหรับพารามิเตอร์อื่น ๆ ของโมเดลสุ่มเอฟเฟกต์ถือเป็นจริง)

นอกจากนี้ข้อมูลทางเทคนิคเพิ่มเติมสามารถใช้ได้ที่นี่ Andrew Gelman ยังมีงานที่ใช้งานง่ายมากขึ้นเกี่ยวกับเรื่องนี้ในหนังสือที่ดีของเขาการวิเคราะห์ข้อมูลโดยใช้การถดถอยและโมเดลหลายระดับ / ลำดับชั้น


1
ฉันหมายถึงพารามิเตอร์ความแปรปรวน (co) ของเอฟเฟกต์แบบสุ่ม (ดูการแก้ไขของฉัน)
statmerkur

2
ฉันไม่คิดว่านี่จะตอบคำถามได้
อะมีบาพูดว่า Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.