เปรียบเทียบ lme และ lmer


30

ฉันสงสัยว่าถ้าใครสามารถทำให้ฉันเข้าใจถึงความแตกต่างในปัจจุบันระหว่างฟังก์ชั่นทั้งสองนี้ ฉันพบคำถามต่อไปนี้: วิธีการเลือกไลบรารี nlme หรือ lme4 R สำหรับโมเดลเอฟเฟกต์ผสม? แต่วันนั้นมาจากสองสามปีที่ผ่านมา นั่นคืออายุการใช้งานในแวดวงซอฟต์แวร์

คำถามเฉพาะของฉันคือ:

  • มี (ยัง) โครงสร้างความสัมพันธ์ใด ๆlmeที่lmerไม่จัดการ?
  • เป็นไปได้ / แนะนำให้ใช้lmerกับข้อมูลพาเนลหรือไม่

ขออภัยหากสิ่งเหล่านี้ค่อนข้างพื้นฐาน

รายละเอียดเพิ่มเติมเล็กน้อย: ข้อมูลพาเนลคือที่ที่เรามีการวัดหลายรายการในบุคคลเดียวกัน ณ เวลาต่างๆ โดยทั่วไปฉันทำงานในบริบททางธุรกิจซึ่งคุณอาจมีข้อมูลสำหรับลูกค้าซ้ำ / ระยะยาวในช่วงหลายปีที่ผ่านมา เราต้องการอนุญาตให้มีการเปลี่ยนแปลงเมื่อเวลาผ่านไป แต่การปรับตัวแปรดัมมี่ให้ชัดเจนสำหรับแต่ละเดือนหรือปีนั้นไม่มีประสิทธิภาพ อย่างไรก็ตามฉันไม่แน่ใจว่าlmerเป็นเครื่องมือที่เหมาะสมสำหรับข้อมูลประเภทนี้หรือไม่หรือว่าฉันต้องการโครงสร้างความสัมพันธ์อัตโนมัติที่lmeมี


1
คำตอบนั้นยังคงเป็นปัจจุบัน lmerยังคงไม่ได้จัดการกับความหลากหลายของโครงสร้างความสัมพันธ์และความแปรปรวนที่lmeทำและเมื่อฉันเข้าใจสถานการณ์ก็อาจจะไม่
Aaron - Reinstate Monica

@Aaron ขอบคุณสำหรับการตอบกลับ สำหรับส่วนที่สองสิ่งนี้มีผลต่อlmerความสามารถในการจัดการชุดข้อมูลพาเนลหรือไม่ หรือฉันจะหนีไปได้โดยไม่ต้องตั้งสมมติฐานเกี่ยวกับสหสัมพันธ์ที่เฉพาะเจาะจง?
Hong Ooi

3
@ Aaron ฉันไม่รู้เกี่ยวกับ "ไม่เคยจะ" จัดการกับโครงสร้าง corr / var - ฉันสนใจที่จะเพิ่มคุณสมบัติเหล่านี้และไม่คิดว่ามันจะยากขนาดนั้น - แต่ฉันจะบอกว่า "อย่าจับคุณ ลมหายใจ" ฉันไม่คุ้นเคยกับข้อมูลพาเนลที่จะรู้ว่าจะต้องใช้อะไรในlmerการจัดการกับมัน ... ฮองคุณสามารถเพิ่มคำอธิบายสั้น ๆ สำหรับคำถามที่อธิบายคุณสมบัติทางสถิติที่จำเป็นในรายละเอียดเพิ่มเติมเล็กน้อยหรือให้คำแนะนำได้หรือไม่?
Ben Bolker

@BenBolker เพิ่มรายละเอียดบางอย่าง
Hong Ooi

4
ฉันจะบอกว่าlmerจะค่อนข้างดีกับผลแบบสุ่มของปีและผลแบบสุ่มของลูกค้า (สมมติว่าคุณมีเพียงหนึ่งการวัดต่อลูกค้าต่อปี) หากคุณติดตั้งแนวโน้มโดยรวม (ผลคงที่) เวลาที่คุณควรพิจารณาการโต้ตอบแบบเวลาต่อลูกค้า (เช่นลาดสุ่ม) เป็นการดีที่คุณต้องการอนุญาตให้มีการเปลี่ยนแปลงอัตโนมัติเชิงเวลาภายในชุดเวลาของลูกค้าแต่ละคนซึ่งเป็นไปไม่ได้ในขณะนี้กับ lmer แต่คุณสามารถตรวจสอบฟังก์ชั่น autocorrelation ชั่วคราวเพื่อดูว่ามันมีความสำคัญ ...
Ben Bolker

คำตอบ:


15

อัพเดทมิถุนายน 2016:

โปรดดูบล็อกของเบ็นที่อธิบายความคิดปัจจุบันของเขาเกี่ยวกับการทำสิ่งนี้ในlme4: Braindump 1 มิถุนายน 2559

ถ้าคุณชอบวิธีการแบบเบย์ที่brmsแพคเกจของbrmการสนับสนุนโครงสร้างความสัมพันธ์บางอย่างBRMs CRAN หน้า (โดยเฉพาะอย่างยิ่งหมายเหตุ: "ในฐานะของรุ่น brms 0.6.0, โครงสร้าง AR หมายถึงเอฟเฟกต์อัตโนมัติของสารตกค้างเพื่อให้ตรงกับการตั้งชื่อและการใช้งานในแพ็คเกจอื่น ๆ เช่น nlme ก่อนหน้านี้เทอม AR ใน brms เรียกว่า ปัจจุบันมีการตั้งชื่อเอฟเฟกต์ ARR และสามารถสร้างแบบจำลองโดยใช้อาร์กิวเมนต์ r ในฟังก์ชัน cor_arma และ cor_arr ")


ต้นฉบับคำตอบกรกฎาคม 2013:

(แปลงจากความคิดเห็น)

ฉันจะบอกว่าlmerจะค่อนข้างดีกับผลแบบสุ่มของปีและผลแบบสุ่มของลูกค้า (สมมติว่าคุณมีเพียงหนึ่งการวัดต่อลูกค้าต่อปี)

lmer(y~1 + (1|year) + (1|customer), ...)

จะพอดีกับโมเดล (สกัดกั้นเท่านั้น)

YijNormal(a+ϵyear,i+ϵcustomer,j,σ02)
ϵyearϵcustomer

นี่เป็นรูปแบบที่น่าเบื่อคุณอาจต้องการเพิ่มแนวโน้มของเวลาโดยรวม (ผลคงที่) และพิจารณาการโต้ตอบแบบโต้ตอบระหว่างลูกค้าแบบสุ่ม (เช่นความลาดชันแบบสุ่ม) ฉันคิด

lmer(y~year + (1|year) + (year|customer), ...)

YijNormal((a+εลูกค้า,J)+(+εปี×ลูกค้า,J)ปี+εปี,ผม,σ02)

(การใช้yearวิธีนี้เป็นข้อยกเว้นสำหรับกฎปกติที่ไม่รวมตัวแปรอินพุตเนื่องจากทั้งแบบติดตั้งและเอฟเฟกต์แบบสุ่มในรุ่นเดียวกันหากเป็นตัวแปรตัวเลขyearจะได้รับการใช้งานอย่างต่อเนื่องในเอฟเฟกต์คงที่และyear:customer (random) interaction and as categorical in the random effect ...)

แน่นอนคุณอาจต้องการเพิ่มระดับปีระดับลูกค้าและระดับการสังเกตซึ่งจะดูดซับความแปรปรวนที่เกี่ยวข้อง (เช่นเพิ่มดัชนีราคาผู้บริโภคเฉลี่ยเพื่ออธิบายว่าทำไมปีที่ไม่ดีหรือดี ... )

เป็นการดีที่คุณจะต้องการอนุญาตให้มีการเปลี่ยนแปลงอัตโนมัติเชิงเวลาภายในชุดเวลาของลูกค้าแต่ละรายซึ่งเป็นไปไม่ได้ในขณะนี้lmerแต่คุณสามารถตรวจสอบการทำงานอัตโนมัติชั่วคราวเพื่อดูว่ามีความสำคัญหรือไม่ ...

Caveat : ฉันไม่รู้มากเกี่ยวกับวิธีการมาตรฐานสำหรับการจัดการข้อมูลแผง; นี่ขึ้นอยู่กับความรู้ของฉันเกี่ยวกับโมเดลผสมเท่านั้น ผู้แสดงความคิดเห็น (หรือบรรณาธิการ) ควรรู้สึกเป็นอิสระหากสิ่งนี้ดูเหมือนว่าจะเป็นการละเมิดมาตรฐาน / แนวปฏิบัติที่ดีที่สุดในสาขาเศรษฐศาสตร์


Unless this is odd notation - usually XN(μ,σ2) means the marginal distribution of X is normal with mean μ and variance σ2 - I think your equations are not quite right. What you've written are conditional distributions, given the random effects. The marginal distribution of Yij in the first model is
N(a,σ02+σyear2+σcust2)
In the second model the marginal mean is a+byear and the variance is a more complicated expression involving the covariance between the year random slope/intercept plus the other stuff.
Macro

Yep, thanks Ben. In practice there would be fixed effects as well, eg age, sex and all the usual suspects. @Macro: Ben has it right, I believe.
Hong Ooi

@Macro: I think the notation is odd/unusual, but correct (i.e. equivalent to what you suggest.) I've expressed the random effect terms as part of μ. It would probably be clearer/more familiar if I wrote it out in multilevel notation (YNormal(Xβ+Zu,σ2);uMVNormal(0,Σ);Σ=f(θ)).
Ben Bolker


2
I've just posted some stuff I've been working on recently at rawgit.com/bbolker/mixedmodels-misc/master/notes/… ; I'll try to get around to incorporating relevant bits in my answer (alternatively, anyone else is welcome to either post their own answer based on that information, or edit my qestion!)
Ben Bolker

3

To answer your questions directly, and NB this is years after the original post!

  • Yep there are still correlation structures that nlme handles which lme4 will not handle. However, for as long as nlme allows the user to define general corstrs and lme4 does not, this will be the case. This has surprisingly little practical impact. The "big three" correlation structures of: Independent, Exchangeable, and AR-1 correlation structures are easy handled by both packages.

  • It's certainly possible. You can fit panel data with the lm function too! My recommendation about which to use depends on the problem. lme4 is a much smaller tool kit, and the formula representation is a neat, concise way of depicting some very common mixed effects models. nlme is the very large tool box, including a TIG welder to make any tools you need.

You say you want to allow for "variation over time". Essentially, an exchangeable correlation structure achieves this, allowing for a random intercept in each cluster, so that the intracluster variance is the sum of cluster level variation as well as (what you call) variation over time. And this by no means deters you from using fixed effects to obtain more precise predictions over time.


1
Hmm. How can one use AR-1 correlation in lme4?
amoeba says Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.