REML หรือ ML เพื่อเปรียบเทียบโมเดลเอฟเฟกต์ผสมสองแบบที่มีเอฟเฟกต์คงที่แตกต่างกัน แต่มีเอฟเฟกต์แบบสุ่มเหมือนกันหรือไม่


18

พื้นหลัง: หมายเหตุ: ชุดข้อมูลและรหัส r ของฉันรวมอยู่ด้านล่างข้อความ

ฉันต้องการใช้ AIC เพื่อเปรียบเทียบแบบจำลองเอฟเฟกต์สองแบบที่สร้างขึ้นโดยใช้แพ็คเกจ lme4 ในอาร์แต่ละรุ่นมีเอฟเฟกต์คงที่หนึ่งแบบและเอฟเฟกต์แบบสุ่มหนึ่งแบบ เอฟเฟกต์คงที่นั้นแตกต่างกันระหว่างรุ่น แต่เอฟเฟกต์แบบสุ่มยังคงเหมือนเดิมระหว่างรุ่น ฉันพบว่าถ้าฉันใช้ REML = T, model2 มีคะแนน AIC ที่ต่ำกว่า, แต่ถ้าฉันใช้ REML = F, model1 มีคะแนน AIC ที่ต่ำกว่า

รองรับการใช้ ML:

Zuur และคณะ (2009; PAGE 122) แนะนำว่า "ในการเปรียบเทียบโมเดลที่มีเอฟเฟกต์แบบซ้อน (แต่มีโครงสร้างแบบสุ่มเดียวกัน) ต้องใช้การประเมิน ML ไม่ใช่ REML" สิ่งนี้บ่งบอกว่าฉันควรใช้ ML เนื่องจากเอฟเฟกต์แบบสุ่มของฉันเหมือนกันในทั้งสองรุ่น แต่เอฟเฟกต์คงที่ของฉันแตกต่างกัน [Zuur et al. 2552. แบบจำลองเอฟเฟกต์และส่วนขยายในระบบนิเวศน์กับ R. Springer]

การสนับสนุนสำหรับการใช้ REML:

อย่างไรก็ตามฉันสังเกตว่าเมื่อฉันใช้ ML ความแปรปรวนที่เหลือที่เกี่ยวข้องกับเอฟเฟกต์แบบสุ่มนั้นแตกต่างกันระหว่างสองรุ่น (model1 = 136.3; model2 = 112.9) แต่เมื่อฉันใช้ REML มันจะเหมือนกันระหว่างโมเดล (model1 = model2 = 151.5) นี่แปลว่าฉันควรใช้ REML แทนเพื่อให้ความแปรปรวนตกค้างแบบสุ่มยังคงเหมือนเดิมระหว่างรุ่นที่มีตัวแปรสุ่มแบบเดียวกัน

คำถาม:

มันไม่สมเหตุสมผลหรือไม่ที่จะใช้ REML มากกว่า ML สำหรับการเปรียบเทียบรุ่นที่เปลี่ยนเอฟเฟกต์คงที่และเอฟเฟกต์แบบสุ่มยังคงเหมือนเดิมหรือไม่ ถ้าไม่คุณสามารถอธิบายได้ว่าทำไมหรือชี้ให้ฉันไปที่วรรณคดีอื่นที่อธิบายเพิ่มเติมหรือไม่

# Model2 "wins" if REML=T:
REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T)
REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T)
AIC(REMLmodel1,REMLmodel2)
summary(REMLmodel1)
summary(REMLmodel2)

# Model1 "wins" if REML=F:
MLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = F)
MLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = F)
AIC(MLmodel1,MLmodel2)
summary(MLmodel1)
summary(MLmodel2)

ชุดข้อมูล:

Response    Fixed1  Fixed2  Random1
5.20    A   A   1
32.50   A   A   1
6.57    A   A   2
24.77   A   B   3
41.69   A   B   3
34.29   A   B   4
1.80    A   B   4
10.00   A   B   5
15.56   A   B   5
4.44    A   C   6
21.65   A   C   6
9.20    A   C   7
4.11    A   C   7
12.52   B   D   8
0.25    B   D   8
27.34   B   D   9
11.54   B   E   10
0.86    B   E   10
0.68    B   E   11
4.00    B   E   11

2
Faraway's (2006) การขยายโมเดลเชิงเส้นด้วย R (หน้า 156): "เหตุผลก็คือ REML ประมาณการผลกระทบแบบสุ่มโดยพิจารณาจากการรวมกันเชิงเส้นของข้อมูลที่ลบเอฟเฟกต์คงที่หากผลกระทบคงที่เหล่านี้มีการเปลี่ยนแปลง สองรุ่นจะไม่สามารถเทียบเคียงได้โดยตรง "
jvh_ch

แม้ว่า AIC จะเป็นไปได้ตามความรู้ของฉัน แต่มันก็พัฒนาขึ้นเพื่อวัตถุประสงค์ในการทำนาย วิธีการหนึ่งที่จะใช้รูปแบบผสมสำหรับการทำนายว่า?
AdamO

@ Adamo คุณจะแม่นยำมากขึ้น? แบบจำลองแบบผสมผสานที่เหมาะสมสามารถใช้ในการทำนายได้ทั้งในระดับประชากร (ทำนายการตอบสนองสำหรับหน่วยที่ไม่ระบุ / ไม่ทราบโดยการตั้งค่าโหมดตามเงื่อนไข / BLUPs เป็นศูนย์) หรือที่ระดับบุคคล (การคาดการณ์เงื่อนไขในการประมาณค่า ) หากคุณสามารถเจาะจงมากขึ้นนั่นอาจทำให้คำถาม CV ใหม่ดี
Ben Bolker

มันไม่ชัดเจนสำหรับฉันว่าคุณตั้งใจจะใช้โมเดลนี้อย่างไร ไม่มีสิ่งใดในปัญหาที่บ่งบอกว่าการทำนายแบบใดที่ถูกทำขึ้นหรือมีความจำเป็นและถ้าเป็นเช่นนั้นสำหรับวัตถุประสงค์อะไร
AdamO

คำตอบ:


22

Zuur et al. และ Faraway (จากความคิดเห็นของ @ janhove ด้านบน) ถูกต้อง; ใช้วิธีอิงตามความน่าจะเป็น (รวมถึง AIC) เพื่อเปรียบเทียบสองรุ่นที่มีเอฟเฟกต์คงที่ที่ติดตั้งโดย REML โดยทั่วไปจะนำไปสู่เรื่องไร้สาระ


4
ขอบคุณ @janhove, AdamO และ Ben Bolker ฉันพบลิงค์นี้จาก Aaron เพื่อช่วยตอบคำถามนี้ มันบอกว่า "โอกาส REML ขึ้นอยู่กับผลกระทบคงที่ที่อยู่ในรูปแบบและดังนั้นจึงไม่สามารถเทียบเคียงได้หากผลกระทบคงที่มีการเปลี่ยนแปลงโดยทั่วไป REML จะถูกพิจารณาเพื่อให้การประมาณที่ดีขึ้นสำหรับเอฟเฟ็กต์แบบสุ่ม แบบจำลองที่ดีที่สุดของคุณโดยใช้ REML สำหรับการอนุมานและการรายงานขั้นสุดท้ายของคุณ "
มันเป็นตัวเลข

11

ฉันจะยกตัวอย่างเพื่ออธิบายว่าทำไมโอกาส REML ไม่สามารถใช้สำหรับสิ่งต่าง ๆ เช่นการเปรียบเทียบ AIC ลองจินตนาการว่าเราเป็นนายแบบเอฟเฟกต์ผสมปกติ ให้แทนเมทริกซ์การออกแบบและสมมติว่าเมทริกซ์นี้มีอันดับเต็ม เราสามารถหา reparametrization ของพื้นที่ค่าเฉลี่ยที่ได้รับจากเมทริกซ์~ X สองการฝึกอบรมครอบคลุมสเปซเชิงเส้นเดียวกันของR n ดังนั้นคอลัมน์ของ~ Xสามารถเขียนเป็นผลรวมเชิงเส้นของคอลัมน์ของX ดังนั้นเราสามารถหาเมทริกซ์กำลังสอง, Bเช่นนั้นได้XX~RnX~XB

BX~=XB

BXB

V

|V|1/2|X~V1X~|1/2exp((yX~β~)V1(yX~β~)/2) ,

β=(X~V1X~)1yX=X~B

|B||V|1/2||XV1X|1/2|exp((yXβ¯)V1(yXβ¯)/2)

β¯=(XV1X)1y|B|

|B|1

นี่เป็นตัวอย่างของสาเหตุที่ไม่ควรใช้ REML เมื่อเปรียบเทียบรุ่นที่มีเอฟเฟกต์คงที่ต่างๆ อย่างไรก็ตาม REML มักจะประมาณค่าพารามิเตอร์เอฟเฟ็กต์แบบสุ่มที่ดีกว่าดังนั้นบางครั้งจึงแนะนำให้ใช้ ML สำหรับการเปรียบเทียบและ REML สำหรับการประเมินแบบจำลองเดี่ยว (อาจสุดท้าย)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.