การออกแบบตัวแบบผสมเอฟเฟกต์พร้อมตัวแปรสุ่มตัวอย่าง


11

ฉันพยายามระบุสูตรสำหรับโมเดลเอฟเฟกต์แบบผสมเชิงเส้น (พร้อมlme4) สำหรับการออกแบบการทดลองของฉัน แต่ฉันไม่แน่ใจว่าฉันทำถูกต้องหรือไม่

การออกแบบ: โดยทั่วไปฉันวัดพารามิเตอร์การตอบสนองในพืช ฉันมีการรักษา 4 ระดับและระดับการชลประทาน 2 ระดับ พืชถูกจัดกลุ่มใน 16 แปลงภายในแต่ละแปลงฉันสุ่ม 4 แปลงย่อย ในแต่ละพล็อตย่อยฉันใช้เวลาสังเกตระหว่าง 15 ถึง 30 (ขึ้นอยู่กับจำนวนพืชที่พบ) นั่นคือมีทั้งหมด 1,500 แถว

ป้อนคำอธิบายรูปภาพที่นี่

ตอนแรกระดับย่อยเป็นเพียงที่นี่เพื่อจุดประสงค์ในการสุ่มตัวอย่าง แต่ฉันคิดว่าฉันต้องการนำมาพิจารณาในรูปแบบ (เป็นตัวแปรระดับ 64) เพราะฉันเห็นว่ามีความแปรปรวนจำนวนมากจากพล็อตย่อยหนึ่งไปอีก แม้ในพล็อตเดียวกัน (มากกว่าความแปรปรวนระหว่างแปลงทั้งหมด)

ความคิดแรกของฉันคือการเขียน:

library(lme4)
fit <- lmer(y ~ treatment*irrigation + (1|subplot/plot), data=mydata)

หรือ

fit <- lmer(y ~ treatment*irrigation + (1|subplot) + (1|plot), data=mydata)

ถูกต้องหรือไม่ ฉันไม่แน่ใจว่าฉันจะต้องรักษาระดับพล็อต / แผนย่อยในสูตรของฉันหรือไม่ ไม่มีผลคงที่มีความสำคัญ แต่ผลกระทบแบบสุ่มมีความสำคัญมาก

คำตอบ:


9

แบบจำลองของคุณควรเขียนเป็น

fit <- lmer(y ~ treatment*irrigation + (1|plot/subplot), data=mydata)

เนื่องจากแผนการย่อยนั้นซ้อนอยู่ภายในไซต์ แม้ว่า(1|plot)+ (1|subplot)จะใช้งานได้หาก subplots มีป้ายกำกับที่ไม่ซ้ำกัน (เช่น 1A, 1B, 1C, ... , 2A, 2B, 2C มากกว่า A, B, C ... , A, B, C) บทหนังสือของฉันจากFox และคณะ สถิติเชิงนิเวศน์อธิบายตัวอย่างของการทำรัง:

บนมืออื่น ๆ ในตัวอย่างเห็บแต่ละเจี๊ยบเกิดขึ้นในเพียงหนึ่งลูกและแต่ละลูกที่เกิดขึ้นในเพียงหนึ่งเว็บไซต์: ข้อกำหนดรูปแบบการ(1 | SITE/BROOD/INDEX)อ่านเป็น“เจี๊ยบ (INDEX) ซ้อนกันภายในลูกซ้อนภายในเว็บไซต์” (1 | SITE) + (1 | SITE:BROOD) + (1 | SITE:BROOD:INDEX)หรือเท่ากัน หากลูกไก่และลูกไก่มีป้ายกำกับที่ไม่ซ้ำกันเพื่อให้ซอฟต์แวร์สามารถตรวจจับการทำรัง(1 | SITE) + (1 | BROOD) + (1 | INDEX)จะทำงานได้เช่นกัน (ไม่ใช้งาน(1 | SITE) + (1 | SITE/BROOD) + (1 | SITE/BROOD/INDEX)มันจะนำไปสู่คำศัพท์ที่ซ้ำซ้อนในแบบจำลอง)

ความคิดอื่น ๆ:

  • ข้อมูลเพิ่มเติมเกี่ยวกับข้อกำหนดการซ้อนและแบบจำลองได้ที่http://glmm.wikidot.com/faq
  • ทรีทเม้นต์เพื่อการชลประทานของคุณมีการจัดระเบียบจริง ๆ ดังที่แสดงในแผนผังด้านบนคือไม่ใช่แบบกระจาย? หรือว่าเพื่อความสะดวกในการนำเสนอแบบกราฟิก ถ้าในอดีตคุณมีการออกแบบการทดลองที่อาจเป็นปัญหา ...
  • เนื่องจากแผนการย่อยซ้อนกันภายในไซต์มันจะเป็นเรื่องปกติอย่างยิ่ง (ตามMurtaugh 2007 นิเวศวิทยา "ความเรียบง่ายและความซับซ้อนในการวิเคราะห์ข้อมูลเชิงนิเวศน์" ) เพื่อใช้พล็อตหมายถึงและวิเคราะห์ข้อมูลในระดับพล็อต
  • สำหรับสิ่งที่คุ้มค่าฉันคิดว่าคุณสามารถไปได้ไกลกว่าและรวมเข้ากับระดับพล็อต จากนั้นคุณสามารถข้ามรูปแบบผสมทั้งหมดและทำlm(y~treatment*irrigation, data=my_aggregated_data)

ขอบคุณสำหรับความช่วยเหลือของคุณ (ฉันมีเวลา 12 ชั่วโมงเพื่อรอที่จะปลดล็อก +50 :( แน่นอนว่าฉันมีข้อสงสัยอย่างมากเกี่ยวกับการตั้งชื่อย่อยของฉัน (4 หรือ 64 ป้ายที่ไม่ซ้ำกัน) รูปถูกต้อง: ชลประทานไม่ใช่ "สุ่ม" โชคไม่ดีที่ฉันเห็นด้วย (พวกเขาบอกฉันว่า: "กว้างเกินไปที่จะทำมันแตกต่างกัน"!) ขอบคุณสำหรับการเชื่อมโยงคำถามอีกหนึ่ง: ฉันได้รับพล็อตที่เหลือไม่ได้ดูดี: รูปทรงกรวย (เช่นนี้: "<") ดูเหมือนว่าสัดส่วนกับค่า Y จะมีวิธีการแก้ไขปัญหานี้ในรูปแบบของรุ่นนี้.
agenis

1
ทางออกที่ชัดเจนที่สุด (และปัญหาที่มักจะแก้ไขปัญหาอื่น ๆ ) คือการแปลงการตอบสนองส่วนใหญ่มักจะเข้าสู่ระบบการแปลง
Ben Bolker
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.