การติดตั้ง GLOM แบบทวินาม (glmer) กับตัวแปรตอบกลับที่เป็นสัดส่วนหรือเศษส่วน


11

ฉันหวังว่าใครบางคนสามารถช่วยในสิ่งที่ฉันคิดว่าเป็นคำถามที่ค่อนข้างง่ายและฉันคิดว่าฉันรู้คำตอบ แต่ไม่มีการยืนยันมันกลายเป็นสิ่งที่ฉันไม่แน่ใจ

ฉันมีข้อมูลการนับเป็นตัวแปรตอบกลับและฉันต้องการวัดว่าตัวแปรนั้นเปลี่ยนแปลงไปอย่างไรด้วยการมีสัดส่วนของบางสิ่งบางอย่าง

ในรายละเอียดเพิ่มเติมตัวแปรตอบสนองจะนับการมีอยู่ของสปีชีส์ของแมลงในหลาย ๆ ไซต์ดังนั้นตัวอย่างจะถูกสุ่มตัวอย่าง 10 ครั้งและสปีชีส์นี้อาจเกิดขึ้น 4 ครั้ง

ฉันต้องการที่จะดูว่าสิ่งนี้มีความสัมพันธ์กับการปรากฏตัวตามสัดส่วนของกลุ่มพันธุ์พืชใน commmunity โดยรวมของพืชที่เว็บไซต์เหล่านี้

ซึ่งหมายความว่าข้อมูลของฉันมีลักษณะดังนี้ (นี่เป็นเพียงตัวอย่าง)

Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence
1, 5, 10, 0.5
2, 3, 10, 0.3
3, 7, 9, 0.6
4, 0, 9, 0.1

ข้อมูลยังรวมถึงเอฟเฟกต์แบบสุ่มสำหรับตำแหน่ง

ฉันคิดว่าสองวิธีหนึ่งจะเป็นแบบจำลองเชิงเส้น ( lmer) กับแมลงที่แปลงเป็นสัดส่วนเช่น

 lmer.model<-lmer(insectCount/NumberOfInsectSamples~
 ProportionalPlantGroupPresence+(1|Location),data=Data)

ครั้งที่สองจะเป็นแบบทวินาม GLMM ( glmer) เช่น

glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~
 ProportionalPlantGroupPresence+(1|Location),
 data=Data,family="binomial")

ฉันเชื่อว่า binomial glmer เป็นวิธีที่ถูกต้อง แต่ก็ให้ผลลัพธ์ที่แตกต่างกัน ฉันไม่สามารถหาคำตอบที่ชัดเจนบนเน็ตโดยที่ยังไม่รู้สึกไม่แน่ใจเล็กน้อยและต้องการให้แน่ใจว่าฉันไม่ได้ทำผิด

ความช่วยเหลือหรือความเข้าใจด้านวิธีการทางเลือกในเรื่องนี้จะได้รับการชื่นชมมาก


ที่เกี่ยวข้อง: stats.stackexchange.com/questions/87956
อะมีบา

คำตอบ:


19

binomial GLMM น่าจะเป็นคำตอบที่ถูกต้อง

  • โดยเฉพาะอย่างยิ่งกับตัวอย่างจำนวนเล็กน้อยถึงปานกลาง (ตัวอย่างที่ 9 และ 10 ของคุณ) การกระจายตัวของตัวแปรตอบสนองอาจจะเป็นแบบเฮเทอโรซิสติก (ความแปรปรวนจะไม่คงที่และโดยเฉพาะอย่างยิ่งจะขึ้นอยู่กับค่าเฉลี่ยในระบบ) จากปกติในลักษณะที่จะยากที่จะเปลี่ยนไป - โดยเฉพาะอย่างยิ่งถ้าสัดส่วนใกล้เคียงกับ 0 หรือ 1 สำหรับค่าบางอย่างของตัวแปรทำนาย นั่นทำให้ GLMM เป็นความคิดที่ดี
  • คุณควรระมัดระวังในการตรวจสอบ / บัญชีสำหรับการใช้งานเกินขนาด หากคุณมีการสังเกตเพียงครั้งเดียว (เช่นตัวอย่าง / ทวินามเดียวในกรอบข้อมูลของคุณ) ต่อสถานที่หนึ่งเอ(1|Site)ฟเฟกต์แบบสุ่มของคุณจะจัดการกับสิ่งนี้โดยอัตโนมัติ (แม้ว่าดู Harrison 2015 สำหรับบันทึกเตือน)
  • หากสมมติฐานก่อนหน้านี้ถูกต้อง (คุณมีตัวอย่างทวินามเดียวต่อสถานที่) จากนั้นคุณสามารถปรับให้พอดีกับรูปแบบทวินามทั่วไป ( glm(...,family=binomial)- ในกรณีนี้คุณสามารถใช้โมเดล quasibinomial ( family=quasibinomial) เป็นวิธีที่ง่ายกว่าและเป็นทางเลือกอื่น เพื่อบัญชีสำหรับการกระจายเกินเหตุ
  • หากคุณชอบคุณสามารถใส่ GLMM ของคุณให้พอดีกับสัดส่วนเป็นการตอบสนองได้ถ้าคุณตั้งค่าweightsอาร์กิวเมนต์ให้เท่ากับจำนวนตัวอย่าง:

     glmer(insectCount/NumberOfInsectSamples~ProportionalPlantGroupPresence+
           (1|Location),
           weights=NumberofInsectSamples,
           data=Data,family="binomial")

    (สิ่งนี้ควรให้ผลลัพธ์ที่glmer()ตรงกับความต้องการของคุณ)

Harrison, Xavier A. “ การเปรียบเทียบเอฟเฟ็กต์การสังเกตในระดับและแบบจำลองเบต้า - ทวินามสำหรับการสร้างแบบจำลองการกระจายตัวมากเกินไปในข้อมูลทวินามในระบบนิเวศและวิวัฒนาการ ” PeerJ 3 (21 กรกฎาคม 2558): e1114 ดอย: 10.7717 / peerj.1114


สวัสดีเบ็นขอบคุณมากสำหรับคำตอบที่ชัดเจนและครอบคลุม!
ALS
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.