เมื่อใดควรรวมเอฟเฟกต์แบบสุ่มในโมเดล


9

ฉันใหม่กับการทำโมเดลแบบผสมและฉันสับสนว่ามันเหมาะสมที่จะใช้เอฟเฟกต์แบบสุ่มในการวิเคราะห์ที่ฉันทำหรือไม่ คำแนะนำใด ๆ ที่จะได้รับการชื่นชม.

การศึกษาของฉันคือการทดสอบว่าดัชนีที่พัฒนาขึ้นใหม่ของความอุดมสมบูรณ์ของสัตว์เลี้ยงลูกด้วยนมสามารถทำนายมูลค่าของดัชนีที่สร้างขึ้น แต่มีความเข้มข้นของแรงงานมากขึ้นได้อย่างไร ฉันทำการวัดดัชนีเหล่านี้ในผืนป่าหลาย ๆ ผืนพร้อมกับแปลงหลายผืนในแต่ละผืนป่า

เพราะฉันไม่สนใจผลของแผ่นปะป่าโดยตรงและเนื่องจากแผ่นตัวอย่างของฉันซ้อนอยู่ในแผ่นปะป่าฉันจึงใช้แผ่นปะป่าเป็นผลแบบสุ่ม อย่างไรก็ตามฉันมีคำถามสองสามข้อเกี่ยวกับเรื่องนี้:

ก่อนอื่นฉันรู้ว่าเอฟเฟกต์แบบสุ่มช่วยให้คุณสามารถสรุปผลลัพธ์ของคุณในทุกระดับที่เป็นไปได้ของปัจจัยการสุ่มไม่ใช่เฉพาะที่คุณสุ่มตัวอย่าง แต่สำหรับฉันแล้วการที่จะอนุมานแบบนี้ระดับของคุณจะต้องมีการสุ่มตัวอย่าง? แผ่นปะป่าของฉันไม่ได้สุ่มตัวอย่างแล้วฉันจะยังสามารถใช้มันเป็นเอฟเฟกต์แบบสุ่มได้หรือไม่?

ประการที่สองฉันได้อ่านว่าคุณสามารถทดสอบได้ว่าจำเป็นต้องมีเอฟเฟกต์แบบสุ่มหรือไม่เช่นการทดสอบอัตราส่วนความน่าจะเป็นเพื่อเปรียบเทียบแบบจำลองที่มีและไม่มีผลกระทบหรือไม่ ฉันได้ทำไปแล้วและมันแสดงให้เห็นว่าแบบจำลองเอฟเฟกต์แบบสุ่มไม่ได้อธิบายข้อมูลรวมถึงแบบจำลองเอฟเฟกต์ถาวรเท่านั้น ปัญหาของฉันเกี่ยวกับเรื่องนี้ก็คือแผนการของฉันยังคงซ้อนกันอยู่ในแผ่นปะป่าและดังนั้นจึงไม่น่าจะเป็นอิสระ ดังนั้นฉันสามารถใช้วิธี LRT นี้เพื่อปรับการยกเว้นเอฟเฟกต์แบบสุ่มหรือฉันยังต้องรวมวิธีการนี้เพื่อใช้ในการพิจารณาความซ้อนกันหรือไม่? และหากฉันสิ้นสุดการลบเอฟเฟกต์แบบสุ่มมีวิธีการตรวจสอบว่าแปลงในแพทช์ป่าสามารถพิจารณาได้อย่างอิสระหรือไม่?

ขอบคุณสำหรับความช่วยเหลือของคุณ!

คนโง่


ฉันคิดว่าสิ่งที่เป็นแนวคิดหลักที่มีเอฟเฟกต์แบบสุ่มคือพวกเขาควรมีขนาดเท่ากันและสามารถแลกเปลี่ยนได้ - นี่คือสิ่งที่ทำให้การอนุมานเกี่ยวกับเอฟเฟ็กต์แบบสุ่มที่ไม่สุ่มตัวอย่างเป็นไปได้ นอกจากนี้คุณควรใช้ความระมัดระวังในการทดสอบ LR เพื่อสุ่มเอฟเฟกต์เนื่องจากอาจมีความไม่แน่นอนอย่างมากเกี่ยวกับองค์ประกอบความแปรปรวนแม้ว่าค่า ML / REML จะเป็นศูนย์หรือใกล้กับศูนย์ก็ตาม
ความน่าจะเป็นทางการที่

ขอบคุณมากสำหรับสิ่งนั้นดังนั้นจะมีวิธีในการออกกำลังกายบ้างไหมถ้ามันจำเป็นต้องเก็บเอฟเฟกต์แบบสุ่มเอาไว้?
jay

จากสิ่งที่ฉันเข้าใจดีที่สุดคืออย่าเปรียบเทียบ LR กับรุ่นที่เหมาะสมโดย REML ตัวอย่างเช่นใน Lmer ของ R คุณควรตั้ง REML = FALSE เมื่อทำ LRT (เป็นค่าเริ่มต้นเป็น TRUE ซึ่งดีกว่าอย่างอื่น)
Wayne

คำตอบ:


6

ดังที่ฉันเข้าใจว่าคุณมีการออกแบบเชิงสังเกตการณ์แบบซ้อน ๆ (พล็อตภายในแพทช์) และความสนใจของคุณอยู่ในความสัมพันธ์ / การถดถอยระหว่างตัวแปรต่อเนื่องสองตัว (ดัชนีทั้งสอง) ขนาดตัวอย่างของคุณคือแพทช์ m xn พล็อต = N การสังเกตคู่ (หรือผลรวมที่เหมาะสมหากไม่สมดุล) ไม่มีการสุ่มที่เหมาะสมเกี่ยวข้อง แต่บางทีคุณสามารถ / ควร / ต้องการที่จะพิจารณาว่า (1) แพทช์ถูกเลือกโดยการสุ่มจากแพทช์ทุกชนิดหรือในบางพื้นที่และจากนั้น (2) พล็อตคือ "สุ่ม" เลือกภายในแต่ละแพทช์

หากคุณเพิกเฉยต่อ Patch แบบสุ่มคุณอาจกำลังปลอมโดยพิจารณาว่าคุณได้สุ่มเลือก N แปลง "อิสระ" โดยไม่มีการบังคับให้เป็น (ในจำนวนหรือชนิด) ในแพทช์ที่เลือก (ก่อนหน้านี้)

ดังนั้นคำถามแรกของคุณ: ใช่นั่นคือสิ่งที่ปัจจัยสุ่มอนุญาต ความถูกต้องของการอนุมานนั้นขึ้นอยู่กับความถูกต้องของข้อสันนิษฐานว่าการเลือกจับจดนั้นเทียบเท่ากับการสุ่มเลือกแพทช์ (เช่นว่าผลลัพธ์ของคุณจะไม่แตกต่างกันหากเลือกชุดฟอเรสต์ป่าที่แตกต่างกัน) นั่นทำให้ข้อ จำกัด ของคุณในพื้นที่ของการอนุมาน: ชนิดของป่าหรือพื้นที่ทางภูมิศาสตร์ที่ผลลัพธ์ของคุณขยายขึ้นอยู่กับประชากรของแพทช์ (จินตภาพ) สูงสุดซึ่งตัวอย่างของคุณเป็นตัวอย่าง "สุ่ม" ที่น่าเชื่อถือ บางทีการสังเกตของคุณอาจเป็นตัวอย่างที่ "สุ่มอย่างสมเหตุสมผล" ของสัตว์เลี้ยงลูกด้วยนมของป่าในภูมิภาคของคุณ แต่จะเป็นตัวอย่างสัตว์เลี้ยงลูกด้วยนมที่รวมตัวกันอย่างน่าสงสัยทั่วทั้งทวีป

อย่างที่สอง: การทดสอบจะขึ้นอยู่กับ "ระดับของการปลอมแปลง" หรือหลักฐานในตัวอย่างของคุณที่แปลงว่า "เป็น" กับแพทช์ นี่คือความแตกต่างระหว่างแพทช์และแพทช์ภายในแพทช์เท่าใด (ค้นหาความสัมพันธ์ภายในอินทราเน็ต) ในรูปแบบที่รุนแรงมีเพียงความแตกต่างระหว่างแพทช์เท่านั้น (พล็อตภายในแพทช์เหมือนกันทั้งหมด) และคุณมี "pseudoreplication บริสุทธิ์": N ของคุณควรเป็นจำนวนของแพตช์และการสุ่มตัวอย่างหนึ่งหรือหลายแปลงจากแต่ละอัน ข้อมูลใหม่. ในอีกด้านหนึ่งความผันแปรทั้งหมดเกิดขึ้นระหว่างแปลงและไม่มีการอธิบายเพิ่มเติมโดยการรู้ว่าป่าปะอยู่ในแต่ละแปลง (แล้วแบบจำลองโดยไม่มีปัจจัยสุ่มจะปรากฏขึ้นมาก คุณมีแผนการ "อิสระ" ไม่มีใครที่จะมีความเป็นไปได้สูงที่จะเกิดขึ้น ... โดยเฉพาะอย่างยิ่งสำหรับตัวแปรทางชีววิทยาที่สังเกตบนพื้นดินถ้าเพียงเพราะความสัมพันธ์เชิงพื้นที่และการกระจายทางภูมิศาสตร์ของสัตว์เลี้ยงลูกด้วยนม ฉันชอบที่จะรักษาปัจจัยด้วยการออกแบบต่อไป (เช่นแม้ว่าแพทช์ไม่ได้เป็นแหล่งที่มาของความแปรปรวนในตัวอย่างนี้) เพื่อรักษาความคล้ายคลึงกันของ โปรดจำไว้ว่า: ไม่มีหลักฐานในตัวอย่างของคุณที่จะปฏิเสธโมโตฮิโมตินที่ไม่มีการเปลี่ยนแปลงระหว่างแพทช์คือศูนย์ไม่ได้หมายความว่าการเปลี่ยนแปลงนั้นจะเป็นศูนย์ในประชากร แม้ว่าแพทช์ไม่ได้เป็นแหล่งที่มาของการเปลี่ยนแปลงที่เกี่ยวข้องในตัวอย่างนี้) เพื่อรักษาความคล้ายคลึงกันของ โปรดจำไว้ว่า: ไม่มีหลักฐานในตัวอย่างของคุณที่จะปฏิเสธโมโตฮิโมตินที่ไม่มีการเปลี่ยนแปลงระหว่างแพทช์คือศูนย์ไม่ได้หมายความว่าการเปลี่ยนแปลงนั้นจะเป็นศูนย์ในประชากร แม้ว่าแพทช์ไม่ได้เป็นแหล่งที่มาของการเปลี่ยนแปลงที่เกี่ยวข้องในตัวอย่างนี้) เพื่อรักษาความคล้ายคลึงกันของ โปรดจำไว้ว่า: ไม่มีหลักฐานในตัวอย่างของคุณที่จะปฏิเสธโมโตฮิโมตินที่ไม่มีการเปลี่ยนแปลงระหว่างแพทช์คือศูนย์ไม่ได้หมายความว่าการเปลี่ยนแปลงนั้นจะเป็นศูนย์ในประชากร

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.