ปรับโมเดลหลายระดับให้เหมาะสมกับข้อมูลการสำรวจที่ซับซ้อนใน R


11

ฉันกำลังมองหาคำแนะนำเกี่ยวกับวิธีการวิเคราะห์ข้อมูลการสำรวจที่ซับซ้อนด้วยโมเดลหลายระดับในอาร์ฉันใช้surveyแพคเกจน้ำหนักเพื่อความน่าจะเป็นที่ไม่เท่ากันของการเลือกในแบบจำลองระดับเดียว แต่แพ็คเกจนี้ไม่มีฟังก์ชันสำหรับการสร้างแบบหลายระดับ lme4แพคเกจเป็นที่ดีสำหรับการสร้างแบบจำลองหลายระดับ แต่มีไม่ได้เป็นวิธีที่ฉันรู้ที่จะรวมน้ำหนักในระดับที่แตกต่างกันของการจัดกลุ่ม Asparouhov (2006)สร้างปัญหา:

แบบหลายระดับมักถูกใช้เพื่อวิเคราะห์ข้อมูลจากการออกแบบการสุ่มตัวอย่างแบบกลุ่ม การออกแบบการสุ่มตัวอย่างดังกล่าวมักจะใช้ความน่าจะเป็นที่ไม่เท่ากันของการเลือกในระดับคลัสเตอร์และระดับบุคคล น้ำหนักตัวอย่างจะถูกกำหนดในหนึ่งหรือทั้งสองระดับเพื่อสะท้อนความน่าจะเป็นเหล่านี้ หากน้ำหนักการสุ่มตัวอย่างถูกเพิกเฉยไม่ว่าในระดับใดการประมาณค่าพารามิเตอร์สามารถลำเอียงอย่างมาก

แนวทางหนึ่งสำหรับแบบจำลองสองระดับคือตัวประมาณความน่าจะเป็นแบบหลอกหลายระดับ (MPML) ที่ใช้ใน MPLUS ( Asparouhov et al,? ) Carle (2009)ตรวจสอบแพ็คเกจซอฟต์แวร์ที่สำคัญและให้คำแนะนำเล็กน้อยเกี่ยวกับวิธีดำเนินการต่อ:

ในการดำเนินการ MLM อย่างเหมาะสมกับข้อมูลการสำรวจที่ซับซ้อนและตุ้มน้ำหนักการออกแบบนักวิเคราะห์จำเป็นต้องใช้ซอฟต์แวร์ที่สามารถรวมน้ำหนักที่ปรับสัดส่วนไว้นอกโปรแกรม ปัจจุบันโปรแกรมซอฟต์แวร์ MLM ที่สำคัญสามโปรแกรมอนุญาตสิ่งนี้: Mplus (5.2), MLwiN (2.02) และ GLLAMM น่าเสียดายที่ HLM และ SAS ไม่สามารถทำได้

West และ Galecki (2013)ให้ความเห็นที่อัปเดตมากกว่าเดิมและฉันจะเสนอราคาข้อความที่เกี่ยวข้องตามความยาว:

ในบางครั้งนักวิเคราะห์ต้องการปรับ LMM ให้เหมาะกับการสำรวจชุดข้อมูลที่รวบรวมจากตัวอย่างด้วยการออกแบบที่ซับซ้อน (ดู Heeringa et al, 2010, ตอนที่ 12) การออกแบบตัวอย่างที่ซับซ้อนนั้นมีลักษณะโดยการแบ่งประชากรออกเป็นชั้น ๆ การเลือกกลุ่มแบบหลายขั้นตอนของบุคคลจากภายในชั้นและความน่าจะเป็นที่ไม่เท่ากันของการเลือกสำหรับทั้งกลุ่มและบุคคลตัวอย่างขั้นสุดท้าย ความน่าจะเป็นที่ไม่เท่าเทียมกันเหล่านี้ของการเลือกโดยทั่วไปนำไปสู่การสร้างน้ำหนักตัวอย่างสำหรับบุคคลซึ่งทำให้มั่นใจว่าการประมาณค่าพารามิเตอร์เชิงพรรณนาที่ไม่เอนเอียงเมื่อรวมเข้ากับการวิเคราะห์ น้ำหนักเหล่านี้อาจถูกปรับเพิ่มเติมสำหรับการตอบแบบไม่ตอบสนองและปรับเทียบกับจำนวนประชากรทั้งหมดที่ทราบ ตามเนื้อผ้า นักวิเคราะห์อาจพิจารณาแนวทางการออกแบบเพื่อรวมคุณสมบัติการสุ่มตัวอย่างที่ซับซ้อนเหล่านี้เมื่อประเมินแบบจำลองการถดถอย (Heeringa et al., 2010) เมื่อไม่นานมานี้นักสถิติเริ่มสำรวจวิธีการที่ใช้แบบจำลองเพื่อวิเคราะห์ข้อมูลเหล่านี้โดยใช้ LMM เพื่อรวมเอฟเฟกต์คงที่ของชั้นตัวอย่างและผลสุ่มของกลุ่มตัวอย่าง

ปัญหาหลักในการพัฒนาวิธีการที่ใช้แบบจำลองเพื่อวิเคราะห์ข้อมูลเหล่านี้ได้เลือกวิธีการที่เหมาะสมสำหรับการรวมน้ำหนักตัวอย่าง (ดู Gelman, 2007 สำหรับบทสรุปของปัญหา) Pfeffermann และคณะ (1998), Asparouhov และ Muthen (2006), และ Rabe-Hesketh และ Skrondal (2006) ได้พัฒนาทฤษฎีสำหรับการประเมินแบบจำลองหลายระดับในลักษณะที่รวมการสำรวจน้ำหนักและ Rabe-Hesketh และ Skrondal (2006) และ Heeringa et al. (2010, บทที่ 12) ได้นำเสนอแอปพลิเคชันโดยใช้กระบวนการซอฟต์แวร์ปัจจุบัน แต่สิ่งนี้ยังคงเป็นพื้นที่ของการวิจัยเชิงสถิติ ขั้นตอนของซอฟต์แวร์ที่สามารถปรับ LMM ได้นั้นอยู่ในขั้นตอนต่าง ๆ ของการนำแนวทางที่ได้รับการเสนอในวรรณคดีมาใช้ในการผสมผสานคุณสมบัติการออกแบบที่ซับซ้อน และนักวิเคราะห์ต้องพิจารณาสิ่งนี้เมื่อปรับ LMM ให้เหมาะสมกับข้อมูลการสำรวจตัวอย่างที่ซับซ้อน นักวิเคราะห์ที่สนใจในการปรับ LMM ให้เหมาะสมกับข้อมูลที่รวบรวมจากการสำรวจกลุ่มตัวอย่างที่ซับซ้อนจะถูกดึงดูดไปยังขั้นตอนที่มีความสามารถในการรวมน้ำหนักการสำรวจเข้ากับกระบวนการประเมิน (HLM, MLwiN, Mplus, xtmixed และ gllamm) ได้อย่างถูกต้อง พื้นที่

สิ่งนี้นำมาสู่คำถามของฉัน: ไม่มีใครมีคำแนะนำการปฏิบัติที่ดีที่สุดในการปรับ LMM ให้เหมาะสมกับข้อมูลการสำรวจที่ซับซ้อนใน R หรือไม่?


1
สวัสดี eric การเชื่อมโยงในย่อหน้าที่เริ่มต้นด้วย wih i've never said it beforeจากโพสต์ใน addhealth นี้อาจเป็นที่สนใจ .. :(
Anthony Damico

1
@AnthonyDamico ลิงก์เสียแล้ว :-(
Ben Bolker

@BenBolker มันเป็น! พวกเขาเปลี่ยนชื่อของ microdata ดังนั้นฉันก็ทำได้เช่นกัน :) ตำแหน่งใหม่: asdfree.com/search/label/…
Anthony Damico

ขออภัยถ้าฉันตีความคำถามของคุณผิด แต่ความเข้าใจของฉันคือคุณได้ทำการแก้ไขน้ำหนัก (รู้จัก) จากการออกแบบการทดสอบและคุณต้องการใช้แบบจำลองเชิงเส้นผสมที่มีน้ำหนักการออกแบบเหล่านี้ lmerฟังก์ชั่นในlme4แพคเกจที่ช่วยให้สเปคของweightsอาร์กิวเมนต์สำหรับกระบวนการรูปแบบที่เหมาะสมดังนั้นหากคุณยังคงน้ำหนักการออกแบบที่คุณควรจะสามารถที่จะรวมพวกเขามีข้อโต้แย้งว่า ฉันมีปลายไม้ผิดที่นี่หรือไม่? มีเหตุผลบางอย่างที่ไม่เพียงพอต่อความต้องการของคุณหรือไม่?
เบ็น - คืนสถานะโมนิก้า

คำตอบ:


4

เท่าที่ฉันรู้ว่าคุณไม่สามารถทำสิ่งนี้ใน R ได้ในตอนนี้ถ้าคุณต้องการตัวแบบผสม (เช่นถ้าคุณสนใจองค์ประกอบความแปรปรวน)

อาร์กิวเมนต์น้ำหนักlme4::lmer() จะไม่ทำสิ่งที่คุณต้องการเพราะlmer()ตีความน้ำหนักเป็นตุ้มน้ำหนักที่มีความแม่นยำไม่ใช่น้ำหนักตัวอย่าง ตรงกันข้ามกับโมเดลเชิงเส้นทั่วไปและแบบเชิงเส้นทั่วไปคุณไม่ได้รับการประมาณจุดที่ถูกต้องด้วยรหัสที่ใช้กับน้ำหนักตัวอย่างเป็นน้ำหนักที่มีความแม่นยำสำหรับโมเดลผสม

หากคุณไม่จำเป็นต้องประเมินองค์ประกอบความแปรปรวนและคุณเพียงต้องการคุณสมบัติหลายระดับของแบบจำลองเพื่อรับข้อผิดพลาดมาตรฐานที่ถูกต้องที่คุณสามารถsurvey::svyglm()ใช้ได้


0

WeMixแพคเกจในขณะนี้คือตัวเลือกอย่างน้อยสำหรับการเชิงเส้นและรูปแบบหลายโลจิสติก ดูเหมือนว่าจะช้ามากเมื่อเทียบกับการใช้งานโมเดลเหล่านี้ใน Stata หรือ MPlus


0

ฉันกำลังเผชิญกับปัญหาเดียวกัน เมื่อทำการค้นหาจำนวนมากในช่วงสองสามวันที่ผ่านมาฉันพบว่าแพ็คเกจ BIFIEsurvey นั้นใกล้เคียงกับการวิเคราะห์แบบจำลองหลายระดับด้วยข้อมูลการสำรวจที่ซับซ้อนพร้อมตัวอย่างและจำลองน้ำหนักและค่าที่เป็นไปได้: https://cran.r-project.org/web /packages/BIFIEsurvey/index.htmlแพคเกจนั้น จำกัด เฉพาะรุ่นสองระดับ ฉันได้อ่านด้วยว่าผู้เขียนแผนการบรรจุภัณฑ์ "intsvy" ในระยะยาวเพื่อทำให้ "intsvy" สามารถวิเคราะห์โมเดลหลายระดับได้ แต่ ณ วันนี้ยังไม่สามารถทำได้ หากมีความคืบหน้าเกี่ยวกับการแก้ไขปัญหานี้ซึ่งฉันอาจพลาดไปโดยบังเอิญฉันจะมีความสุขถ้ามีใครสามารถแบ่งปันได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.