การเลือกน้ำหนักของเส้นทางในโมเดลแนวคิดเชิง SEM สำหรับฝาแฝดที่เหมือนกันและเป็นพี่น้องโดยใช้ openMx


10

ฉันกำลังทบทวนแพคเกจ R OpenMx สำหรับการวิเคราะห์ทางระบาดวิทยาทางพันธุกรรมเพื่อเรียนรู้วิธีการระบุและเหมาะสมกับแบบจำลอง SEM ฉันยังใหม่กับสิ่งนี้ดังนั้นทนกับฉัน ฉันกำลังตัวอย่างต่อไปนี้ในหน้า 59 ของคู่มือการใช้งาน OpenMx ที่นี่พวกเขาวาดโมเดลแนวคิดต่อไปนี้:

แบบจำลอง SEM สำหรับฝาแฝดและพี่น้องที่เหมือนกัน

และในการระบุเส้นทางพวกเขาตั้งค่าน้ำหนักของโหนด "หนึ่ง" แฝงไปยังโหนด bmi "T1" และ "T2" ที่ประจักษ์เป็น 0.6 เพราะ:

เส้นทางหลักที่น่าสนใจคือจากตัวแปรแฝงแต่ละตัวไปยังตัวแปรที่สังเกตได้ สิ่งเหล่านี้ได้รับการประเมิน (ซึ่งทั้งหมดถูกตั้งค่าไว้ฟรี) รับค่าเริ่มต้น 0.6 และป้ายกำกับที่เหมาะสม

# path coefficients for twin 1
mxPath(
  from=c("A1","C1","E1"),
  to="bmi1",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

# path coefficients for twin 2
mxPath(
  from=c("A2","C2","E2"),
  to="bmi2",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

ค่าของ 0.6 นี้ได้มาจากความแปรปรวนโดยประมาณbmi1และbmi2(จากเคร่งครัดโมโนคู่แฝด Zygotic) ฉันมีสองคำถาม:

  1. เมื่อพวกเขาบอกว่าเส้นทางได้รับค่า "เริ่มต้น" เป็น 0.6 เช่นนี้การตั้งค่ารูทีนการรวมตัวเลขที่มีค่าเริ่มต้นเช่นในการประมาณค่าของ GLMs?

  2. เหตุใดค่านี้จึงถูกประเมินอย่างเข้มงวดจากแฝดแฝด

คำตอบ:


4

เพื่อตอบ 2 คะแนนของคุณ:

1) ใช่แน่นอน - ค่าเริ่มต้นเป็นเพียงการบอกว่าอัลกอริทึมจะเริ่มกระบวนการเพิ่มประสิทธิภาพ แพคเกจซอฟต์แวร์ส่วนใหญ่กำหนดค่าเริ่มต้นของตนเองตามค่าเริ่มต้นจริง ๆ และผู้ใช้จำเป็นต้องลองป้อนค่าต่าง ๆ เมื่อปัญหาเกิดขึ้นในระหว่างการประเมิน จากประสบการณ์ของฉันค่าเริ่มต้นที่เป็นไปได้ส่วนใหญ่จะทำและจะไม่เปลี่ยนรูปแบบสุดท้ายที่อัลกอริทึมมาบรรจบกัน

2) ค่า 0.6 เป็นค่าเริ่มต้นไม่ใช่สำหรับการสกัดกั้นของ T1 และ T2 (เส้นทางระหว่าง "หนึ่ง" และ T1 & T2) แต่เป็นค่าเริ่มต้นสำหรับการโหลดปัจจัยที่เชื่อมโยงแต่ละตัวแปรแฝง (A, C, E ) ไปยังตัวบ่งชี้ T1 หรือ T2 นี่คือความจริงที่บ่งบอกว่าเส้นทางไปfrom=c("A1","C1","E1"), to="bmi1"ในกรณีแรกและfrom=c("A2","C2","E2"), to="bmi2"ในกรณีที่สอง

สำหรับค่าเฉพาะ "0.6": ฉันไม่สามารถหาได้ในเอกสารที่พวกเขากล่าวถึงการใช้ค่านี้ขึ้นอยู่กับกลุ่มย่อย monozygotic twins; และที่จริงแล้วการประมาณพารามิเตอร์เหล่านี้ (การโหลดปัจจัยสำหรับ 3 ตัวแปรแฝง) ไม่สามารถคำนวณได้โดยตรงจากตัวอย่างเนื่องจากตามคำนิยามตัวแปรแฝงเหล่านี้จะไม่ได้รับการตรวจสอบ ดังที่ฉันพูดถึงในจุด # 1 ทางเลือกระหว่างค่าที่เป็นไปได้สองค่าแทบจะไม่ส่งผลต่อการประมาณพารามิเตอร์ของโมเดลที่รวมกันดังนั้นฉันเดาว่าพวกเขาเลือกค่าที่เป็นไปได้หลายอย่างสำหรับการโหลดปัจจัยเหล่านี้เป็นค่าเริ่มต้น ไม่ว่าค่านี้จะมาจากความแปรปรวนร่วมโดยประมาณระหว่าง bmi1 และ bmi2 ในกลุ่มย่อย monozygotic-twin เท่านั้นที่ควรจะไม่เกี่ยวข้องเนื่องจากค่าเริ่มต้นที่เป็นไปได้ควรนำอัลกอริทึมมาบรรจบกับค่าสุดท้ายเดียวกัน อาจมีความแตกต่างในเวลาคำนวณ (และคำแนะนำของฉันในการโน้มน้าวใจตัวเองคือลองเลยเริ่มลองหลายค่าเริ่มต้นและเปรียบเทียบค่าประมาณพารามิเตอร์ของโมเดลที่รวมกัน)

ตามบันทึกทั่วไปฉันจะชี้ให้เห็นว่าตัวเลือกของค่าเริ่มต้นสำหรับการประมาณค่าพารามิเตอร์ใด ๆ จะมีความสำคัญมากถ้าอาร์กิวเมนต์freeถูกตั้งค่าเป็นFALSEเพราะค่าเริ่มต้นจะกลายเป็นค่าของการประมาณค่าพารามิเตอร์ในรุ่นสุดท้ายอย่างมีประสิทธิภาพ ได้รับการประเมินแล้วจะถูกแก้ไขก่อนการประมาณค่า)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.