ข้อมูลระยะยาว: อนุกรมเวลาการวัดซ้ำหรืออย่างอื่น


10

ในภาษาอังกฤษธรรมดา: ฉันมีการถดถอยหลายครั้งหรือแบบจำลอง ANOVA แต่ตัวแปรการตอบสนองสำหรับแต่ละบุคคลเป็นฟังก์ชัน curvilinear ของเวลา

  • ฉันจะบอกได้อย่างไรว่าตัวแปรด้านขวามือใดที่รับผิดชอบความแตกต่างที่สำคัญในรูปร่างหรือการชดเชยแนวดิ่งของเส้นโค้ง
  • นี่เป็นปัญหาอนุกรมเวลาปัญหาซ้ำหลายครั้งหรืออย่างอื่นทั้งหมดหรือไม่
  • อะไรคือแนวปฏิบัติที่ดีที่สุดสำหรับการวิเคราะห์ข้อมูลดังกล่าว (ควรใช้Rแต่ฉันเปิดให้ใช้ซอฟต์แวร์อื่น)

ในแง่ที่แม่นยำยิ่งขึ้น: สมมุติว่าฉันมีแบบจำลองแต่เป็นชุดของข้อมูลที่รวบรวมจากจุดkบุคคลเดียวกันที่เวลาหลายจุดtซึ่งถูกบันทึกเป็นตัวแปรตัวเลข การพล็อตข้อมูลแสดงให้เห็นว่าสำหรับแต่ละy_ {ijkt}เป็นฟังก์ชันกำลังสองหรือวัฏจักรของเวลาซึ่งออฟเซ็ตแนวตั้งรูปร่างหรือความถี่ (ในกรณีวัฏจักร) อาจขึ้นอยู่กับ covariates โควาเรียตไม่เปลี่ยนแปลงตลอดเวลา - กล่าวคือบุคคลมีน้ำหนักตัวคงที่หรือกลุ่มการรักษาในช่วงระยะเวลาของการรวบรวมข้อมูลy ฉันj k k t y ฉันj k tyijk=β0+β1xi+β2xj+β3xixj+ϵkyijkktyijkt

จนถึงตอนนี้ฉันได้ลองRแนวทางต่อไปนี้แล้ว:

  1. MANOVA

    Anova(lm(YT~A*B,mydata),idata=data.frame(TIME=factor(c(1:10))),idesign=~TIME); 
    

    ... YTเมทริกซ์ที่มีคอลัมน์เป็นเวลาจุดซึ่งเป็น 10 ในตัวอย่างนี้ แต่ไกลกว่าในข้อมูลจริง

    ปัญหา:สิ่งนี้ถือว่าเวลาเป็นปัจจัย แต่คะแนนเวลาไม่ตรงกับแต่ละคนอย่างแน่นอน นอกจากนี้ยังมีหลายคนที่เกี่ยวข้องกับขนาดตัวอย่างเพื่อให้รูปแบบอิ่มตัว ดูเหมือนว่าจะไม่สนใจรูปร่างของตัวแปรการตอบสนองเมื่อเวลาผ่านไป

  2. แบบผสม (เช่นใน Pinheiro และ Bates รุ่นผสมผลกระทบใน S และ S-Plus )

    lme(fixed=Y~ A*B*TIME + sin(2*pi*TIME) + cos(2*pi*TIME), data=mydata, 
        random=~(TIME + sin(2*pi*TIME) + cos(2*pi*TIME))|ID), method='ML')
    

    ... ซึ่งIDเป็นปัจจัยที่จัดกลุ่มข้อมูลเป็นรายบุคคล ในตัวอย่างนี้การตอบสนองเป็นวัฏจักรเมื่อเวลาผ่านไป แต่อาจมีเงื่อนไขกำลังสองหรือฟังก์ชั่นอื่น ๆ ของเวลาแทน

    ปัญหา:ฉันไม่แน่ใจว่าจำเป็นต้องใช้เทอมแต่ละครั้ง (โดยเฉพาะอย่างยิ่งสำหรับเงื่อนไขกำลังสอง) และอันไหนที่ได้รับผลกระทบจากการแปรปรวนร่วม

    • เป็นstepAIC()วิธีการที่ดีในการเลือกพวกเขา?
    • ถ้ามันลบคำที่ขึ้นอยู่กับเวลามันจะลบมันออกจากการrandomโต้แย้งหรือไม่
    • เกิดอะไรขึ้นถ้าฉันยังใช้ฟังก์ชั่นอัต (เช่นcorEXP()) ที่ใช้สูตรในcorrelationargument-- ฉันควรจะทำสูตรที่corEXP()เดียวกันเป็นหนึ่งในrandomหรือเพียงแค่~1|ID?
    • nlmeแพคเกจจะไม่ค่อยกล่าวถึงในบริบทของอนุกรมเวลานอก Pinheiro และเบตส์ส ... มันไม่ถือว่าเหมาะกับปัญหานี้หรือไม่
  3. การสร้างแบบจำลองสมการกำลังสองหรือตรีโกณมิติให้เหมาะกับแต่ละบุคคลจากนั้นใช้สัมประสิทธิ์แต่ละตัวเป็นตัวแปรการตอบสนองสำหรับการถดถอยพหุคูณหรือ ANOVA

    ปัญหา:จำเป็นต้องแก้ไขการเปรียบเทียบหลายรายการ ไม่สามารถคิดปัญหาอื่น ๆ ที่ทำให้ฉันสงสัยว่าฉันกำลังมองอะไรบางอย่าง

  4. เป็นข้อเสนอแนะก่อนหน้านี้ในเว็บไซต์นี้ ( คืออะไรคำสำหรับชุดถดถอยเวลามีมากกว่าหนึ่งทำนาย? ) มีARIMAX และฟังก์ชั่นการถ่ายโอน / รูปแบบการถดถอยแบบไดนามิก

    ปัญหา: ตัวแบบที่อิง ARMA ใช้เวลาไม่ต่อเนื่องใช่มั้ย สำหรับการถดถอยแบบไดนามิกฉันได้ยินเกี่ยวกับเรื่องนี้เป็นครั้งแรกในวันนี้ แต่ก่อนที่ฉันจะเจาะลึกไปถึงวิธีการใหม่ที่อาจไม่สามารถหลบหนีออกไปได้ฉันคิดว่าควรระมัดระวังที่จะขอคำแนะนำ


5
@ f1r3br4and มันอาจช่วยถ้าคุณเพิ่มรายละเอียดเกี่ยวกับข้อมูลของคุณคืออะไร? นั่นคือมีกี่กรณีที่วัดที่เวลากี่แต้ม? เป็นกรณีในเงื่อนไขที่แตกต่างกันอย่างไร หรืออะไรที่แตกต่างกันอย่างไร
Jeromy Anglim

คุณทำบัญชีของคุณหาย? ถ้าเป็นเช่นนั้นโปรดลงทะเบียนใหม่อาจมีที่อยู่ Gmail ของคุณเพื่อให้ฉันสามารถค้นหาสิ่งที่จะผสานได้อย่างง่ายดาย

1
@ f-tussel และ @ jeromy-anglim: ข้อมูลเป็นการวัดแบบไม่รุกรานที่รวบรวมจากสัตว์ทดลองในช่วงอายุการใช้งานตามธรรมชาติของพวกมันมักจะมาพร้อมกับข้อมูลคงที่เช่นจีโนไทป์เพศหรือชนิดของอาหารที่พวกมันกิน โดยคะแนน 'มาก' ฉันหมายถึง 20 ถึงหลายร้อย ไม่ใช่ชุดข้อมูลเดียวที่ฉันพยายามวิเคราะห์ แต่เพื่อเรียนรู้วิธีการวิเคราะห์ประเภทของข้อมูลที่กลายเป็นเรื่องธรรมดาในกลุ่มของฉัน รุ่นผสมกับปัจจัยภายในกลุ่มแนะนำสำหรับขนาดตัวอย่างที่เล็กกว่าเท่านั้นหรือไม่
f1r3br4nd

คำตอบ:


5

ดังที่ Jeromy Anglim กล่าวว่าจะช่วยให้ทราบจำนวนเวลาที่คุณมีสำหรับแต่ละคน ในขณะที่คุณพูดว่า "หลายคน" ฉันจะเสี่ยงที่การวิเคราะห์การทำงานอาจเป็นทางเลือกที่ทำงานได้ คุณอาจต้องการตรวจสอบแพคเกจการ R องค์การอาหารและยา และดูที่หนังสือโดย Ramsay และซิลเวอร์


การวิเคราะห์เชิงฟังก์ชั่นฟังดูมีแนวโน้มในระยะยาว แต่ดูเหมือนว่าจะมีช่วงการเรียนรู้ค่อนข้างมากก่อนที่ฉันจะมั่นใจว่าฉันจะไม่ได้รับผลลัพธ์ที่ไร้ความหมายหรือลำเอียง ดังนั้นในขณะที่ฉันกำลังเร่งความเร็วในเรื่องนี้มีวิธีการพื้นฐานที่คุ้นเคยมากขึ้นnlme(รายการ 2 และ 3 ใน OP) อย่างน้อยก็ใช้ได้กับข้อมูลในช่วงเวลานั้นหรือไม่?
f1r3br4nd

2

ตั้งแต่เริ่มโพสต์คำถามนี้ขึ้นมาฉันได้ข้อสรุปว่าแบบจำลองเอฟเฟ็กต์แบบผสมกับวิชาในฐานะปัจจัยการสุ่มบล็อกเป็นวิธีแก้ปัญหาที่ใช้งานได้จริงเช่นตัวเลือก # 2 ในโพสต์ต้นฉบับของฉัน ถ้าrandomอาร์กิวเมนต์lmeตั้งค่าเป็น~1|ID(ซึ่งIDระบุการสังเกตที่มาจากหัวข้อการทดสอบเดียวกัน) ดังนั้นโมเดลการดักจับแบบสุ่มจะถูกติดตั้ง หากตั้งค่า~TIME|IDเป็นแบบจำลองความชันและจุดตัดแบบสุ่มจะถูกติดตั้ง สูตรด้านขวาใด ๆ ที่มีตัวแปรที่แตกต่างกันภายในบุคคลเดียวกันสามารถวางระหว่าง~และ|IDแต่สูตรที่ซับซ้อนมากเกินไปจะส่งผลให้มีรูปแบบอิ่มตัวและ / หรือข้อผิดพลาดเชิงตัวเลขต่าง ๆ ดังนั้นหนึ่งสามารถใช้การทดสอบอัตราส่วนความน่าจะเป็น (anova(myModel, update(myModel,random=~TIME|ID))) เพื่อเปรียบเทียบแบบจำลองการสกัดกั้นแบบสุ่มกับแบบจำลองความชันและจุดตัดแบบสุ่มหรือแบบจำลองเอฟเฟกต์แบบสุ่มอื่น ๆ หากความแตกต่างในความพอดีไม่สำคัญแล้วติดกับรุ่นที่ง่ายกว่า มันมากเกินไปสำหรับฉันที่จะไปยังฟังก์ชันตรีโกณฯ แบบสุ่มในโพสต์ดั้งเดิมของฉัน

ปัญหาอื่น ๆ ที่ฉันยกขึ้นเป็นหนึ่งในการเลือกรูปแบบ ดูเหมือนว่าคนไม่ชอบการเลือกรูปแบบใด ๆ แต่ไม่มีใครมีทางเลือกในทางปฏิบัติ หากคุณเชื่อว่านักวิจัยที่เก็บรวบรวมข้อมูลเกี่ยวกับตัวแปรอธิบายที่ซ่อนอยู่และไม่เกี่ยวข้องกับคนตาบอดคุณมักจะยอมรับสมมติฐานที่ยังไม่ทดลองของพวกเขา หากคุณคำนึงถึงข้อมูลที่เป็นไปได้ทุกบิตคุณจะพบกับรูปแบบที่อิ่มตัว หากคุณเลือกรูปแบบและตัวแปรที่เจาะจงเนื่องจากเป็นเรื่องง่ายคุณจะยอมรับสมมติฐานที่ยังไม่ทดลองอีกครั้งคราวนี้เป็นของคุณเอง

ดังนั้นโดยสรุปสำหรับการวัดซ้ำมันเป็นlmeแบบจำลองตามด้วยการตัดผ่านMASS:::stepAICหรือMuMIn:::dredgeและ / หรือnlme:::anova.lmeจนกว่าและถ้ามีใครมีความคิดที่ดีกว่า

ฉันจะทิ้งคำตอบนี้ไว้สักพักก่อนจะยอมรับเพื่อดูว่ามีใครโต้แย้งบ้างไหม ขอบคุณสำหรับเวลาของคุณและถ้าคุณอ่านข้อความนี้เพราะคุณมีคำถามแบบเดียวกันขอให้โชคดีและยินดีต้อนรับสู่ดินแดนกึ่งไม่จดที่แผนที่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.