รูปแบบใดสำหรับชุดข้อมูลที่ท้าทาย (ซีรีย์หลายร้อยครั้งพร้อมการซ้อนจำนวนมาก)


9

ฉันมีชุดข้อมูลที่ค่อนข้างซับซ้อนในการวิเคราะห์และฉันไม่สามารถหาวิธีแก้ปัญหาที่ดีได้

นี่คือสิ่งที่:

1.ข้อมูลดิบเป็นแมลงบันทึกเพลงเป็นหลัก เพลงแต่ละเพลงทำจากระเบิดหลายครั้งและแต่ละเพลงทำจากชุดย่อย บุคคลทั้งหมดได้รับการบันทึกเป็นเวลา 5 นาที จำนวนระเบิดและตำแหน่งในการบันทึกอาจแตกต่างกันมากระหว่างบุคคลเช่นเดียวกับจำนวนหน่วยย่อยต่อการระเบิด

2.ฉันมีความถี่ผู้ให้บริการ (ความถี่พื้นฐาน) ของแต่ละหน่วยย่อยและนั่นคือสิ่งที่ฉันต้องการวิเคราะห์

ปัญหาของฉัน:

1.ความถี่ภายในการระเบิดไม่ชัดเจน (แม้ว่าจะค่อนข้างเสถียร แต่ความถี่ของหน่วยย่อย n-1 จะมีผลกับหน่วยย่อย n)

2.การระเบิดยังไม่ขึ้นอยู่กับการบันทึก

3.พวกเขามีความอิสระน้อยลงเมื่อความถี่ลดลงตามเวลา (แต่ละคนเบื่อที่จะร้องเพลงดังนั้นความถี่ของเพลงจึงลดลงและลดลง) หยดดูเหมือนจะเป็นเส้นตรง

4. การทำรัง = ฉันมีประชากรซ้ำกัน 3 แห่งสำหรับสองแห่งคือ A และ B ดังนั้นฉันจึงมี A1, A2, A3 และ B1, B2, B3

สิ่งที่ฉันต้องการจะทำ:

1.อธิบายความแตกต่างของความถี่ระหว่างสถานที่สองแห่งของฉัน (ทดสอบทางสถิติ)

2.ระบุความถี่ที่ลดลงระหว่างสองตำแหน่ง (ดูว่ามันลดลงเร็วกว่าหนึ่งในนั้นหรือไม่)

ทำอย่างไร:

นั่นคือเหตุผลที่ฉันต้องการความช่วยเหลือ: ฉันไม่รู้ ดูเหมือนว่ากรณีของฉันรวมปัญหาที่มักไม่เห็นด้วยกัน ฉันได้อ่านเกี่ยวกับโมเดลผสม, เกี่ยวกับ GAM, เกี่ยวกับ ARIMA, การสุ่มและเอฟเฟกต์คงที่ แต่ฉันไม่แน่ใจว่าจะทำอย่างไรดีที่สุด เมื่อฉันวาดกราฟมัน (ความถี่ ~ จำนวนหน่วยย่อยn ) ความแตกต่างนั้นชัดเจนมากระหว่างสองตำแหน่ง ฉันต้องคำนึงถึงตัวแปรอื่น ๆ เช่นอุณหภูมิ (ทำให้ความถี่สูงขึ้น) เป็นต้น

ฉันคิดเกี่ยวกับ:

  • ทำรังบุคคลภายในทำซ้ำมาจากและทำซ้ำทำซ้ำภายในตำแหน่งที่ตั้ง (บุคคล / จำลอง / สถานที่)

  • ใช้เอฟเฟกต์ 'ระเบิด' แบบสุ่มดังนั้นฉันจึงคำนึงถึงความแปรปรวนในแต่ละครั้ง

  • ใช้เอฟเฟกต์ 'ตำแหน่งระเบิดในการบันทึก' คงที่เพื่อวัดความถี่ที่ลดลง (หวังว่ามันจะเป็นเส้นตรง)

มันจะถูกต้องหรือไม่

มีรูปแบบพิเศษที่ฉันสามารถใช้สำหรับสถานการณ์ประเภทนี้หรือไม่


ยินดีต้อนรับสู่เว็บไซต์นี้โจ ไม่จำเป็นต้องเข้าสู่ระบบในโพสต์ของคุณชื่อของคุณมักจะปรากฏอยู่ภายใต้ Gravatar ของคุณ :)
CHL

ตกลงและขอบคุณ! มันเป็นเว็บไซต์ที่ดีมากทำดีมาก
Joe

“ การทำรังบุคคลภายในการจำลองนั้นมาจากและทำซ้ำการจำลองภายในสถานที่ (บุคคล / จำลอง / สถานที่)” ดูเหมือนความคิดที่ดีถ้าเทียบกับรูปแบบที่ไม่ซ้อนกัน ประชากรย่อยทั้งหกของคุณมีลักษณะอย่างไร
คุณพ่อ

1
ขอบคุณมากสำหรับคำตอบของคุณชื่นชมมันจริงๆ ฉันใช้เวลานาน แต่ฉันก็สามารถวิเคราะห์ชุดข้อมูลนี้ได้ (เลือด) ฉันคิดว่าฉันทะเยอทะยานเกินไปที่จะทำแบบจำลองทุกอย่างในเวลาเดียวกัน ดังนั้นฉันจึงแบ่งงานเป็นหลายรูปแบบสำหรับแต่ละปัญหา (ความแตกต่างของความถี่เฉลี่ยเพิ่มความถี่ ฯลฯ ) สรุป: บางครั้งก็เป็นการดีที่จะแบ่งงาน!
Joe

คำตอบ:


2

นี่เป็นเพียงคำแนะนำทั่วไปที่คุณอาจพบว่ามีประโยชน์และเป็นแนวทางมากกว่าสูตร

  • สัญชาตญาณของฉันคือการสร้างแบบจำลองลำดับชั้นแบบเบย์เพราะมันให้ตัวเองกับการพัฒนาแบบจำลองซ้ำ - ฉันไม่คิดว่าคุณจะพบกับแบบจำลองที่มีอยู่ซึ่งมีระฆังและนกหวีดทั้งหมดที่คุณทำ แต่นี่ทำให้การทดสอบสมมติฐานยากขึ้นฉันไม่รู้ว่าการทดสอบสมมติฐานที่จำเป็นสำหรับคุณเป็นอย่างไร
  • ดูเหมือนว่าคุณมีแบบจำลองที่ไม่เป็นทางการอยู่ในหัวของคุณเกี่ยวกับพฤติกรรมของแมลง คุณพูดสิ่งต่าง ๆ เช่น "เหนื่อย" และคุณรู้ว่าอุณหภูมิทำให้ความถี่สูงขึ้นอย่างน่าจะเป็นเพราะสัตว์มีพลังงานมากขึ้น ดูเหมือนว่าคุณมีแบบจำลองกำเนิดเล็ก ๆ น้อย ๆ ในใจของคุณเกี่ยวกับวิธีที่แมลงสร้างเพลงของพวกเขา
  • ปัญหาฟังดูซับซ้อนเกินไปที่จะจำลอง "ในภาพเดียว" ฉันคิดว่าคุณจะต้องสร้างบางสิ่งบางอย่างขึ้นทีละน้อย ฉันจะเริ่มต้นด้วย "การคาดคะเนความเรียบง่ายที่คาดเดายาก" - กล่าวคือกำจัดความซับซ้อนส่วนใหญ่ของชุดข้อมูลออกไปด้วยแผนการที่จะเพิ่มกลับมาในภายหลังเมื่อคุณมีโมเดลที่ใช้งานได้ง่าย

ดังนั้นในการเริ่มต้นฉันจะทำบางสิ่งบางอย่างเช่นประมวลผลความถี่ย่อยของหน่วยย่อยบนพื้นฐานการถ่ายต่อเนื่องเป็นแบบคู่ (ความถี่เฉลี่ย, แนวโน้มความถี่) ทำแบบนี้กับ OLS และเพียงแค่จำลองค่าเฉลี่ยความถี่และแนวโน้มของ ระเบิดค่อนข้างแล้วหน่วยย่อยตัวเอง หรือคุณสามารถทำได้ (หมายถึงแนวโน้มจำนวนหน่วยย่อย) หากจำนวนหน่วยย่อยเกี่ยวข้องกับความเหนื่อยล้าของแมลง จากนั้นสร้างแบบจำลองลำดับชั้นแบบเบย์ที่การกระจายของค่าเฉลี่ยและแนวโน้มของการระเบิดถูกกำหนดโดยค่าเฉลี่ย, แนวโน้มของการบันทึกและสิ่งนี้จะถูกกำหนดโดยค่าเฉลี่ย, แนวโน้มของที่ตั้ง

จากนั้นเพิ่มอุณหภูมิเป็นปัจจัยในการบันทึกค่าเฉลี่ย / แนวโน้ม

โมเดลง่าย ๆ นี้จะช่วยให้คุณเห็นค่าเฉลี่ยและแนวโน้มของการระเบิดของบุคคลในการบันทึกตามที่กำหนดโดยอุณหภูมิและสถานที่ ลองและทำให้มันใช้งานได้

จากนั้นฉันจะลองประเมินความแตกต่างระหว่างความถี่เฉลี่ยของการระเบิด (หรือแนวโน้มโดยแบ่งเวลาเงียบระหว่างการระเบิด) โดยเพิ่มสิ่งนี้เป็นตัวแปรที่กำหนดโดยสถานที่และการบันทึก ขั้นตอนต่อไปคือโมเดล AR ของค่าเฉลี่ยการระเบิดในการบันทึก

เมื่อพิจารณาจากนักบวชและสมมติฐานที่แข็งแกร่งมากเกี่ยวกับธรรมชาติของการระเบิด (ข้อมูลทั้งหมดนั้นได้รับจากค่าเฉลี่ยและแนวโน้ม) โมเดลพื้นฐานนี้จะบอกคุณ:

  • ความถี่เฉลี่ยของการกระจายตำแหน่งแตกต่างกันตามสถานที่และอุณหภูมิตามอุณหภูมิอย่างไร
  • แนวโน้มภายในแตกต่างกันไปตามสถานที่ตั้งอย่างไรและ temp ตามอุณหภูมิ
  • แนวโน้มการระเบิดนอกสถานที่แตกต่างกันตามสถานที่และอุณหภูมิโดยอุณหภูมิ

เมื่อคุณมีสิ่งนี้เพื่อทำงานแล้วอาจถึงเวลาสร้างแบบจำลองหน่วยย่อยเองและละทิ้งประมาณการ OLS ดั้งเดิม ฉันดูข้อมูล ณ จุดนี้เพื่อรับทราบว่าแบบจำลองอนุกรมเวลาแบบใดและแบบจำลองพารามิเตอร์ของโมเดลอนุกรมเวลาแทนที่จะเป็นคู่ (ค่าเฉลี่ย, แนวโน้ม)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.