อนุกรมเวลาที่ผิดปกติอย่างมาก


10

ฉันมีข้อมูลสำหรับประชากรปลาจำนวนหนึ่งที่สุ่มตัวอย่างในช่วงเวลาประมาณ 5 ปี แต่ในรูปแบบที่ผิดปกติมาก บางครั้งมีเดือนระหว่างตัวอย่างบางครั้งมีหลายตัวอย่างในหนึ่งเดือน นอกจากนี้ยังมีจำนวน 0 จำนวน

วิธีจัดการกับข้อมูลดังกล่าว?

ฉันสามารถวาดกราฟได้อย่างง่ายดายใน R แต่กราฟไม่สว่างโดยเฉพาะเพราะมันเป็นหลุมเป็นบ่อมาก

ในแง่ของการสร้างแบบจำลอง - ด้วยสปีชีส์ที่จำลองเป็นฟังก์ชั่นของสิ่งต่าง ๆ - อาจเป็นโมเดลผสม

ยินดีต้อนรับการอ้างอิงหรือความคิดใด ๆ

รายละเอียดบางอย่างในการตอบสนองต่อความคิดเห็น

มีประมาณ 15 ชนิด

ฉันกำลังพยายามที่จะรับความคิดเกี่ยวกับแนวโน้มหรือฤดูกาลของปลาแต่ละตัวและดูว่าสปีชีส์สัมพันธ์กันอย่างไร (ลูกค้าของฉันต้องการตารางที่มีความสัมพันธ์อย่างง่าย ๆ )

เป้าหมายคือการอธิบายและการวิเคราะห์ไม่ใช่การทำนาย

การแก้ไขเพิ่มเติม: ฉันพบบทความนี้โดย K. Rehfield และคณะซึ่งแนะนำให้ใช้เมล็ดเกาส์เซียนเพื่อประเมิน ACF สำหรับอนุกรมเวลาที่ผิดปกติอย่างมาก

http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf


1
ฉันไม่ใช่คนที่ใช่ที่จะตอบคำถามของคุณ แต่แบบจำลองหลายระดับฟังดูสมเหตุสมผล คำใบ้ใด ๆ เกี่ยวกับตัวอย่างที่มีขนาดใหญ่มีกี่สปีชีส์และมีค่าเป็นศูนย์นับอย่างไร (ในจุดสุดท้ายมีความพยายามในการสุ่มตัวอย่างตัวอย่างหรือว่ามีอคติเหมือนคุณเพิ่งได้รับการนับจากการประกวดการตกปลาเบสซึ่งอาจจะไม่ทำให้ปลาดุก?)
Wayne

1
"จัดการกับ" หมายถึงอะไรกันแน่ สำหรับแนวคิดบางประการเกี่ยวกับการรับมือกับช่วงเวลาที่ผิดปกติให้ค้นหาไซต์นี้ใน"+ + ผิดปกติ + เวลา"
whuber

คุณสามารถอธิบายการสุ่มตัวอย่างและเป้าหมายได้หรือไม่? ยกตัวอย่างเช่นการดักจับภาพครั้งนี้คืออะไร? มันเป็นเน็ตอยู่ในกระแสในช่วงเวลาหนึ่งโดยไม่มีการปล่อยหรือไม่? คุณกำลังพยายามประเมินขนาดตัวอย่างในอนาคตหรือประชากรขนาดใหญ่กว่าที่ดึงตัวอย่างหรือไม่ มีตัวอย่างจากสถานที่ 1 แห่งหรือหลายแห่งหรือไม่ ไม่มีอะไรผิดปกติกับอนุกรมเวลาที่ผิดปกติ แต่มันยากที่จะเข้าใจการเชื่อมต่อระหว่างเหตุการณ์การสุ่มตัวอย่างและระหว่างกลุ่มตัวอย่างและตัวแปรเป้าหมายบางอย่าง (เช่นการตอบสนองต่อแบบจำลอง) นอกจากนี้ยังมีเป้าหมายในการทำนายหรืออธิบายในลักษณะ?
Iterator

2
ทำไมบางคนลงคะแนนคำถามนี้ลง ทำไมไม่ลองพัฒนาคำถามหรือคำตอบที่ดีกว่า
Iterator

2
@Iterator เพราะถึงตอนนี้หลังจาก "แก้ไขเพิ่มเติม" ไม่มีคำถามที่ชัดเจนที่นี่ downvote (ส่งหลังจากไม่ตอบสนองต่อความคิดเห็นแรกของฉัน) ถูกวางไว้เพื่อส่งเสริมให้ OP เพื่อให้การปรับปรุงที่จำเป็นเช่นเดียวกับสัญญาณของสถานะที่เกิดขึ้นเพียงบางส่วนของคำถามที่ยืนอยู่ ไม่ใช่งานของผู้อ่านทุกคน (หรือ mods สำหรับเรื่องนั้น) เพื่อคาดเดาสิ่งที่ตั้งใจ!
whuber

คำตอบ:


10

ฉันใช้เวลาค่อนข้างนานในการสร้างกรอบงานทั่วไปสำหรับอนุกรมเวลาที่ไม่สม่ำเสมอ: http://www.eckner.com/research.html

นอกจากนี้ฉันได้เขียนบทความเกี่ยวกับแนวโน้มและการประมาณค่าตามฤดูกาลสำหรับอนุกรมเวลาที่ไม่สม่ำเสมอ

ฉันหวังว่าคุณจะได้ผลลัพธ์ที่เป็นประโยชน์!


5
ขอบคุณ! การวิเคราะห์นั้นนานมาแล้วและฉันไม่ได้ทำอีกต่อไป แต่สิ่งที่คล้ายกันอาจเกิดขึ้นอีกครั้ง และอื่น ๆ จะค้นหาหัวข้อเหล่านี้มากดังนั้นความคิดเห็นของคุณจะไม่สูญเปล่า
Peter Flom

ขอบคุณสำหรับข้อมูล (และอีกหลายปีต่อมามีใครบางคนบนอินเทอร์เน็ตกำลังมองหา!) แต่การเชื่อมโยงได้หายไป
ตะขอ

2

ฉันไม่รู้ว่าตัวแบบผสมมีความเหมาะสมมากหรือไม่ (ใช้แพ็คเกจมาตรฐานที่โครงสร้างเอฟเฟกต์แบบสุ่มเป็นตัวทำนายแบบเส้นตรง) เว้นแต่คุณคิดว่าข้อมูลทุกจุดควรแลกเปลี่ยนกันได้ในบางกรณี (ในกรณีนี้ ช่วงเวลาที่ผิดปกตินั้นไม่ใช่ประเด็น) - มันคงไม่เป็นการจำลองแบบความสัมพันธ์ระหว่างกาลชั่วคราวในวิธีที่สมเหตุสมผล เป็นไปได้ที่คุณสามารถหลอกให้ Lmer () ทำสิ่งที่เป็นอัตชีวประวัติได้บ้าง แต่วิธีที่คุณทำนั้นทำให้ฉันรอดพ้นไปได้แล้วในตอนนี้ (ฉันอาจไม่ได้คิดอย่างตรงไปตรงมา) นอกจากนี้ฉันไม่แน่ใจว่า "ตัวแปรการจัดกลุ่ม" จะทำให้เกิดความสัมพันธ์อัตโนมัติในสถานการณ์แบบผสม

หากความสัมพันธ์ระหว่างกาลชั่วคราวเป็นพารามิเตอร์ที่สร้างความรำคาญและคุณไม่คาดหวังว่ามันจะเกินไปขนาดใหญ่จากนั้นคุณสามารถทิ้งข้อมูลลงในยุคที่แยกจากกันเป็นหลักในแง่ของความสัมพันธ์ (เช่นแยกอนุกรมเวลาที่จุดที่ไม่มีข้อมูลเป็นเดือน) และดูว่าเป็นข้อมูลจำลองซ้ำกัน จากนั้นคุณสามารถทำอะไรบางอย่างเช่น GEE บนชุดข้อมูลที่แก้ไขนี้ซึ่ง "คลัสเตอร์" ถูกกำหนดโดยยุคที่คุณอยู่และรายการของเมทริกซ์สหสัมพันธ์การทำงานเป็นฟังก์ชันของการสังเกตการณ์ที่แยกกัน หากฟังก์ชันการถดถอยของคุณถูกต้องคุณจะยังคงได้รับการประมาณค่าสัมประสิทธิ์การถดถอยที่สอดคล้องกันแม้ว่าโครงสร้างความสัมพันธ์จะได้รับการผิดพลาด สิ่งนี้จะช่วยให้คุณสามารถสร้างแบบจำลองเป็นข้อมูลนับโดยใช้ตัวอย่างเช่นล็อก - ลิงก์ (ซึ่งมักจะเป็นในการถดถอยปัวซอง) คุณสามารถสร้างความสัมพันธ์ต่างกันระหว่างสปีชีส์ ที่แต่ละช่วงเวลาที่ถูกมองว่าเป็นพาหะของเผ่าพันธุ์ที่มีหลายตัวแปรที่มีความสัมพันธ์ระหว่างกาลเวลาคะแนนเน่าเปื่อย สิ่งนี้จะต้องมีการประมวลผลล่วงหน้าเพื่อหลอกลวงแพ็คเกจ GEE มาตรฐานให้ทำสิ่งนี้

Ys,Ytu,v

cov(Ys,Yt)=fθ(s,t,u,v)

fθ


ขอบคุณ @ แมโคร ฉันคิดว่าแบบผสมอาจจะตกลงเพราะมักใช้สำหรับข้อมูลที่ซ้อนในเวลา ฉันไม่สนใจที่จะสร้างแบบจำลองความสัมพันธ์อัตโนมัติ - นั่นคือมันเป็นเรื่องน่ารำคาญ ฉันเห็นด้วยเวลาจะไม่เป็นเชิงเส้น แต่ฉันสามารถเพิ่มเอฟเฟ็กต์ของเวลา (ไม่แน่ใจว่าอันไหนยัง แต่ฉันสามารถสำรวจได้) ฉันไม่มี MPLUS แต่ฉันมี R และ SAS
Peter Flom

1
ฉันแค่บอกว่ารูปแบบผสมมาตรฐานอาจไม่เหมาะสมในสถานการณ์นี้ การสกัดกั้นแบบสุ่มนั้นไม่มีประโยชน์หากคุณไม่คิดว่าเวลาที่สามารถแลกเปลี่ยนกันได้ในแง่ของความสัมพันธ์ (เช่นมันจะเสนอการประมาณภายในโลก 'ความสัมพันธ์ที่แลกเปลี่ยนได้' กับโครงสร้างความสัมพันธ์ที่แท้จริงของคุณ) การรวมเวลาที่ลาดแบบสุ่มในเวลาบ่งบอกว่าคุณคิดว่าวิถีนั้น "มุ่งไปที่อื่น" เมื่อเวลาผ่านไป - เนื่องจากพล็อตไม่ได้ให้ความสว่างแก่คุณมากนี่อาจจะไม่เกิดขึ้น ฉันจะยอมรับคุณอาจหลอกให้ lmer () ทำสิ่งที่เหมาะสมกว่าได้
มาโคร

2
+1 คำตอบที่ดีรัดกุมกล่าวถึงประเด็นสำคัญทั้งหมดที่ฉันคิดว่าจะพูดถึงและอื่น ๆ เกี่ยวกับแพคเกจใน R การค้นหาของ Google ของ CRAN สำหรับ [poisson regression temporal] เปิดขึ้นหลายแพคเกจ surveillanceแพคเกจอาจจะมีการทำงานที่ต้องการ การสร้างแบบจำลองชนิดนี้ไม่ใช่เรื่องแปลกในการศึกษาทางนิเวศวิทยาดังนั้นจึงเป็นการดีที่สุดที่จะหาแพ็คเกจที่ดีในมุมมองเชิงนิเวศของ CRAN
Iterator
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.