วิธีการค้นหาเมื่อกราฟถึงจุดสูงสุดและที่ราบสูง?


9

นี่อาจฟังดูธรรมดามาก แต่ฉันมีปัญหานี้: ฉันมีคิวของข้อมูลที่มีขนาดหน้าต่าง 300 ข้อมูลใหม่ถูกเพิ่มที่ปลายด้านหนึ่งค่าเก่าจะถูกลบออกจากปลายอีกด้าน

ฉันคาดว่าข้อมูลคิวจะคงที่หรือมากกว่านั้นเช่น 10,12,15,10,20 จากนั้นเริ่มเพิ่มขึ้นอย่างรวดเร็ว: 15,10,20,22,25,26,28,30,32 ... ไปจนถึง 150 หรือมากกว่านั้น ข้อมูลอาจมีความผันผวนเล็กน้อยจากนั้นจะลงไปตามความลาดชันที่คล้ายกัน (120,118,116,115 ... ) ไปจนถึง 20 หรือมากกว่านั้น

ฉันพยายามระบุจุดเปลี่ยนในชุดข้อมูลนี้โดยทางโปรแกรม แต่โค้ดของฉันตรวจพบจุดสูงสุดบ่อยกว่าที่ฉันต้องการ ฉันจะระบุได้อย่างไรเมื่อกราฟเพิ่มขึ้นเมื่อมาถึงจุดเปลี่ยนที่แน่นอนและเมื่อมันเริ่มลดลง ฉันควรลองดูที่อัตราการเปลี่ยนแปลงของอัตราการเปลี่ยนแปลงหรือไม่


หากคุณมีความรู้สึกที่สมเหตุสมผลเกี่ยวกับความลาดชันและความสูงของยอดเขาคุณสามารถคำนึงถึงความสูงและระยะเวลาในการปีนเขาและความชันปัจจุบันได้หรือไม่? คุณมีข้อมูลเกี่ยวกับจุดสูงสุดก่อนหน้านี้เท่าไหร่และคุณสามารถใช้ข้อมูลเหล่านี้ให้พอดีกับแบบจำลองได้หรือไม่?
Karl

2
ไม่ว่าวิธีการใดคุณจะต้องกำหนดว่าอะไรคือจุดสูงสุดและที่ราบสูงคืออะไร สองค่า 'สูง' ติดต่อกันเป็นยอดหรือที่ราบสูง? แล้วห้าอันล่ะ วิธีการบางอย่างอาจไม่ต้องการข้อมูลนี้ แต่ก็ถูกซ่อนอยู่หลังฉาก บ่อยครั้งที่มันเกิดขึ้นเพื่อกำหนดปัญหาของคุณอย่างเหมาะสมและปรับพารามิเตอร์ของคุณ (และ / หรืออัลกอริทึม) ให้เหมาะสม
Nick Sabbe

คำตอบ:


2

หากคุณรู้ว่านี่เป็นรูปแบบที่แน่นอนที่คุณคาดหวังจากนั้นคุณสามารถมองหารูปแบบที่แน่นอน แต่คุณจะพลาดรูปแบบอื่น ๆ ดังนั้น. ถ้าคุณรู้ว่าจุดสูงสุดจะเป็น 150 คุณก็สามารถหาค่า 2 หรือ 3 หรือ 4 หรือ (อย่างไรก็ตามหลายค่า) ติดต่อกันเป็น 150 แต่คุณพูดว่า "หรือมากกว่านั้น" - "มีขนาดใหญ่แค่ไหน" บางทีจุดสูงสุดถูกกำหนดเป็น "3 ค่าติดต่อกันมากกว่า 130" หรืออาจเป็น "3 ใน 5 ค่าติดต่อกันมากกว่า 140" สำหรับคุณที่จะตัดสินใจ

ในทางกลับกันหากคุณเพียงแค่กำลังมองหาโปรแกรมทั่วไปที่จะตรวจจับจุดสูงสุด - นั่นก็คือการมองที่ มีวิธีการปรับให้เรียบ (เช่นเหลือง, เส้นโค้งหลายประเภท, ค่าเฉลี่ยเคลื่อนที่เป็นต้น) ไม่ใช่สาขาที่ฉันเชี่ยวชาญ แต่มีวรรณกรรมมากมายเกี่ยวกับเรื่องนี้


4

มองไปที่SiZer (ทางแยกที่สำคัญของ ZERo ... หรือทางลาดฉันจำไม่ได้) ถึงแม้ว่าเนื้อหาจะเป็นส่วนข้ามมากกว่าเครื่องมืออนุกรมเวลา ความคิดที่จะทำให้ข้อมูลที่แบนด์วิดท์ต่าง ๆ (แตกต่างกันไปตามคำสั่งของสามขนาด) และใช้การทดสอบในท้องถิ่นเพื่อดูว่าความชันของการถดถอยในท้องถิ่นนั้นมีความหมายในเชิงบวกหรือเชิงลบอย่างมีนัยสำคัญ มันสร้างภาพที่น่าเชื่อถือซึ่งจะช่วยคุณในการพิจารณาว่ามีฟีเจอร์ใดบ้าง (ฉันประหลาดใจที่ไม่มีการนำ R มาใช้เพียง Matlab)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.