การวิเคราะห์อนุกรมเวลาที่มีค่าเป็นศูนย์จำนวนมาก


19

ปัญหานี้เป็นจริงเกี่ยวกับการตรวจจับอัคคีภัย แต่ก็คล้ายกับปัญหาการตรวจจับการสลายตัวของกัมมันตภาพรังสี ปรากฏการณ์ที่ถูกสังเกตมีทั้งเป็นระยะและแปรผันสูง ดังนั้นอนุกรมเวลาจะประกอบด้วยสตริงยาวเป็นศูนย์ซึ่งถูกขัดจังหวะด้วยค่าตัวแปร

วัตถุประสงค์ไม่ได้เป็นเพียงการรวบรวมเหตุการณ์ (แบ่งเป็นศูนย์) แต่เป็นการอธิบายลักษณะเชิงปริมาณของเหตุการณ์เอง อย่างไรก็ตามเซ็นเซอร์มีข้อ จำกัด และบางครั้งจะบันทึกเป็นศูนย์แม้ว่า "ความจริง" จะไม่เป็นศูนย์ ด้วยเหตุผลนี้จึงต้องรวมศูนย์เมื่อเปรียบเทียบเซ็นเซอร์

เซ็นเซอร์ B อาจมีความไวมากกว่าเซ็นเซอร์ A และฉันอยากจะอธิบายสถิติได้ สำหรับการวิเคราะห์นี้ฉันไม่มี "ความจริง" แต่ฉันมีเซนเซอร์ C ซึ่งเป็นอิสระจากเซ็นเซอร์ A&B ดังนั้นความคาดหวังของฉันคือข้อตกลงที่ดีกว่าระหว่าง A / B และ C บ่งชี้ถึงข้อตกลงที่ดีกว่ากับ "ความจริง" (นี่อาจดูสั่นคลอน แต่คุณจะต้องเชื่อใจฉัน - ฉันอยู่บนพื้นแข็งที่นี่ตามสิ่งที่เป็นที่รู้จักจากการศึกษาอื่น ๆ เกี่ยวกับเซ็นเซอร์)

จากนั้นปัญหาคือวิธีหาปริมาณ "ข้อตกลงที่ดีกว่าของอนุกรมเวลา" ความสัมพันธ์เป็นตัวเลือกที่ชัดเจน แต่จะได้รับผลกระทบจากศูนย์ทั้งหมด (ซึ่งไม่สามารถละทิ้งได้) และแน่นอนได้รับผลกระทบอย่างไม่เป็นสัดส่วนจากค่าสูงสุด สามารถคำนวณ RMSE ได้เช่นกัน แต่จะถูกถ่วงน้ำหนักอย่างมากต่อพฤติกรรมของเซ็นเซอร์ในกรณีใกล้ศูนย์

คำถามที่ 1: วิธีที่ดีที่สุดในการปรับขนาดแบบลอการิทึมให้เป็นค่าที่ไม่ใช่ศูนย์ที่จะรวมกับศูนย์ในการวิเคราะห์อนุกรมเวลาคืออะไร

คำถามที่ 2: "แนวปฏิบัติที่ดีที่สุด" ที่คุณสามารถแนะนำสำหรับการวิเคราะห์อนุกรมเวลาของประเภทนี้โดยที่การทำงานที่ค่าที่ไม่ใช่ศูนย์คือการมุ่งเน้น แต่ค่าศูนย์จะครองและไม่สามารถแยกออก

คำตอบ:


11

เพื่อย้ำคำถามของคุณ“ นักวิเคราะห์จัดการกับความต้องการในระยะยาวโดยไม่เรียกร้องตามรูปแบบที่เฉพาะเจาะจงได้อย่างไร”

คำตอบสำหรับคำถามของคุณคือการวิเคราะห์อุปสงค์เป็นระยะหรือการวิเคราะห์ข้อมูลแบบเบาบาง สิ่งนี้เกิดขึ้นตามปกติเมื่อคุณมี "ศูนย์จำนวนมาก" เมื่อเทียบกับจำนวนที่ไม่เป็นศูนย์ปัญหาคือมีตัวแปรสุ่มสองตัว เวลาระหว่างเหตุการณ์และขนาดที่คาดหวังของเหตุการณ์ อย่างที่คุณบอกว่าการหาค่าอัตโนมัติ (acf) ของชุดการอ่านที่สมบูรณ์นั้นไม่มีความหมายเนื่องจากลำดับของเลขศูนย์ทำให้การเพิ่ม acf ผิดพลาด คุณสามารถติดตามหัวข้อเช่น "วิธีการของ Croston" ซึ่งเป็นขั้นตอนที่ใช้แบบจำลองมากกว่าขั้นตอนที่ใช้ข้อมูลวิธีของ Croston มีความเสี่ยงต่อค่าผิดปกติและการเปลี่ยนแปลง / แนวโน้ม / ระดับกะในอัตราความต้องการเช่นความต้องการหารด้วยจำนวน ช่วงเวลาตั้งแต่ความต้องการครั้งสุดท้ายวิธีการที่เข้มงวดกว่านี้มากคือการติดตาม "ข้อมูลที่กระจัดกระจาย - ข้อมูลที่เว้นระยะไม่เท่ากัน" หรือค้นหาเช่นนั้น คำแนะนำที่ชาญฉลาดคือทางออกโดยศาสตราจารย์ Ramesh Sharda จาก OSU และฉันได้ใช้มันมาหลายปีในการฝึกฝนการให้คำปรึกษา หากซีรี่ส์มีจุดเวลาที่ยอดขายเพิ่มขึ้นและระยะเวลานานที่ไม่มียอดขายเกิดขึ้นคุณสามารถแปลงยอดขายเป็นยอดขายต่องวดโดยแบ่งการขายที่สังเกตได้ด้วยจำนวนระยะเวลาที่ไม่มีการขายจึงทำให้ได้อัตรา จากนั้นจึงสามารถระบุรูปแบบระหว่างอัตราและช่วงเวลาระหว่างยอดขายสูงสุดในอัตราที่คาดการณ์และช่วงเวลาที่คาดการณ์ไว้ คุณสามารถหาข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้ได้ที่ autobox.com และ google "ความต้องการต่อเนื่อง" หากซีรี่ส์มีจุดเวลาที่ยอดขายเพิ่มขึ้นและระยะเวลานานที่ไม่มียอดขายเกิดขึ้นคุณสามารถแปลงยอดขายเป็นยอดขายต่องวดโดยแบ่งการขายที่สังเกตได้ด้วยจำนวนระยะเวลาที่ไม่มีการขายจึงทำให้ได้อัตรา จากนั้นจึงสามารถระบุรูปแบบระหว่างอัตราและช่วงเวลาระหว่างยอดขายสูงสุดในอัตราที่คาดการณ์และช่วงเวลาที่คาดการณ์ไว้ คุณสามารถหาข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้ได้ที่ autobox.com และ google "ความต้องการต่อเนื่อง" หากซีรี่ส์มีจุดเวลาที่ยอดขายเพิ่มขึ้นและระยะเวลานานที่ไม่มียอดขายเกิดขึ้นคุณสามารถแปลงยอดขายเป็นยอดขายต่องวดโดยแบ่งการขายที่สังเกตได้ด้วยจำนวนระยะเวลาที่ไม่มีการขายจึงทำให้ได้อัตรา จากนั้นจึงสามารถระบุรูปแบบระหว่างอัตราและช่วงเวลาระหว่างยอดขายสูงสุดในอัตราที่คาดการณ์และช่วงเวลาที่คาดการณ์ไว้ คุณสามารถหาข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้ได้ที่ autobox.com และ google "ความต้องการต่อเนื่อง"


1
ฉันมีปัญหาในการพยากรณ์ด้วยอุปสงค์ที่ไม่ต่อเนื่อง ฉันถูกขอให้แก้ไข ฉันรู้ว่ามีหลายโปรแกรมเฉพาะสำหรับช่วงเวลาของการพยากรณ์นี้ แต่ไม่ฟรี คุณช่วยบอกฉันหน่อยได้ไหมว่าคุณรู้จักฟังก์ชั่นในตัวของซอฟต์แวร์โอเพ่นซอร์ส (เช่น R เป็นต้น) เพื่อแก้ปัญหานี้หรือไม่? ฉันค้นหามาแล้ว แต่หาไม่พบ ... ขอบคุณ!
Assu

1
@assu: ฉันไม่รู้ซอฟต์แวร์ฟรีใด ๆ ที่ตรงกับความต้องการของคุณ
IrishStat

4
@assu croston()ฟังก์ชั่นในforecastแพคเกจในการวิจัยจะใช้วิธีการ Croston สำหรับข้อมูลการพยากรณ์ความต้องการต่อเนื่อง
Rob Hyndman
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.