เหตุใดการคาดการณ์ของอนุกรมเวลาจึง“ แย่มาก”


15

ฉันพยายามเรียนรู้วิธีใช้ Neural Networks ฉันกำลังอ่านบทช่วยสอนนี้

หลังจากติดตั้งโครงข่ายประสาทในอนุกรมเวลาโดยใช้ค่าที่เพื่อทำนายค่าที่t + 1ผู้เขียนได้รับพล็อตต่อไปนี้โดยที่เส้นสีฟ้าคืออนุกรมเวลาสีเขียวคือการทำนายข้อมูลรถไฟสีแดงคือ การคาดการณ์ข้อมูลการทดสอบ (เขาใช้การทดสอบรถไฟแบบแยก)เสื้อเสื้อ+1p1

และเรียกมันว่า "เราจะเห็นว่าแบบจำลองนั้นทำงานได้ค่อนข้างแย่ในการปรับทั้งชุดฝึกอบรมและชุดทดสอบ

เสื้อเสื้อ-1เสื้อ-2เสื้อ+1

P2

และพูดว่า "เมื่อมองที่กราฟเราจะเห็นโครงสร้างเพิ่มเติมในการทำนาย"

คำถามของฉัน

ทำไมคนยากจนคนแรก? มันเกือบจะสมบูรณ์แบบสำหรับฉันมันทำนายการเปลี่ยนแปลงทุกอย่างสมบูรณ์แบบ

และในทำนองเดียวกันทำไมอันดับสองถึงดีกว่า? "โครงสร้าง" อยู่ที่ไหน สำหรับฉันมันดูด้อยกว่าครั้งแรกมาก

โดยทั่วไปการคาดการณ์ของซีรีย์เวลาจะดีและเมื่อไร


3
ตามความคิดเห็นทั่วไปวิธีการ ML ส่วนใหญ่ใช้สำหรับการวิเคราะห์แบบตัดขวางและต้องการการปรับเปลี่ยนที่จะนำไปใช้สำหรับอนุกรมเวลา เหตุผลหลักคือความสัมพันธ์ของข้อมูลโดยอัตโนมัติในขณะที่ ML มักจะคิดว่าข้อมูลเป็นอิสระในวิธีการที่นิยมมากที่สุด
Aksakal

11
มันเป็นงานที่ยอดเยี่ยมในการทำนายการเปลี่ยนแปลงทุกอย่าง ... ทันทีหลังจากที่มันเกิดขึ้น!
ฮอบส์

@ ฮอบส์ฉันไม่ได้พยายามใช้ t, t-1, t-2 และอื่น ๆ เพื่อทำนาย t + 1 ฉันสงสัยว่าคุณรู้หรือไม่ว่าในอดีตมีเงื่อนไขการใช้บริการกี่คำ หากเราใช้มากเกินไป
Euler_Salter

มันจะมีความสว่างมากขึ้นในการพล็อตสิ่งตกค้าง
reo katoa

คำตอบ:


23

มันเป็นภาพลวงตาออพติคอล: ตามองที่กราฟและเห็นว่ากราฟสีแดงและสีน้ำเงินอยู่ติดกัน ปัญหาคือพวกเขาอยู่ติดกันในแนวนอนแต่สิ่งที่สำคัญคือแนวตั้งระยะทาง ดวงตามองเห็นระยะห่างระหว่างเส้นโค้งในพื้นที่สองมิติของกราฟคาร์ทีเซียนได้ง่ายที่สุด แต่สิ่งที่สำคัญคือระยะทางหนึ่งมิติภายในค่า t ที่เฉพาะเจาะจง ตัวอย่างเช่นสมมติว่าเรามีคะแนน A1 = (10,100), A2 = (10.1, 90), A3 = (9.8,85), P1 = (10.1,100.1) และ P2 = (9.8, 88) ดวงตาจะเปรียบเทียบ P1 กับ A1 โดยธรรมชาติเพราะนั่นคือจุดที่ใกล้ที่สุดขณะที่ P2 จะเปรียบเทียบกับ A2 เนื่องจาก P1 ใกล้กับ A1 มากกว่า P2 ถึง A3 ดังนั้น P1 จึงดูเหมือนการทำนายที่ดีกว่า แต่เมื่อคุณเปรียบเทียบ P1 กับ A1 คุณแค่ดูว่า A1 สามารถทำซ้ำสิ่งที่เห็นก่อนหน้าได้ดีเพียงใด สำหรับ A1, P1 ไม่ใช่การทำนาย. การเปรียบเทียบที่เหมาะสมคือระหว่าง P1 v. A2 และ P2 v. A3 และในการเปรียบเทียบ P2 นี้ดีกว่า P1 มันจะมีความชัดเจนมากขึ้นถ้านอกเหนือไปจากการวางแผน y_actual และ y_pred เทียบกับ t จะมีกราฟของ (y_pred-y_actual) เทียบกับ t


2
นี่เป็นคำตอบที่ดีกว่าเนื่องจากคำตอบอื่น ๆ ไม่ได้กล่าวถึงสาเหตุที่การคาดการณ์ที่ "ดูดี" นั้นแย่ในขณะที่คุณทำงานที่ยอดเยี่ยม!
Richard Hardy

17

ทำไมคนยากจนคนแรก? มันเกือบจะสมบูรณ์แบบสำหรับฉันมันทำนายการเปลี่ยนแปลงทุกอย่างสมบูรณ์แบบ

มันเป็นสิ่งที่เรียกว่า "การเปลี่ยนแปลง" การคาดการณ์ หากคุณดูแผนภูมิ 1 อย่างใกล้ชิดยิ่งขึ้นคุณจะเห็นว่าพลังการทำนายนั้นเป็นเพียงการคัดลอกค่าเกือบเท่าสุดท้ายที่เห็น นั่นหมายความว่าแบบจำลองไม่ได้เรียนรู้อะไรที่ดีขึ้นและมันถือว่าอนุกรมเวลาเป็นการเดินแบบสุ่ม ฉันเดาว่าปัญหาอาจเกิดขึ้นได้ในความจริงที่คุณใช้ข้อมูลดิบที่คุณป้อนไปยังเครือข่ายประสาท ข้อมูลเหล่านี้ไม่คงที่ซึ่งทำให้เกิดปัญหาทั้งหมด


8
ในการคาดการณ์สิ่งนี้เรียกว่าการคาดการณ์ "ไร้เดียงสา" เช่นใช้การสังเกตครั้งสุดท้ายเป็นการคาดการณ์
Aksakal

ขอขอบคุณ! @Aksakal คุณรู้หรือไม่ว่าควรใช้ค่าก่อนหน้านี้ในการทำนายจำนวนเท่าใด
Euler_Salter

มุ่งเน้นไปที่ความนิ่ง ความล่าช้าในการเขียนคู่ควรจะค่อนข้างดีสำหรับซีรี่ส์ในเวลานี้ ดีกว่า 100 nonstationary ล่าช้า
Alexey Burnakov

ในอนุกรมเวลามีวิธีที่จะทำให้เดาได้ดีเกี่ยวกับโครงสร้างความล่าช้าผ่าน ACF และ PACF ค้นหาฟอรั่มนี้มีหลายโพสต์เกี่ยวกับวิธีการที่จะทำ
Aksakal

@AlexeyBurnakov ดังนั้นหมายความว่าฉันควรจะแปลงให้เป็นเครื่องเขียนหรือไม่?
Euler_Salter
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.