หนึ่งในประเด็นสำคัญที่นักพยากรณ์ประสบคือถ้าซีรีส์ที่กำหนด สามารถคาดการณ์ได้หรือไม่?
ฉันสะดุดกับบทความเรื่อง " เอนโทรปีในฐานะตัวบ่งชี้การพยากรณ์ของ Priori " โดย Peter Catt ที่ใช้Entropimate Entropy (ApEn) เป็นตัวชี้วัดที่สัมพันธ์กันเพื่อกำหนดชุดเวลาที่กำหนด
บทความกล่าวว่า
"ค่า ApEn ที่เล็กลงบ่งชี้ว่ามีโอกาสมากขึ้นที่ชุดข้อมูลจะตามด้วยข้อมูลที่คล้ายกัน (ความเป็นปกติ) ในทางกลับกันค่าที่ใหญ่กว่าของ ApEn บ่งชี้ว่าโอกาสที่ข้อมูลที่คล้ายกันซ้ำกันจะลดลง การสุ่มและความซับซ้อนของระบบ "
และตามด้วยสูตรทางคณิตศาสตร์สำหรับการคำนวณ ApEn นี่เป็นวิธีการที่น่าสนใจเพราะให้ค่าตัวเลขที่สามารถใช้ในการประเมินความคาดการณ์ในแง่ที่เกี่ยวข้อง ฉันไม่รู้ว่า Entropy หมายถึงอะไรฉันกำลังอ่านเพิ่มเติมเกี่ยวกับเรื่องนี้
มีแพคเกจที่เรียกว่าเป็นpracmaในR
ที่ช่วยให้คุณคำนวณ Apen เพื่อวัตถุประสงค์ในการอธิบายฉันใช้อนุกรมเวลา 3 แบบและคำนวณตัวเลข ApEn
- อันดับ 1:ซีรี่ส์เวลาของ AirPassenger ที่มีชื่อเสียง - ถูกกำหนดไว้สูงและเราควรคาดการณ์ได้ง่าย
- Series 2: Sunspot Time Series - ถูกกำหนดไว้อย่างดี แต่ควรคาดการณ์ได้น้อยกว่า Series 1
- ซีรีส์ 3:หมายเลขสุ่มไม่มีวิธีใดที่จะคาดเดาซีรี่ส์นี้ได้
ดังนั้นถ้าเราคำนวณ ApEn, Series 1 ควรน้อยกว่า Series 2 น่าจะน้อยกว่า Series 3 มาก
ด้านล่างคือตัวอย่างข้อมูล R ที่คำนวณ ApEn สำหรับทั้งสามซีรี่ส์
library("pracma")
> series1 <- approx_entropy(AirPassengers)
> series1
[1] 0.5157758
> series2 <- approx_entropy(sunspot.year)
> series2
[1] 0.762243
> series3 <- approx_entropy(rnorm(1:30))
> series3
[1] 0.1529609
นี่ไม่ใช่สิ่งที่ฉันคาดหวัง ซีรี่ส์สุ่มมีจำนวนต่ำกว่าซีรี่ส์ AirPassenger ที่กำหนดไว้อย่างดี แม้ว่าฉันจะเพิ่มจำนวนสุ่มเป็น 100 ฉันก็ยังได้รับสิ่งต่อไปนี้ซึ่งน้อยกว่าซีรี่ส์ 2 / Sunspot.yealry ที่กำหนดไว้อย่างดี
> series3 <- approx_entropy(rnorm(1:100))
> series3
[1] 0.747275
ด้านล่างเป็นคำถามของฉัน:
- มี 2 พารามิเตอร์ในการคำนวณ ApEn (
m
และr
)? วิธีการตรวจสอบพวกเขา Iused เริ่มต้นในR
รหัสข้างต้น - ฉันกำลังทำอะไรผิดพลาดซึ่งแสดงว่าไม่ถูกต้องว่า ApEn ต่ำกว่าสำหรับตัวเลขสุ่มเทียบกับซีรี่ส์ที่กำหนดไว้อย่างดีเช่น sunspot.yearly
- ฉันควร deseasonalize / detrend ซีรี่ส์แล้วประเมิน ApEn อย่างไรก็ตามผู้เขียนได้ใช้ ApEn โดยตรงกับซีรีส์
- มีวิธีอื่นอีกไหมในการพิจารณาว่าชุดนั้นสามารถคาดการณ์ได้หรือไม่?