คำถามติดแท็ก forecastability

3
จะรู้ได้อย่างไรว่าปัญหาการเรียนรู้เครื่องของคุณสิ้นหวัง?
ลองนึกภาพสถานการณ์การเรียนรู้ของเครื่องมาตรฐาน: คุณกำลังเผชิญหน้ากับชุดข้อมูลหลายตัวแปรขนาดใหญ่และคุณมีความเข้าใจที่ไม่ชัดเจน สิ่งที่คุณต้องทำคือการคาดเดาเกี่ยวกับตัวแปรตามสิ่งที่คุณมี ตามปกติคุณจะต้องล้างข้อมูลดูสถิติเชิงพรรณนาเรียกใช้บางรุ่นตรวจสอบความถูกต้องของข้อมูลเป็นต้น แต่หลังจากผ่านไปหลายครั้งพยายามกลับไปกลับมาและลองใช้แบบจำลองหลาย ๆ แบบซึ่งดูเหมือนว่าจะไม่มีอะไรเกิดขึ้น คุณสามารถใช้เวลาหลายชั่วโมงหลายวันหรือหลายสัปดาห์สำหรับปัญหาดังกล่าว ... คำถามคือเมื่อจะหยุด? คุณจะรู้ได้อย่างไรว่าข้อมูลของคุณสิ้นหวังจริง ๆ และโมเดลแฟนซีทั้งหมดจะไม่ทำให้คุณดีไปกว่าการคาดการณ์ผลลัพธ์เฉลี่ยสำหรับทุกกรณีหรือวิธีแก้ปัญหาเล็กน้อยอื่น ๆ แน่นอนว่านี่เป็นปัญหาการคาดการณ์ แต่เท่าที่ฉันรู้มันยากที่จะประเมินการคาดการณ์สำหรับข้อมูลหลายตัวแปรก่อนที่จะลองทำบางสิ่ง หรือฉันผิด คำเตือน:คำถามนี้ได้รับแรงบันดาลใจจากคำถามนี้ เมื่อไหร่ที่ฉันจะหยุดหานางแบบ? ที่ไม่ดึงดูดความสนใจมาก มันจะดีที่มีคำตอบรายละเอียดสำหรับคำถามดังกล่าวสำหรับการอ้างอิง

4
การประเมินความสามารถคาดการณ์ของอนุกรมเวลา
สมมติว่าฉันมีซีรี่ส์เวลารายเดือนมากกว่า 20,000 รายการที่ครอบคลุมตั้งแต่ Jan'05 ถึง Dec'11 แต่ละเหล่านี้แสดงข้อมูลการขายทั่วโลกสำหรับผลิตภัณฑ์ที่แตกต่างกัน ถ้าหากฉันคำนวณการคาดการณ์สำหรับแต่ละคนฉันต้องการเน้นเฉพาะผลิตภัณฑ์จำนวนเล็กน้อยที่ "สำคัญ" จริงหรือไม่ ฉันสามารถจัดอันดับผลิตภัณฑ์เหล่านั้นตามรายได้รวมต่อปีและตัดรายการโดยใช้ Pareto แบบดั้งเดิม ถึงกระนั้นฉันก็ดูเหมือนว่าแม้ว่าพวกเขาจะไม่ได้มีส่วนช่วยอะไรมาก แต่ผลิตภัณฑ์บางอย่างนั้นง่ายที่จะคาดการณ์ว่าการปล่อยพวกเขาออกไปจะเป็นการตัดสินที่ไม่ดี ผลิตภัณฑ์ที่ขายมูลค่า 50 ดอลลาร์ในแต่ละเดือนในช่วง 10 ปีที่ผ่านมาอาจไม่ฟังดูมากนัก แต่มันต้องใช้ความพยายามเพียงเล็กน้อยในการสร้างการคาดการณ์เกี่ยวกับยอดขายในอนาคตที่ฉันอาจทำได้เช่นกัน สมมุติว่าฉันแบ่งผลิตภัณฑ์ออกเป็นสี่หมวดหมู่: รายได้สูง / ง่ายต่อการคาดการณ์ - รายได้ต่ำ / ง่ายต่อการคาดการณ์ - รายได้สูง / ยากต่อการคาดการณ์ - รายได้ต่ำ / ยากต่อการคาดการณ์ ฉันคิดว่ามันสมเหตุสมผลที่จะทิ้งไว้ข้างหลังเฉพาะซีรี่ส์เวลาที่เป็นของกลุ่มที่สี่ แต่ฉันจะประเมิน "การคาดการณ์" ได้อย่างไร ค่าสัมประสิทธิ์ของความแปรปรวนดูเหมือนจะเป็นจุดเริ่มต้นที่ดี แต่จะเกิดอะไรขึ้นถ้าอนุกรมเวลาของฉันแสดงฤดูกาล / การเลื่อนระดับ / เอฟเฟกต์ปฏิทิน / แนวโน้มที่แข็งแกร่ง ฉันคิดว่าฉันควรประเมินจากการสุ่มส่วนประกอบเท่านั้นและไม่ใช่หนึ่งในข้อมูล …

2
วิธีตรวจสอบการคาดการณ์ของอนุกรมเวลา
หนึ่งในประเด็นสำคัญที่นักพยากรณ์ประสบคือถ้าซีรีส์ที่กำหนด สามารถคาดการณ์ได้หรือไม่? ฉันสะดุดกับบทความเรื่อง " เอนโทรปีในฐานะตัวบ่งชี้การพยากรณ์ของ Priori " โดย Peter Catt ที่ใช้Entropimate Entropy (ApEn) เป็นตัวชี้วัดที่สัมพันธ์กันเพื่อกำหนดชุดเวลาที่กำหนด บทความกล่าวว่า "ค่า ApEn ที่เล็กลงบ่งชี้ว่ามีโอกาสมากขึ้นที่ชุดข้อมูลจะตามด้วยข้อมูลที่คล้ายกัน (ความเป็นปกติ) ในทางกลับกันค่าที่ใหญ่กว่าของ ApEn บ่งชี้ว่าโอกาสที่ข้อมูลที่คล้ายกันซ้ำกันจะลดลง การสุ่มและความซับซ้อนของระบบ " และตามด้วยสูตรทางคณิตศาสตร์สำหรับการคำนวณ ApEn นี่เป็นวิธีการที่น่าสนใจเพราะให้ค่าตัวเลขที่สามารถใช้ในการประเมินความคาดการณ์ในแง่ที่เกี่ยวข้อง ฉันไม่รู้ว่า Entropy หมายถึงอะไรฉันกำลังอ่านเพิ่มเติมเกี่ยวกับเรื่องนี้ มีแพคเกจที่เรียกว่าเป็นpracmaในRที่ช่วยให้คุณคำนวณ Apen เพื่อวัตถุประสงค์ในการอธิบายฉันใช้อนุกรมเวลา 3 แบบและคำนวณตัวเลข ApEn อันดับ 1:ซีรี่ส์เวลาของ AirPassenger ที่มีชื่อเสียง - ถูกกำหนดไว้สูงและเราควรคาดการณ์ได้ง่าย Series 2: Sunspot Time Series - ถูกกำหนดไว้อย่างดี แต่ควรคาดการณ์ได้น้อยกว่า …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.