ฉันกำลังสร้างเครื่องมือพยากรณ์แบบโต้ตอบ (เป็นไพ ธ อน) เพื่อช่วยในการพยากรณ์ที่ทำในองค์กรของฉัน จนถึงปัจจุบันกระบวนการพยากรณ์ได้รับแรงผลักดันจากมนุษย์เป็นส่วนใหญ่โดยนักพยากรณ์จะดูดซึมข้อมูลในเครือข่ายประสาทธรรมชาติของพวกเขาและใช้ความรู้สึกที่ได้เรียนรู้เพื่อคาดการณ์ จากการตรวจสอบการคาดการณ์ระยะยาวและการศึกษาการสร้างแบบจำลองเชิงทำนายที่ฉันทำฉันพบว่าคุณอาจคาดหวัง นักพยากรณ์ที่แตกต่างกันแสดงอคติที่แตกต่างกันผลกระทบของนักทำนายบางคนดูเหมือนจะพูดเกินจริงและคนอื่น ๆ ที่สำคัญดูเหมือนว่าจะถูกเพิกเฉยและโดยทั่วไปประสิทธิภาพของการพยากรณ์นั้นค่อนข้างปานกลาง
การคาดการณ์จะยังคงเป็นคู่มือ แต่ฉันกำลังพยายามสร้างเครื่องมือที่มีประโยชน์เพื่อให้นักพยากรณ์ได้ปริมาณที่ดีขึ้นของผลกระทบสัมพัทธ์ของตัวทำนาย นอกจากนี้ยังมีเอฟเฟกต์ที่สำคัญเช่นอิทธิพลตามฤดูกาลที่มักถูกมองข้ามว่าฉันต้องการให้เครื่องมือเน้นไปที่ผู้ใช้ ฉันคาดหวังระดับ backlash และความสงสัยเกี่ยวกับกระบวนการสร้างแบบจำลองจากนักพยากรณ์ 'ที่มีประสบการณ์' บางคน (หลายคนมีความรู้อย่างเป็นทางการเกี่ยวกับสถิติ) ดังนั้นการสื่อสารจึงมีความสำคัญน้อยที่สุดและประสิทธิภาพของตัวแบบในแง่ของ บรรลุการปรับปรุงที่วัดได้ในความถูกต้องของการคาดการณ์
แบบจำลองที่ฉันกำลังพัฒนามีองค์ประกอบถอยหลังอัตโนมัติที่แข็งแกร่งซึ่งบางครั้งก็มีการแก้ไขอย่างมีนัยสำคัญโดยเหตุการณ์ที่แสดงเป็นค่าที่วัดได้ในตัวทำนายบางตัวที่อยู่ในช่วงเวลาที่ไม่ใช่เหตุการณ์ สิ่งนี้สอดคล้องกับโมเดลจิตที่นักพยากรณ์ใช้ ส่วนสำคัญคือความสามารถในการแสดงให้เห็นว่าการวัด 'เหตุการณ์' ใดมีอิทธิพลมากที่สุดในการผลักดันการทำนายออกไปจากค่าการถดถอยอัตโนมัติสำหรับการคาดการณ์ใด ๆ ฉันถ่ายภาพกระบวนการด้วยวิธีนี้ ผู้พยากรณ์ทำนายค่าที่ดีที่สุดของพวกเขาแบบจำลองเสนอสิ่งที่แตกต่างและผู้ทำนายถามว่าทำไม แบบจำลองตอบกลับบางสิ่งเช่น "ดูที่นี่ค่านี้ของตัวทำนายนี้จะเพิ่มค่าการคาดการณ์ในฤดูร้อนถ้าเป็นฤดูหนาวมันจะย้ายไปทางอื่นฉันรู้ว่ามีการวัดอื่น ๆ เหล่านี้
ทีนี้ลองนึกภาพตัวแบบคือการถดถอยเชิงเส้นอย่างง่าย ใคร ๆ ก็จินตนาการได้ว่าการแสดง 'ผล' สัมพัทธ์ของตัวทำนายตามเหตุการณ์โดยการคูณค่าด้วยแบบจำลองประสิทธิภาพร่วมกันและแสดงเป็นแผนภูมิแท่งแบบง่าย แท่งทั้งหมดจากตัวทำนายที่ต่างกันรวมถึงค่าเบี่ยงเบนทั้งหมดจากค่า AR และสิ่งนี้แสดงให้เห็นอย่างชัดเจนและชัดเจนว่าในกรณีนี้มีอิทธิพลอย่างมาก
ปัญหาคือกระบวนการคาดการณ์แสดงระดับความไม่เป็นเชิงเส้นในตัวทำนายสูงหรืออย่างน้อยฉันก็ประสบความสำเร็จมากขึ้นกับอัลกอริธึมการเรียนรู้ของเครื่องที่ไม่เป็นเชิงเส้นกล่องดำ (ฟอเรสต์แบบสุ่มและ GBM) ชุดข้อมูลนี้ เป็นการดีที่ฉันต้องการที่จะสามารถเปลี่ยนรูปแบบการทำงาน 'ภายใต้ประทุน' ได้อย่างราบรื่นโดยไม่มีการเปลี่ยนแปลงประสบการณ์ของผู้ใช้ดังนั้นฉันต้องการวิธีการทั่วไปในการแสดงให้เห็นถึงความสำคัญของการวัดที่แตกต่างกันโดยไม่ต้องใช้วิธีเฉพาะ วิธีการปัจจุบันของฉันคือการตั้งค่าผลกระทบเชิงเส้นเสมือนโดยการตั้งค่าทั้งหมดเป็นศูนย์ยกเว้นสำหรับตัวทำนายหนึ่งบันทึกการเบี่ยงเบนที่ทำนายแล้วทำซ้ำสำหรับตัวทำนายทั้งหมดโดยแสดงผลลัพธ์ในแผนภูมิแท่งที่กล่าวถึงข้างต้น ในการปรากฏตัวของที่ไม่ใช่เชิงเส้นที่แข็งแกร่งนี้อาจทำงานได้ไม่ดี