ฉันถามคำถามนี้ในเว็บไซต์ matemathics stackexchange และแนะนำให้ถามที่นี่
ฉันกำลังทำงานในโครงการงานอดิเรกและต้องการความช่วยเหลือเกี่ยวกับปัญหาต่อไปนี้
บริบทนิดหน่อย
สมมติว่ามีชุดของรายการพร้อมคำอธิบายคุณสมบัติและราคา ลองนึกภาพรายการรถยนต์และราคา รถยนต์ทุกคันมีรายการคุณสมบัติเช่นขนาดเครื่องยนต์สีพลังม้ารุ่นปี ฯลฯ สำหรับแต่ละยี่ห้อมีดังนี้:
Ford:
V8, green, manual, 200hp, 2007, $200
V6, red, automatic, 140hp, 2010, $300
V6, blue, manual, 140hp, 2005, $100
...
ยิ่งไปกว่านั้นรายการรถยนต์ที่มีราคาจะถูกเผยแพร่พร้อมช่วงเวลาหนึ่งซึ่งหมายความว่าเราสามารถเข้าถึงข้อมูลราคาในอดีตได้ อาจไม่รวมถึงรถยนต์คันเดียวกันทุกประการ
ปัญหา
ฉันต้องการที่จะเข้าใจวิธีการกำหนดราคาสำหรับรถใด ๆ ตามข้อมูลฐานนี้ที่สำคัญที่สุดคือรถยนต์ที่ไม่ได้อยู่ในรายการเริ่มต้น
Ford, v6, red, automatic, 130hp, 2009
สำหรับรถด้านบนมันเกือบจะเหมือนกันกับหนึ่งในรายการเพียงเล็กน้อยแตกต่างกันในพลังม้าและปี ราคานี้สิ่งที่จำเป็น?
สิ่งที่ฉันกำลังมองหาคือสิ่งที่ใช้งานได้จริงและเรียบง่าย แต่ฉันอยากจะได้ยินเกี่ยวกับวิธีการที่ซับซ้อนมากขึ้นในการสร้างแบบจำลองเช่นนี้
สิ่งที่ฉันได้ลอง
นี่คือสิ่งที่ฉันกำลังทดลองด้วย:
1) ใช้ข้อมูลประวัติเพื่อค้นหารถ X หากไม่พบไม่มีราคา แน่นอนว่ามีข้อ จำกัด อย่างมากและสามารถใช้ร่วมกับการสลายตัวของเวลาเพื่อแก้ไขราคารถยนต์ที่รู้จักเท่านั้น
2) การใช้รูปแบบการให้น้ำหนักคุณลักษณะของรถยนต์ร่วมกับรถตัวอย่างราคา โดยพื้นฐานแล้วมีราคาฐานและคุณสมบัติเพียงแค่เปลี่ยนแปลงด้วยปัจจัยบางอย่าง ราคานี้ขึ้นอยู่กับรถคันใด
การพิสูจน์ครั้งแรกไม่เพียงพอและการพิสูจน์ครั้งที่สองไม่ถูกต้องเสมอไปและฉันอาจไม่มีวิธีที่ดีที่สุดในการใช้ตุ้มน้ำหนัก นี่ก็ดูเหมือนว่าจะหนักในการรักษาน้ำหนักดังนั้นฉันคิดว่าอาจมีวิธีใช้ข้อมูลประวัติเป็นสถิติในบางวิธีเพื่อให้ได้น้ำหนักหรือเพื่อให้ได้สิ่งอื่น ฉันแค่ไม่รู้ว่าจะเริ่มจากตรงไหน
ประเด็นสำคัญอื่น ๆ
- รวมเข้ากับโครงการซอฟต์แวร์บางอย่างที่ฉันมี ทั้งโดยใช้ห้องสมุดที่มีอยู่หรือเขียนอัลกอริทึมด้วยตัวเอง
- คำนวณใหม่อย่างรวดเร็วเมื่อมีข้อมูลประวัติใหม่เข้ามา
ข้อเสนอแนะใด ๆ ว่าปัญหาเช่นนี้จะเกิดขึ้นได้อย่างไร? ความคิดทั้งหมดเป็นมากกว่าการต้อนรับ
ขอบคุณมากและหวังว่าจะได้อ่านข้อเสนอแนะของคุณ!