ฉันต้องการประเมินแบบจำลองต่างๆที่ให้การคาดการณ์พฤติกรรมในระดับรายเดือน ข้อมูลมีความสมดุลและ 100,000 และ 12 ผลลัพธ์คือการเข้าร่วมคอนเสิร์ตในเดือนที่กำหนดดังนั้นจึงเป็นศูนย์สำหรับ ~ 80% ของผู้คนในเดือนใด ๆ แต่มีผู้ใช้งานจำนวนมาก การคาดการณ์ที่ฉันไม่ได้ดูเหมือนจะเคารพธรรมชาติการนับของผลลัพธ์: คอนเสิร์ตที่เป็นเศษส่วนนั้นแพร่หลาย
ฉันไม่รู้อะไรเกี่ยวกับแบบจำลอง ฉันสังเกตการคาดการณ์กล่องดำ 6 แบบที่แตกต่างกันสำหรับแต่ละคนต่อเดือน ฉันมีข้อมูลเพิ่มเติมอีกหนึ่งปีที่ผู้สร้างแบบจำลองไม่ได้มีไว้สำหรับการประเมิน (แม้ว่าผู้ชมคอนเสิร์ตจะยังคงเหมือนเดิม) และฉันอยากจะวัดว่าแต่ละคนทำงานได้ดีแค่ไหน (ในแง่ของความแม่นยำและความแม่นยำ) ตัวอย่างเช่นแบบจำลองบางแบบทำนายผลได้ดีสำหรับผู้ที่มาชมคอนเสิร์ตบ่อยครั้ง แต่ล้มเหลวในการทานมันฝรั่งหรือไม่? การทำนายเดือนมกราคมดีกว่าการคาดการณ์ในเดือนธันวาคมหรือไม่? หรือจะเป็นการดีถ้าได้รู้ว่าการคาดคะเนทำให้ฉันสามารถจัดอันดับคนได้อย่างถูกต้องตามความเป็นจริงแม้ว่าขนาดที่แน่นอนไม่น่าเชื่อถือ
ความคิดแรกของฉันคือการเรียกใช้ผลกระทบคงที่ของจริงในการคาดการณ์และเวลาหุ่นและดู RMSEs หรือสำหรับแต่ละรุ่น แต่นั่นไม่ได้ตอบคำถามเกี่ยวกับว่าแต่ละรุ่นทำงานได้ดีหรือไม่หรือถ้าความแตกต่างนั้นสำคัญ (เว้นแต่ฉันจะบูต RMSE) การกระจายของผลลัพธ์ยังทำให้ฉันกังวลด้วยวิธีนี้
ความคิดที่สองของฉันคือการทิ้งผลลัพธ์ลงใน 0, 1-3 และ 3+ และคำนวณเมทริกซ์ความสับสน แต่สิ่งนี้จะละเว้นมิติเวลายกเว้นว่าฉันทำ 12 ข้อเหล่านี้ มันก็ค่อนข้างหยาบ
ฉันตระหนักถึงคำสั่ง Stata concord
โดย TJ Steichen และ NJ Cox - ซึ่งมีby()
ตัวเลือก แต่นั่นจะต้องยุบข้อมูลเป็นผลรวมประจำปี สิ่งนี้จะคำนวณดัชนีความสัมพันธ์สอดคล้องของหลินด้วยช่วงความเชื่อมั่นและสถิติที่มีประโยชน์อื่น ๆ CCC มีตั้งแต่ -1 ถึง 1 โดยมีข้อตกลงที่สมบูรณ์แบบที่ 1
นอกจากนี้ยังมีของ Harrell (คำนวณ
โดย R. Newson) ซึ่งมีตัวเลือก แต่ฉันไม่แน่ใจว่าจะอนุญาตให้ฉันจัดการกับข้อมูลพาเนล สิ่งนี้จะช่วยให้คุณมั่นใจในช่วงเวลา Harrell's c เป็นลักษณะทั่วไปของพื้นที่ภายใต้ ROC curve (AUC) เพื่อผลลัพธ์ที่ต่อเนื่อง มันเป็นสัดส่วนของคู่ทั้งหมดที่สามารถสั่งซื้อได้เช่นกันว่าตัวแบบที่มีการทำนายสูงกว่านั้นจะมีผลที่สูงกว่า ดังนั้นc = 0.5สำหรับการทำนายแบบสุ่มc = 1สำหรับรูปแบบการแบ่งแยกที่สมบูรณ์แบบ ดูหนังสือของ Harrell , p.493somersd
cluster
คุณจะแก้ไขปัญหานี้อย่างไร คุณขอแนะนำให้คำนวณสถิติเช่น MAPE ที่ใช้กันทั่วไปในการคาดการณ์หรือไม่
พบสิ่งที่มีประโยชน์:
- สไลด์บนค่าที่วัดซ้ำของค่าสัมประสิทธิ์สหสัมพันธ์ของหลิน