ในหนังสือของเนทซิลเวอร์ The Signal and the Noiseเขาเขียนสิ่งต่อไปนี้ซึ่งอาจเป็นข้อมูลเชิงลึกสำหรับคำถามของคุณ:
หนึ่งในการทดสอบที่สำคัญที่สุดของการพยากรณ์ - ฉันจะยืนยันว่ามันเป็นการทดสอบที่สำคัญที่สุดอย่างเดียว - เรียกว่าการสอบเทียบ จากทุกครั้งที่คุณพูดว่ามีโอกาส 40% ของฝนฝนตกบ่อยแค่ไหน? หากในระยะยาวฝนตกจริง ๆ ประมาณ 40% นั่นหมายความว่าการคาดการณ์ของคุณได้รับการสอบเทียบอย่างดี หากฝนตกเพียงร้อยละ 20 ของเวลาแทนหรือ 60 เปอร์เซ็นต์ของเวลาพวกเขาจะไม่
ดังนั้นนี่จะยกสองสามแต้ม ก่อนอื่นเมื่อคุณชี้ให้เห็นอย่างถูกต้องคุณจะไม่สามารถอนุมานเกี่ยวกับคุณภาพของการพยากรณ์เดียวได้จากผลลัพธ์ของเหตุการณ์ที่คุณคาดการณ์ไว้ สิ่งที่ดีที่สุดที่คุณสามารถทำได้คือดูว่าแบบจำลองของคุณมีประสิทธิภาพอย่างไรในการทำนายหลาย ๆ แบบ
อีกสิ่งที่สำคัญที่ต้องพิจารณาคือการคาดการณ์ที่ Nate Silver ให้ไม่ใช่เหตุการณ์ แต่เป็นการกระจายความน่าจะเป็นของเหตุการณ์ ดังนั้นในกรณีของการแข่งขันชิงตำแหน่งประธานาธิบดีเขากำลังประเมินการกระจายความน่าจะเป็นของคลินตันทรัมป์หรือจอห์นสันที่ชนะการแข่งขัน ดังนั้นในกรณีนี้เขาประเมินการกระจายตัวแบบมัลติโนเมียล
แต่จริง ๆ แล้วเขาทำนายการแข่งขันในระดับที่ละเอียดยิ่งขึ้น การคาดการณ์ของเขาประเมินการกระจายความน่าจะเป็นของเปอร์เซ็นต์ของคะแนนโหวตที่ผู้สมัครแต่ละรายจะได้รับในแต่ละรัฐ ดังนั้นถ้าเราพิจารณาผู้สมัคร 3 คนนี่อาจเป็นลักษณะของเวกเตอร์แบบสุ่มที่มีความยาว 51 * 3 และรับค่าในช่วง [0, 1] ภายใต้ข้อ จำกัด ที่สัดส่วนจะรวมเป็น 1 สำหรับสัดส่วนภายในรัฐ จำนวน 51 เป็นเพราะอื่น ๆ คือ 50 รัฐ + DC (และอันที่จริงฉันคิดว่ามันเป็นจริงอีกไม่กี่เพราะบางรัฐสามารถแบ่งคะแนนการเลือกตั้งวิทยาลัยของพวกเขา) และจำนวน 3 เนื่องจากจำนวนผู้สมัคร
ตอนนี้คุณไม่มีข้อมูลมากนักที่จะประเมินการคาดการณ์ของเขาด้วย - เขาเป็นเพียงแค่การคาดการณ์สำหรับการเลือกตั้ง 3 ครั้งล่าสุดที่ฉันรู้ (มีอีกไหม?) ดังนั้นฉันจึงไม่คิดว่าจะมีวิธีใดที่จะประเมินโมเดลของเขาได้อย่างเป็นธรรมยกเว้นว่าคุณมีโมเดลในมือและสามารถประเมินได้โดยใช้ข้อมูลจำลอง แต่ยังมีสิ่งที่น่าสนใจที่คุณสามารถดูได้ ตัวอย่างเช่นฉันคิดว่ามันน่าสนใจที่จะดูว่าเขาคาดการณ์สัดส่วนการลงคะแนนของรัฐในแต่ละช่วงเวลาอย่างแม่นยำเช่นหนึ่งสัปดาห์จากการเลือกตั้ง หากคุณทำซ้ำหลาย ๆ ครั้งเช่นหนึ่งสัปดาห์, เดือน, เดือน, 6 เดือนและปีแล้วคุณสามารถให้คำอธิบายที่น่าสนใจสำหรับการคาดการณ์ของเขา ข้อแม้ที่สำคัญอย่างหนึ่ง: ผลลัพธ์มีความสัมพันธ์อย่างมากกับรัฐต่างๆภายในการเลือกตั้งดังนั้นคุณจึงไม่สามารถพูดได้อย่างชัดเจนว่าคุณมี 51 รัฐ * 3 กรณีการคาดการณ์การเลือกตั้งที่เป็นอิสระ (เช่นถ้าแบบจำลองประเมินผลการปฏิบัติงานของผู้สมัครต่ำกว่ารัฐหนึ่ง . แต่บางทีฉันอาจจะคิดแบบนี้ก็ได้เพื่อให้คุณมีข้อมูลมากพอที่จะทำสิ่งที่มีความหมาย