คำถามที่มีประสิทธิผลมากขึ้นอาจเป็น "ทำไมไม่ใช้ในสถิติแบบดั้งเดิมที่ฉันเรียนรู้"
ขึ้นอยู่กับระดับที่สอนเนื้อหาของหลักสูตร (และเวลาที่มี) ตัวเลือกนั้นอาจเนื่องมาจากปัจจัยหลายอย่างรวมกัน บ่อยครั้งที่หัวข้อสำคัญถูกทิ้งไว้เพราะวัสดุอื่น ๆ จะต้องได้รับการสอนด้วยเหตุผลอย่างใดอย่างหนึ่งด้วยความหวังว่าพวกเขาอาจจะครอบคลุมในวิชาต่อมา
ในความรู้สึกบางอย่างความคิดที่ถูกนำมาใช้โดยคนหลากหลาย พบได้ทั่วไปในบางพื้นที่มากกว่าที่อื่น การใช้สถิติจำนวนมากไม่ได้มีการทำนายหรือการเลือกรูปแบบเป็นองค์ประกอบหลัก (หรือในบางกรณีแม้แต่ที่ทั้งหมด) และในกรณีนี้การใช้ตัวอย่าง Holdout อาจมีความสำคัญน้อยกว่าเมื่อการคาดการณ์เป็นประเด็นหลัก มันควรจะมีการใช้อย่างแพร่หลายมากขึ้นในระยะก่อนหน้านี้ในแอพพลิเคชั่นที่เกี่ยวข้องมากกว่าที่เคยทำ แต่นั่นไม่ใช่สิ่งเดียวกับที่ไม่รู้จัก
หากคุณดูพื้นที่ที่มุ่งเน้นไปที่การทำนายแนวคิดของการประเมินแบบจำลองโดยการคาดการณ์ข้อมูลที่คุณไม่ได้ใช้ในการประเมินแบบจำลองของคุณนั้นใกล้เคียงกันอย่างแน่นอน แน่นอนว่าฉันกำลังทำสิ่งนั้นกับการทำแบบจำลองอนุกรมเวลาที่ฉันทำในช่วงปี 1980 ที่ซึ่งประสิทธิภาพการทำนายแบบไม่อยู่ในกลุ่มของข้อมูลล่าสุดมีความสำคัญอย่างยิ่ง
แนวคิดเกี่ยวกับการละทิ้งข้อมูลบางอย่างถูกนำมาใช้ในการถดถอย (การลบสิ่งที่เหลืออยู่, การกด, แจ็คไนฟ์และอื่น ๆ ) และในการวิเคราะห์นอกเขต
ข้อมูลความคิดเหล่านี้บางส่วนกลับมามีข้อเสนอที่ดีก่อนหน้านี้ Stone (1974) [1] หมายถึงเอกสารเกี่ยวกับการตรวจสอบความถูกต้อง (กับคำที่อยู่ในชื่อ) จากปี 1950 และ 60 บางทีใกล้ถึงความตั้งใจของคุณเขากล่าวถึงการใช้คำว่า "ตัวอย่างการก่อสร้าง" ของไซม่อน (1971) และ "ตัวอย่างการตรวจสอบ" - แต่ยังชี้ให้เห็นว่า "Larson (1931) ใช้การสุ่มหมวดตัวอย่างในการศึกษาหลายรายการ - การศึกษาความก้าวหน้า "
ตัวอย่างเช่นการตรวจสอบความถูกต้องของข้อมูลข้ามและการใช้สถิติตามการคาดการณ์และอื่น ๆ ได้กลายเป็นบ่อยครั้งมากขึ้นในวรรณคดีสถิติในยุค 70 และผ่าน 80 ตัวอย่างเช่น แต่ความคิดพื้นฐานจำนวนมากอยู่ในช่วงเวลาที่ค่อนข้างนาน แล้วก็
[1]: หิน, M. , (1974)
"ทางเลือกที่ถูกต้องตามกฎหมายและการประเมินการคาดการณ์ทางสถิติ"
วารสารของสมาคมสถิติแห่ง Royal Series B (ระเบียบวิธี) , Vol. 36, ลำดับที่ 2, หน้า 111-147