แบบจำลองสุดท้าย (พร้อมการผลิต) ควรได้รับการฝึกอบรมกับข้อมูลที่สมบูรณ์หรือเพียงแค่ในชุดการฝึกอบรม?


23

สมมติว่าฉันฝึกหลายรุ่นในชุดฝึกอบรมเลือกหนึ่งชุดที่ดีที่สุดโดยใช้ชุดการตรวจสอบความถูกต้องไขว้และประสิทธิภาพที่วัดได้ในชุดทดสอบ ดังนั้นตอนนี้ฉันมีหนึ่งรุ่นที่ดีที่สุดสุดท้าย ฉันควรสั่งการฝึกอบรมใหม่กับข้อมูลที่มีอยู่ทั้งหมดหรือโซลูชันการจัดส่งที่ฝึกอบรมเฉพาะชุดฝึกอบรมหรือไม่ ถ้าอย่างหลังทำไม?

การอัปเดต: ตามที่ @ P.Windridge ระบุไว้การส่งแบบจำลองโดยทั่วไปหมายถึงการจัดส่งแบบจำลองโดยไม่มีการตรวจสอบความถูกต้อง แต่เราสามารถรายงานประสิทธิภาพของชุดการทดสอบและหลังจากนั้นฝึกจำลองข้อมูลที่สมบูรณ์แบบอย่างถูกต้องคาดหวังว่าประสิทธิภาพจะดีขึ้นเพราะเราใช้แบบจำลองที่ดีที่สุดของเราบวกกับข้อมูลมากขึ้น ปัญหาใดที่อาจเกิดขึ้นจากวิธีการดังกล่าว


คุณทำงานในสภาพแวดล้อมที่มีการควบคุมจากภายนอกหรือไม่? (เช่นคุณอาจต้องจัดส่งแบบจำลองที่ผ่านการตรวจสอบแล้วและคำถามของคุณเป็นเพียงข้อสมมุติ แต่มันก็คุ้มค่าที่จะคุยกัน :)) แก้ไข: ตกลงฉันเห็นคุณแก้ไขโพสต์ของคุณ
P.Windridge

คุณเชื่อว่าข้อมูลการทดสอบของคุณเป็นตัวแทนของประชากร / ครอบคลุมส่วนหนึ่งของประชากรที่ไม่ได้อยู่ในกลุ่มตัวอย่างใช่หรือไม่ ตัวอย่างการพัฒนาดั้งเดิมของคุณมีข้อบกพร่องหรือไม่?
P.Windridge

@ P.Windridge ดีคำถามของฉันเป็นเพียงแค่สมมุติ เกี่ยวกับความคิดเห็นที่สองของคุณฉันเชื่อว่าไม่มีใครควรคาดหวังว่าวิศวกรจะฝึกฝนแบบจำลองที่ดีในขณะที่ให้ข้อมูลที่ไม่เป็นตัวแทนแก่เขา
Yurii

1
ฉันไม่สามารถจินตนาการถึงสถานการณ์มากมายที่คุณจะส่งแบบจำลองโดยไม่ผ่านการตรวจสอบ ฉันต้องการดูการลดขนาดของตัวอย่างทดสอบ (ขึ้นอยู่กับว่ามันยังมีขนาดใหญ่พอที่จะตรวจสอบได้!) การสนทนาที่น่าสนใจมากขึ้นอาจเกี่ยวข้องกับข้อดี / ข้อเสียของ / การเลือก / โมเดลตาม / all / the data และจากนั้นฝึกอบรมโดยใช้ตัวอย่างย่อยจากนั้นตรวจสอบส่วนที่เหลือ
P.Windridge

1
คำถามที่คล้ายกัน = stats.stackexchange.com/questions/174026/…แม้ว่าฉันคิดว่ามันสามารถใช้การสนทนามากขึ้น
P.Windridge

คำตอบ:


15

คุณจะได้รับแบบจำลองที่ดีขึ้นเกือบตลอดเวลาหลังจาก refitting ตัวอย่างทั้งหมด แต่อย่างที่คนอื่นบอกว่าคุณไม่มีการตรวจสอบ นี่เป็นข้อบกพร่องพื้นฐานในวิธีการแยกข้อมูล ไม่เพียง แต่การแบ่งข้อมูลที่เสียโอกาสในการสร้างแบบจำลองความแตกต่างของตัวอย่างโดยตรงในแบบจำลองโดยรวมเท่านั้น แต่มันไม่เสถียรเว้นแต่ตัวอย่างทั้งหมดของคุณอาจใหญ่กว่า 15,000 ตัวอย่าง นี่คือเหตุผลที่จำเป็นต้องมีการตรวจสอบความถูกต้องไขว้ 100 เท่าซ้ำอีกครั้ง (ขึ้นอยู่กับขนาดตัวอย่าง) เพื่อให้ได้ความแม่นยำและความเสถียรและทำไม bootstrap สำหรับการตรวจสอบภายในที่ดียิ่งขึ้น bootstrap ยังแสดงให้เห็นถึงความยากลำบากและความสามารถในการเลือกคุณสมบัติ

ฉันได้อธิบายปัญหาเกี่ยวกับการตรวจสอบความถูกต้อง 'ภายนอก' โดยละเอียดแล้วที่ชีวสถิติในแผนกวิจัยชีวการแพทย์ 10.11


คำศัพท์ในสาขาของฉัน (เคมีวิเคราะห์) จะพิจารณาแยกข้อมูลใด ๆ ที่คุณทำที่ (ก่อน) เริ่มต้นการฝึกอบรมการตรวจสอบภายในมาก การตรวจสอบภายนอกจะเริ่มจากที่ใดที่หนึ่งระหว่างทำการศึกษาเพื่อตรวจสอบความถูกต้องโดยเฉพาะและทดสอบวงแหวน
cbeleites รองรับโมนิกา

0

คุณไม่จำเป็นต้องฝึกซ้ำอีกครั้ง เมื่อคุณรายงานผลลัพธ์ของคุณคุณจะรายงานผลข้อมูลการทดสอบเสมอเพราะสิ่งเหล่านั้นให้ความเข้าใจที่ดีขึ้น จากชุดข้อมูลทดสอบเราสามารถเห็นได้อย่างแม่นยำว่าแบบจำลองมีแนวโน้มที่จะทำงานกับข้อมูลที่ไม่อยู่ในกลุ่มตัวอย่างได้ดีเพียงใด


4
เราสามารถรายงานประสิทธิภาพของชุดการทดสอบและหลังจากนั้นฝึกจำลองข้อมูลที่สมบูรณ์แบบอย่างถูกต้องคาดหวังว่าประสิทธิภาพจะดีขึ้นเพราะเราใช้โหมดที่ดีที่สุดและข้อมูลมากขึ้น เหตุผลของฉันมีข้อบกพร่องหรือไม่?
Yurii

ถ้าหลังจากการทดสอบคุณเก็บข้อมูลได้มากขึ้นจากนั้นคุณสามารถแยกข้อมูลอีกครั้งทำการฝึกซ้ำอีกครั้งจากนั้นทำการทดสอบอีกครั้งแล้วรายงานผลการทดสอบจากการทดสอบอีกครั้ง
Umar

6
การไม่ประเมินตัวอย่างทั้งหมดทำให้คุณมีโอกาสมีประสิทธิภาพสูงขึ้น นี่ไม่เป็นธรรม ฉันเห็นด้วยกับความคิดเห็นของ Yurii ด้านบน
Richard Hardy

@ Richard ยากมากมีอะไรผิดปกติในความคิดเห็นของฉัน?
Umar

มันสะกดออกมาในความคิดเห็นล่าสุดของฉัน โดยไม่ใช้ข้อมูลทั้งหมดเพื่อประเมินโมเดลคุณกำลังมองหาประสิทธิภาพสูงสุดที่มีอยู่ ทำไมทำอย่างนั้น?
Richard Hardy
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.