หลังจากทำการค้นหากริดสำหรับโมเดลตัวแทนแต่ละแบบคุณสามารถและควรตรวจสอบบางสิ่ง:
- รูปแบบของพารามิเตอร์ที่ปรับให้เหมาะสม (ที่นี่และCγC )
พารามิเตอร์ที่ดีที่สุดมีความเสถียรหรือไม่ ถ้าไม่คุณมีปัญหามาก
- เปรียบเทียบประสิทธิภาพที่รายงานของการตรวจสอบความถูกต้องภายในและภายนอก
หากการตรวจสอบความถูกต้องไขว้ด้านใน (เช่นการปรับแต่ง) ดูดีกว่าด้านนอก (การตรวจสอบความถูกต้องของรุ่นสุดท้าย) แสดงว่าคุณกำลังมีปัญหาเช่นกัน: คุณกำลัง overfitting มีความเสี่ยงสูงที่พารามิเตอร์ที่ปรับไม่เหมาะสมเลย อย่างไรก็ตามถ้าการตรวจสอบไขว้ภายนอกทำเสร็จแล้วอย่างถูกต้อง (ชุดทดสอบทั้งหมดมีความเป็นอิสระจากแบบจำลองตัวแทนที่เกี่ยวข้อง) อย่างน้อยที่สุดคุณก็ยังมีการประเมินประสิทธิภาพของแบบจำลองที่เป็นกลาง แต่คุณไม่สามารถแน่ใจได้ว่าเหมาะสมที่สุด
- เด่นชัดแค่ไหน ประสิทธิภาพลดลงอย่างรวดเร็วสำหรับพารามิเตอร์ย่อยหรือไม่ ประสิทธิภาพที่ดีที่สุดนั้นดีแค่ไหน?
มีหลายสิ่งที่จะพูดเกี่ยวกับการเลือกรูปแบบมากเกินไป อย่างไรก็ตามมันเป็นสิ่งที่ดีที่จะจำไว้ว่าทั้งความแปรปรวนและอคติในแง่ดีสามารถทำร้ายได้
- ความแปรปรวนหมายความว่าคุณอาจเผลออยู่ไกลจากพารามิเตอร์ไฮเปอร์ที่ดีที่สุด
- แต่อคติก็สามารถทำให้เจ็บได้: ถ้าคุณกำลัง overfitting คุณสามารถพบกับสถานการณ์ที่มีหลายรุ่นที่ดูสมบูรณ์แบบสำหรับการตรวจสอบไขว้ด้านใน (แต่ไม่ใช่จริง ๆ ) ในกรณีดังกล่าวการปรับจูนอาจผิดเพี้ยนไปเนื่องจากไม่รู้จักความแตกต่างระหว่างโมเดล
- หากอคติขึ้นอยู่กับพารามิเตอร์หลายมิติแสดงว่าคุณมีปัญหาใหญ่
หากคุณมีความสนใจในตัวอย่างและคุณสามารถอ่านภาษาเยอรมันได้ฉันสามารถเขียนวิทยานิพนธ์ของฉันทางออนไลน์ได้
จากประสบการณ์ของฉันการปรับค่าพารามิเตอร์ไฮเปอร์เป็นความคิดที่มีประสิทธิภาพอย่างมากในการกำหนดราคาสูงเกินไป ...
ตอนนี้ถ้าคุณรู้ว่าคุณกำลัง overfitting คุณมีสองตัวเลือกหลัก:
- รายงานว่าการเพิ่มประสิทธิภาพมีปัญหากับการ overfitting แต่คุณได้ทำการตรวจสอบความถูกต้องภายนอกที่เหมาะสมซึ่งส่งผลให้ ... (ผลลัพธ์การตรวจสอบความถูกต้องจากภายนอก)
- จำกัดความซับซ้อนของแบบจำลอง วิธีหนึ่งในการทำเช่นนี้คือแก้ไขพารามิเตอร์ไฮเปอร์:
เป็นอีกทางเลือกหนึ่งในการปรับพารามิเตอร์ไฮเปอร์ให้กับชุดฝึกอบรมแต่ละชุดคุณสามารถระบุพารามิเตอร์ ( ไฮเปอร์)ล่วงหน้า (เช่นแก้ไขก่อน) ฉันทำอย่างนั้นให้มากที่สุดเท่าที่จะเป็นไปได้สำหรับโมเดลของฉันเพราะฉันมักจะมีเคสน้อยกว่าที่คุณมีให้ดูด้านล่าง
อย่างไรก็ตามการแก้ไขนี้จะต้องทำจริงและล่วงหน้า: เช่นฉันขอให้เพื่อนร่วมงานหาพารามิเตอร์ที่เหมาะสมของเขาในชุดข้อมูลที่คล้ายกัน (การทดลองอิสระ) หรือทำการทดลองล่วงหน้ารวมถึงการค้นหากริดกับพารามิเตอร์ จากนั้นการทดสอบครั้งแรกนั้นจะใช้เพื่อแก้ไขพารามิเตอร์การทดลองบางอย่างรวมถึงพารามิเตอร์แบบจำลองสำหรับการทดสอบจริงและการวิเคราะห์ข้อมูล ดูคำอธิบายเพิ่มเติมด้านล่าง
แน่นอนมันเป็นไปได้ที่จะดำเนินการทดสอบที่เหมาะสมในรูปแบบที่ดีที่สุดโดยอัตโนมัติ (ตรวจสอบคู่หรือซ้อนกัน) แต่คุณขนาดของกลุ่มตัวอย่างอาจไม่อนุญาตให้แยกข้อมูลสองครั้ง
ในสถานการณ์นั้น IMHO นั้นดีกว่ามากในการรายงานการประเมินแบบจำลองที่สร้างขึ้นโดยใช้ประสบการณ์ระดับมืออาชีพในการเลือกพารามิเตอร์การสร้างแบบจำลองมากกว่าการรายงานการประเมินแบบ overoptimistic ในแบบจำลองที่ได้รับการปรับปรุงอัตโนมัติบางประเภท
อีกมุมมองเกี่ยวกับสถานการณ์คือคุณต้องแลกเปลี่ยน
- ประสิทธิภาพที่แย่ลงเนื่องจากการตั้งค่าเผื่อไว้อีกหลายกรณีสำหรับการปรับพารามิเตอร์ให้เหมาะสม (ขนาดตัวอย่างการฝึกอบรมที่เล็กลง => แบบจำลองแย่ลง แต่พารามิเตอร์ "ดีที่สุด")
- ประสิทธิภาพแย่ลงเนื่องจากการแก้ไขพารามิเตอร์ย่อยโดยผู้เชี่ยวชาญ (แต่ในข้อมูลการฝึกอบรมขนาดใหญ่)
ความคิดที่คล้ายกันบางอย่างสำหรับคำถามที่คล้ายกัน: /stats//a/27761/4598
ในการแก้ไขพารามิเตอร์และความคิดเห็นของ Dikran Marsupial
ฉันใช้คำไฮเปอร์พารามิเตอร์เป็น Dikran Marsupial ใช้ในกระดาษของเขา (ลิงก์ในคำตอบของเขา)
ฉันทำงานกับข้อมูลทางสเปกโทรสโกปี นี่เป็นการวัดที่การวิเคราะห์และการสร้างแบบจำลองข้อมูลมักจะมีการประมวลผลล่วงหน้าค่อนข้างน้อย สิ่งนี้สามารถเห็นได้ว่าเป็นพารามิเตอร์แบบไฮเปอร์ (เช่นลำดับของพหุนามควรใช้เป็นพื้นฐานหรือไม่ควรรวมช่องการวัดใดบ้าง) มีการตัดสินใจอื่น ๆ ที่ใกล้เคียงกับพารามิเตอร์ svm ของคุณเช่นมีส่วนประกอบหลักจำนวนเท่าใดที่จะใช้หากทำ PCA สำหรับการลดขนาดข้อมูลก่อนที่จะมีการฝึกอบรมแบบ "จริง"? และบางครั้งฉันก็ใช้การจำแนกประเภท SVM ด้วยดังนั้นฉันต้องตัดสินใจเกี่ยวกับพารามิเตอร์ SVM
ตอนนี้ IMHO วิธีที่ดีที่สุดในการแก้ไขพารามิเตอร์ไฮเปอร์คือถ้าคุณมีเหตุผลที่มาจากแอปพลิเคชัน เช่นฉันมักจะตัดสินใจว่าพื้นฐานชนิดใดที่จะใช้โดยเหตุผลทางกายภาพ / เคมี / ชีวภาพ (เช่นความรู้เกี่ยวกับตัวอย่างและพฤติกรรมสเปกโทรสโกปีที่เกิดขึ้นหลังจากนั้น) อย่างไรก็ตามฉันไม่ทราบถึงข้อโต้แย้งดังกล่าวซึ่งช่วยด้วยพารามิเตอร์ SVM ...
กรณีของการทดสอบล่วงหน้าที่ฉันกล่าวถึงข้างต้นมีลักษณะดังนี้:
- เราใช้ข้อมูลของกลุ่มของเซลล์ (ต้องการแยกแยะเซลล์ต่าง ๆ )
มีการวิเคราะห์ Spectra การตรวจสอบความถูกต้องซ้ำซ้อนแบบไขว้ SVM ถูกรัน (ใช้เวลาหนึ่งหรือสองคืนบนเซิร์ฟเวอร์การคำนวณ)
- γC
- ฉันยังสังเกตเห็นการ overfitting บางอย่าง: การตรวจสอบความถูกต้องของไขว้ด้านนอกนั้นไม่ดีเท่าผลการจูน นั่นเป็นไปตามที่คาดไว้
- ยังคงมีความแตกต่างของประสิทธิภาพการทำงานในช่วงการปรับแต่งของพารามิเตอร์ไฮเปอร์และประสิทธิภาพของตารางการปรับแต่งนั้นดูเรียบเนียนพอสมควร ดี.
ข้อสรุปของฉันคือ: ในขณะที่ฉันไม่สามารถแน่ใจได้ว่าพารามิเตอร์ไฮเปอร์สุดท้ายนั้นดีที่สุดการตรวจสอบไขว้ภายนอกทำให้ฉันประเมินประสิทธิภาพของแบบจำลองตัวแทนได้อย่างเหมาะสม
ในระหว่างการทดลองเราตัดสินใจเปลี่ยนแปลงการตั้งค่าการทดลองบางอย่าง (สิ่งที่ไม่ส่งผลกระทบต่อสัญญาณเสียงของข้อมูล แต่สิ่งนี้จะไปอีกขั้นหนึ่งโดยอัตโนมัติในการใช้เครื่องมือ)
เราปรับปรุงการตั้งค่าการทดลองและรับสเปกตรัมใหม่ ในฐานะที่เป็นเซลล์พวกเขาจะต้องเติบโตขึ้นมาใหม่ นั่นคือชุดข้อมูลใหม่นั้นเป็นชุดของวัฒนธรรมที่เป็นอิสระ
ตอนนี้ฉันกำลังเผชิญกับการตัดสินใจ: ฉันควร "ข้าม" การตรวจสอบความถูกต้องของไขว้ภายในและไปกับพารามิเตอร์ไฮเปอร์ที่ฉันกำหนดด้วยข้อมูลเก่าหรือไม่
- ดังที่ได้กล่าวมาแล้วฉันใช้ความเสี่ยงที่พารามิเตอร์ไฮเปอร์ที่กำหนดไว้ล่วงหน้าเหล่านี้ไม่เหมาะสม
- แต่ฉันไม่สามารถแน่ใจได้ว่าจะได้รับพารามิเตอร์ไฮเปอร์ที่ดีที่สุดอย่างแท้จริงโดยทำการตรวจสอบความถูกต้องแบบไขว้ภายใน
- อย่างไรก็ตามการปรับจูนข้อมูลเก่านั้นมีเสถียรภาพ
- ทำการปรับให้เหมาะสมฉันจะฝึกตัวอย่างน้อย: เนื่องจากฉันมีตัวอย่างน้อยเกินไป (TM) ฉันต้องคาดหวังว่าจะได้แบบจำลองที่แย่ลงถ้าฉันตั้งตัวอย่างเพิ่มเติมสำหรับการตรวจสอบไขว้รอบที่สอง
ดังนั้นในกรณีนี้ฉันตัดสินใจที่จะใช้พารามิเตอร์คงที่ (จากประสบการณ์เกี่ยวกับข้อมูลที่คล้ายกันและรู้ว่าในอนาคตเราจะต้องทำการบ้านของเรารวมถึงการตรวจสอบการตัดสินใจเหล่านี้อีกครั้งด้วยข้อมูลขนาดใหญ่)
โปรดทราบว่าสิ่งสำคัญคือฉันข้ามการตรวจสอบภายใน ( การปรับการตรวจสอบไขว้) ไม่ใช่สิ่งที่อยู่ภายนอก ด้วยพารามิเตอร์ไฮเปอร์คงที่ฉันได้รับการประเมินแบบไม่เอนเอียงเกี่ยวกับประสิทธิภาพของโมเดลย่อยที่อาจเป็นไปได้ มันเป็นความจริงที่การประมาณนี้ขึ้นอยู่กับความแปรปรวนสูง แต่ความแปรปรวนนี้นั้นเหมือนกันไม่ว่าฉันจะทำการจูนภายในหรือไม่
การข้ามการข้ามภายนอกฉันจะได้รับการประเมินแบบเอนเอียงในแง่ดีของโมเดลที่ปรับ - ซึ่งขึ้นอยู่กับแอปพลิเคชันและข้อมูลอาจไร้ค่า (ถ้ามากเกินไป