ผมมีข้อมูลบางอย่างที่มีอยู่บนกราฟ ) จุดยอดอยู่ในหนึ่งในสองคลาสy i ∈ { - 1 , 1 }และฉันสนใจที่จะฝึกอบรม SVM เพื่อแยกความแตกต่างระหว่างสองคลาส หนึ่งเคอร์เนลที่เหมาะสมสำหรับการนี้คือการแพร่กระจายเคอร์เนล , K = ประสบการณ์( - β L ) ,ที่Lเป็นLaplacianของGและβเป็นปรับพารามิเตอร์
การปรับ SVM ต้องเลือกของ hyperparameters ดังนั้นฉันมีการปรับแต่งโดยทั่วไปเราใช้การตรวจสอบข้ามปัญหานี้ แต่ดูเหมือนจะไม่เหมาะสมที่นี่เนื่องจากการละเว้นจุดสุดยอดiจากGเปลี่ยนกราฟทั้งหมดอาจเพิ่มจำนวนของส่วนประกอบที่เชื่อมต่อ! หากจำนวนของส่วนประกอบที่เชื่อมต่อมีการเปลี่ยนแปลงจุดยอดบางอย่างจะไม่สามารถเข้าถึงได้จากจุดอื่นและเรากำลังเผชิญกับชุดข้อมูลที่แตกต่างจากที่เราเริ่มต้น นั่นคือไม่เพียง แต่เราจะหายไปจุดสุดยอดที่นำออกไปฉันแต่เรายังขาดข้อมูลเกี่ยวกับจุดอื่น ๆ ทั้งหมดที่ j ในกราฟที่อยู่ติดกับจุดสุดยอดนั้น
แนวคิดพื้นฐานของการตรวจสอบข้ามคือเราต้องการประมาณว่าโมเดลจะทำงานอย่างไรเมื่อนำเสนอด้วยข้อมูลใหม่ ในปัญหามาตรฐานการละเว้นข้อมูลบางส่วนของคุณสำหรับการทดสอบจะไม่เปลี่ยนค่าของข้อมูลการฝึกอบรมที่เหลืออยู่ อย่างไรก็ตามในกรณีของข้อมูลกราฟมันไม่ชัดเจนว่ามันหมายถึงอะไรสำหรับรุ่นที่จะเห็นข้อมูล "ใหม่" ในการตั้งค่า CV การละเว้นจุดยอดหรือขอบมีแนวโน้มที่จะเปลี่ยนแปลงข้อมูลทั้งหมด ตัวอย่างเช่นลองนึกภาพกราฟซึ่งเป็นกราฟk- star ซึ่งหนึ่งจุดยอดมีk edge to kจุดยอดและจุดยอดอื่น ๆ ทั้งหมดมี 1 ขอบ การละเว้นจุดสุดยอดกลางเพื่อสร้างข้อมูลการฝึกอบรมจะตัดการเชื่อมต่อกราฟทั้งหมดและเมทริกซ์เคอร์เนลจะเป็นเส้นทแยงมุม! แต่แน่นอนว่ามันจะเป็นไปได้ในการฝึกอบรมแบบกับข้อมูลการฝึกอบรมนี้ให้ไว้ในS * สิ่งที่ชัดเจนน้อยกว่าคือการทดสอบประสิทธิภาพออกนอกตัวแบบของผลลัพธ์ ผู้ใช้คำนวณเมทริกซ์เคอร์เนลสำหรับSหรือไม่และให้คำทำนายนั้นหรือไม่
ของโหนที่ถูกละดังนั้นเราอาจรู้สึกสบายใจที่เราได้รับการประเมินจากตัวอย่างที่ไม่มีอคติอย่างสมเหตุสมผลจากการทำ CV ในลักษณะนี้
หนึ่งเลือกพารามิเตอร์สำหรับปัญหาประเภทนี้ได้อย่างไร CV เป็นข้อบกพร่องที่ยอมรับได้ แต่เราต้องการวิธีการเฉพาะหรือไม่? การปรับพารามิเตอร์ไฮเปอร์พารามิเตอร์เป็นไปได้หรือไม่ในบริบทของฉัน