ด้วยรูปแบบลำดับชั้นฉันต้องการกระบวนการสองขั้นตอนเพื่อให้พอดีกับแบบจำลอง ครั้งแรกที่แก้ไขกำมือของ hyperparametersแล้วดำเนินการอนุมานแบบเบย์ในส่วนที่เหลือของพารามิเตอร์\สำหรับการแก้ไขพารามิเตอร์หลายมิติฉันกำลังพิจารณาสองตัวเลือก
- ใช้Empirical Bayes (EB)และเพิ่มความเป็นไปได้ที่จะเกิด (รวมส่วนที่เหลือของตัวแบบซึ่งมีพารามิเตอร์มิติสูง)
- ใช้ข้ามการตรวจสอบ (CV)เทคนิคเช่นเท่าการตรวจสอบข้ามให้เลือกที่เพิ่มโอกาสtheta)
ข้อได้เปรียบของ EB คือว่าผมสามารถใช้ข้อมูลทั้งหมดในครั้งเดียวในขณะที่สำหรับ CV ผมจำเป็นที่จะต้อง (อาจ) คำนวณความน่าจะเป็นรูปแบบหลายครั้งและค้นหา\ประสิทธิภาพของ EB และ CV นั้นเทียบเคียงได้ในหลายกรณี (*) และบ่อยครั้งที่ EB นั้นจะประเมินได้เร็วกว่า
คำถาม: มีรากฐานทางทฤษฎีที่เชื่อมโยงทั้งสอง (พูด EB และ CV เหมือนกันในขีด จำกัด ของข้อมูลขนาดใหญ่)? หรือเชื่อมโยง EB กับเกณฑ์ทั่วไปบางอย่างเช่นความเสี่ยงเชิงประจักษ์? ใครบางคนสามารถชี้ไปที่วัสดุอ้างอิงที่ดี?
(*) ตามภาพประกอบนี่คือภาพจาก Murphy's Machine Learning , Section 7.6.4 ซึ่งเขาบอกว่าสำหรับการถดถอยของสันทั้งสองขั้นตอนให้ผลลัพธ์ที่คล้ายกันมาก:
เมอร์ฟียังบอกด้วยว่าหลักการที่ได้เปรียบในเชิงปฏิบัติของเบย์เชิงประจักษ์ (เขาเรียกมันว่า "ขั้นตอนการพิสูจน์") เหนือ CV คือเมื่อประกอบด้วยพารามิเตอร์หลายอย่างมาก (เช่นการลงโทษแยกต่างหากสำหรับแต่ละคุณสมบัติ ไม่สามารถใช้ CV ได้เลย