การตรวจสอบความถูกต้องเทียบกับเบย์เชิงประจักษ์สำหรับการประมาณค่าพารามิเตอร์


20

ด้วยรูปแบบลำดับชั้นฉันต้องการกระบวนการสองขั้นตอนเพื่อให้พอดีกับแบบจำลอง ครั้งแรกที่แก้ไขกำมือของ hyperparametersแล้วดำเนินการอนุมานแบบเบย์ในส่วนที่เหลือของพารามิเตอร์\สำหรับการแก้ไขพารามิเตอร์หลายมิติฉันกำลังพิจารณาสองตัวเลือกp(x|ϕ,θ)θϕ

  1. ใช้Empirical Bayes (EB)และเพิ่มความเป็นไปได้ที่จะเกิด (รวมส่วนที่เหลือของตัวแบบซึ่งมีพารามิเตอร์มิติสูง)p(all data|θ)
  2. ใช้ข้ามการตรวจสอบ (CV)เทคนิคเช่นเท่าการตรวจสอบข้ามให้เลือกที่เพิ่มโอกาสtheta)kθp(test data|training data,θ)

ข้อได้เปรียบของ EB คือว่าผมสามารถใช้ข้อมูลทั้งหมดในครั้งเดียวในขณะที่สำหรับ CV ผมจำเป็นที่จะต้อง (อาจ) คำนวณความน่าจะเป็นรูปแบบหลายครั้งและค้นหา\ประสิทธิภาพของ EB และ CV นั้นเทียบเคียงได้ในหลายกรณี (*) และบ่อยครั้งที่ EB นั้นจะประเมินได้เร็วกว่าθ

คำถาม: มีรากฐานทางทฤษฎีที่เชื่อมโยงทั้งสอง (พูด EB และ CV เหมือนกันในขีด จำกัด ของข้อมูลขนาดใหญ่)? หรือเชื่อมโยง EB กับเกณฑ์ทั่วไปบางอย่างเช่นความเสี่ยงเชิงประจักษ์? ใครบางคนสามารถชี้ไปที่วัสดุอ้างอิงที่ดี?


(*) ตามภาพประกอบนี่คือภาพจาก Murphy's Machine Learning , Section 7.6.4 ซึ่งเขาบอกว่าสำหรับการถดถอยของสันทั้งสองขั้นตอนให้ผลลัพธ์ที่คล้ายกันมาก:

เมอร์ฟี - เบย์เชิงประจักษ์เทียบกับประวัติ

เมอร์ฟียังบอกด้วยว่าหลักการที่ได้เปรียบในเชิงปฏิบัติของเบย์เชิงประจักษ์ (เขาเรียกมันว่า "ขั้นตอนการพิสูจน์") เหนือ CV คือเมื่อประกอบด้วยพารามิเตอร์หลายอย่างมาก (เช่นการลงโทษแยกต่างหากสำหรับแต่ละคุณสมบัติ ไม่สามารถใช้ CV ได้เลยθ


คุณช่วยอธิบายรายละเอียดเพิ่มเติมว่าคุณกำลังทำอะไรสำหรับวิธีการตรวจสอบข้าม? คุณกำลังแก้ไขแล้วใช้ข้อมูลการฝึกอบรมเพื่อประเมินพารามิเตอร์อื่น ๆ ก่อนที่จะตรวจสอบความถูกต้องหรือไม่ θ
Neil G

@NeilG เพิ่มผลรวมของความน่าจะเป็นของข้อมูลการทำนายการบันทึกในชุดการตรวจสอบความถูกต้องข้าม (k ถูกรวมเข้าด้วยกัน)
จดจำ

1
ถ้าถูกรวมเข้าด้วยกันทั้งสองครั้งแล้ว CV และ EB แตกต่างกันอย่างไร? k
Neil G

2
เป็นคำถามที่ดีมาก ฉันใช้เสรีภาพในการเพิ่มตัวเลขจากตำราเรียนของเมอร์ฟีลงในคำถามของคุณเพื่ออธิบายประเด็นของคุณเกี่ยวกับสองขั้นตอนที่มักเปรียบเทียบกันได้ ฉันหวังว่าคุณจะไม่สนใจการเพิ่มนี้
อะมีบาพูดว่า Reinstate Monica

คำตอบ:


16

ฉันสงสัยว่าจะมีการเชื่อมโยงทฤษฎีที่บอกว่า CV และหลักฐานสูงสุดเทียบเท่า asymptotically เป็นหลักฐานบอกเราน่าจะเป็นของข้อมูลที่ได้รับการตั้งสมมติฐานของรูปแบบ ดังนั้นหากแบบจำลองนั้นถูกระบุผิดพลาดหลักฐานอาจไม่น่าเชื่อถือ การตรวจสอบความถูกต้องไขว้ในทางกลับกันให้การประมาณความน่าจะเป็นของข้อมูลไม่ว่าจะเป็นสมมติฐานการสร้างแบบจำลองที่ถูกต้องหรือไม่ ซึ่งหมายความว่าหลักฐานอาจเป็นแนวทางที่ดีกว่าหากสมมติฐานการสร้างแบบจำลองนั้นถูกต้องโดยใช้ข้อมูลที่น้อยลง CV นั้นไม่เอนเอียง แต่ฉันจะสมมติว่าหลักฐานไม่ได้เว้นแต่ว่าตัวแบบจำลองจะเกิดขึ้นจริง

นี่คือสัญชาตญาณของฉัน / ประสบการณ์ ฉันก็อยากจะรับฟังเกี่ยวกับการวิจัยเกี่ยวกับเรื่องนี้

โปรดทราบว่าสำหรับหลาย ๆ รุ่น (เช่นการถดถอยของสันกระบวนการแบบเกาส์, การถดถอยของเคอร์เนล / LS-SVM ฯลฯ ) การตรวจสอบแบบ cross-one-out สามารถทำได้อย่างน้อยมีประสิทธิภาพเท่ากับการประเมินหลักฐานดังนั้นจึงไม่จำเป็นต้องมีการคำนวณ ประโยชน์ที่นั่น

ภาคผนวก: ทั้งความเป็นไปได้ของโอกาสและการตรวจสอบความถูกต้องของการตรวจสอบความถูกต้องถูกประเมินผ่านตัวอย่างข้อมูลที่ จำกัด และดังนั้นจึงมีความเป็นไปได้ที่จะมีการปรับตัวให้เหมาะสมมากเกินไป สำหรับตัวอย่างขนาดเล็กความแตกต่างในความแปรปรวนของเกณฑ์ทั้งสองอาจเป็นตัวตัดสินว่าอะไรดีที่สุด ดูกระดาษของฉัน

Gavin C. Cawley, Nicola LC Talbot, "ในการเลือกรุ่นและการเลือกแบบอคติในการประเมินผลการปฏิบัติงาน", วารสารการวิจัยการเรียนรู้ของเครื่อง, 11 (ก.ค. ): 2079-2107, 2010 ( pdf )


ทำไมคุณถึงบอกว่า CV นั้นแข็งแกร่งเมื่อเทียบกับโมเดลที่ระบุผิด ในกรณีของเขาไม่มีการป้องกันเช่นนี้เนื่องจากการตรวจสอบข้ามกำลังค้นหาพื้นที่เดียวกันกับที่ EB กำลังคำนวณความน่าจะเป็น หากสมมติฐานการสร้างแบบจำลองของเขาผิดการตรวจสอบข้ามจะไม่ช่วยเขา
Neil G

1
φφθ

ปล. ฉันได้ทำการวิเคราะห์เพื่อหลีกเลี่ยงการ overfitting ในโครงข่ายประสาทเทียมด้วยการทำให้เป็นมาตรฐานแบบเบส์โดยพารามิเตอร์การปรับจะถูกปรับผ่านความเป็นไปได้สูงสุด มีบางสถานการณ์ที่สิ่งนี้ทำงานได้แย่มาก (แย่กว่าไม่มีการทำให้เป็นมาตรฐานใด ๆ เลย) ดูเหมือนว่าจะเป็นปัญหาของการระบุข้อมูลผิดรุ่น
Dikran Marsupial

เขาสามารถได้รับ "ตัวบ่งชี้ประสิทธิภาพการทำงานทั่วไป" โดยการตรวจสอบความน่าจะเป็นรวมของข้อมูลที่ได้จากการแจกแจงโดยประมาณที่ส่งคืนโดย EB (ซึ่งจะเท่ากับเอนโทรปีของการแจกแจงนั้น) ในกรณีนี้ไม่มีวิธีใดที่จะสามารถเอาชนะได้เพราะเป็นวิธีการวิเคราะห์ปัญหานี้ ฉันไม่เห็นว่าทำไมการตรวจสอบข้ามจึงมีเหตุผลเมื่อคุณสามารถคำนวณความน่าจะเป็นสำหรับ EB
Neil G

2
@ ความสามารถในการเข้าสู่ระบบฉันไม่แน่ใจว่าสิ่งที่คุณได้รับ (ปัญหาไม่สิ้นสุดที่ปลายของฉัน!; o) ฉันสามารถบอกคุณได้จากประสบการณ์จริงแม้ว่าปัญหาจะเป็นเรื่องจริง ฉันทำงานเกี่ยวกับปัญหาในการเลือกแบบจำลองมาหลายปีแล้วและฉันได้พบกับปัญหามากมายที่การเพิ่มความเป็นไปได้ที่จะเกิดเป็นความคิดที่แย่มาก การตรวจสอบความถูกต้องไขว้ทำงานได้ดีสำหรับชุดข้อมูลส่วนใหญ่ แต่ในกรณีที่มันทำงานได้ไม่ดีนักก็มักจะดำเนินการอย่างหายนะ
Dikran Marsupial

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.