เมื่อเร็ว ๆ นี้ฉันเริ่มใช้การสุ่มตัวอย่างความสำคัญแบบพาเรนต์แบบเรียบง่ายจาก Pareto การตรวจสอบความถูกต้องแบบ cross-one-out (PSIS-LOO) ที่อธิบายไว้ในเอกสารเหล่านี้:
- Vehtari, A. , & Gelman, A. (2015) การสุ่มตัวอย่างสำคัญของ Pareto ทำให้ราบรื่น พิมพ์ล่วงหน้า arXiv ( ลิงก์ )
- Vehtari, A. , Gelman, A. , & Gabry, J. (2016) การประเมินรูปแบบเบย์ในทางปฏิบัติโดยใช้การตรวจสอบความถูกต้องแบบลาก่อนและ WAIC คำนำหน้า arXiv ( ลิงก์ )
สิ่งนี้แสดงให้เห็นถึงวิธีการที่น่าสนใจอย่างมากในการประเมินแบบจำลองนอกตัวอย่างเนื่องจากช่วยให้สามารถทำการ LOO-CV ด้วยการเรียกใช้ MCMC เดียวและถูกกล่าวหาว่าดีกว่าเกณฑ์ข้อมูลที่มีอยู่เช่น WAIC
น่าเศร้าที่ฉันพบว่าในการใช้วิธีการนี้กับปัญหาของฉันสำหรับโมเดลส่วนใหญ่ที่น่าสนใจฉันพบว่าใหญ่ ไม่น่าแปลกใจที่รายงานความน่าจะเป็นบางอย่างของ Log รายงานนั้นค่อนข้างไร้สาระ (เทียบกับชุดข้อมูลอื่น) ในฐานะที่เป็นการตรวจสอบอีกครั้งฉันได้ทำการตรวจสอบความถูกต้องแบบข้าม 10 ครั้งแบบดั้งเดิม (และใช้เวลานาน) พบว่าในกรณีข้างต้น PSIS-LOO ให้ผลที่ผิดพลาดอย่างมาก -fold CV สำหรับรุ่นที่ ) สำหรับบันทึกฉันใช้MATLAB ในการใช้งาน PSIS-LOO โดย Aki Vehtari
บางทีฉันอาจโชคร้ายมากที่ปัญหาปัจจุบันและแรกของฉันที่ฉันใช้วิธีนี้คือ "ยาก" สำหรับ PSIS-LOO แต่ฉันสงสัยว่ากรณีนี้อาจเป็นเรื่องธรรมดา สำหรับกรณีเช่นของฉันกระดาษ Vehtary, Gelman & Gabry เพียงแค่พูดว่า:
แม้ว่าค่า PSIS นั้นจะมีความแปรปรวนแน่นอนเมื่อผู้ใช้ควรพิจารณาการสุ่มตัวอย่างโดยตรงจากสำหรับปัญหาใช้ -fold cross- การตรวจสอบหรือใช้รูปแบบที่แข็งแกร่งมากขึ้น
สิ่งเหล่านี้เห็นได้ชัด แต่ไม่ใช่วิธีการแก้ปัญหาในอุดมคติเพราะพวกเขาใช้เวลานานหรือต้องการเล่นซอเพิ่มเติม (ฉันขอขอบคุณที่ MCMC และการประเมินแบบจำลองล้วนเกี่ยวกับการเล่นซอ แต่สิ่งที่ดีกว่า)
มีวิธีการทั่วไปที่เราสามารถใช้ล่วงหน้าเพื่อพยายามป้องกันไม่ให้ PSIS-LOO ล้มเหลวหรือไม่? ฉันมีความคิดเบื้องต้นบางอย่าง แต่ฉันสงสัยว่ามีวิธีแก้ปัญหาเชิงประจักษ์ที่ผู้คนใช้กันอยู่แล้ว