สมมติว่าคุณมีชุดข้อมูลจากการแจกแจงแบบต่อเนื่องที่มีความหนาแน่นสนับสนุนบนที่ไม่รู้จัก แต่ค่อนข้างใหญ่ดังนั้นความหนาแน่นของเคอร์เนล (ตัวอย่าง) การประมาณค่อนข้างแม่นยำ สำหรับการประยุกต์ใช้โดยเฉพาะอย่างยิ่งผมต้องแปลงข้อมูลที่สังเกตในการ จำกัด จำนวนหมวดหมู่เพื่อให้ผลผลิตชุดข้อมูลใหม่ที่มีฟังก์ชั่นมวลโดยนัย(z) P ( Y ) [ 0 , 1 ] n P ( Y ) Z 1 , . . , z n g ( z )
ตัวอย่างง่ายๆจะเมื่อและเมื่อ1/2 ในกรณีนี้ฟังก์ชั่นมวลเหนี่ยวนำจะเป็นY ฉัน ≤ 1 / 2 Z ฉัน = 1 Y ฉัน > 1 / 2
ทั้งสอง "ค่าปรับ" ที่นี่มีจำนวนของกลุ่มที่และความยาวเวกเตอร์ของเกณฑ์\แสดงว่าฟังก์ชั่นที่เกิดจากมวล(y)λ กรัมเมตร, λ ( Y )
ฉันต้องการขั้นตอนที่ตอบเช่น "ทางเลือกที่ดีที่สุดของคืออะไรดังนั้นการเพิ่มจำนวนกลุ่มเป็น (และการเลือกที่ดีที่สุดนั่น) จะทำให้เกิดการปรับปรุงเล็กน้อย" . ฉันรู้สึกว่าบางทีสถิติทดสอบอาจถูกสร้างขึ้น (อาจมีความแตกต่างใน KL divergence หรือสิ่งที่คล้ายกัน) ซึ่งสามารถรับการกระจายได้ ความคิดใด ๆ หรือวรรณกรรมที่เกี่ยวข้อง?m + 1 λ
แก้ไข:ฉันมีการวัดระยะชั่วคราวอย่างสม่ำเสมอของตัวแปรต่อเนื่องและฉันใช้โซ่มาร์คอฟที่ไม่เหมือนใครเพื่อจำลองการพึ่งพาชั่วคราว ตรงไปตรงมาโซ่มาร์คอฟที่แยกจากรัฐนั้นจัดการได้ง่ายกว่ามากและนั่นคือแรงจูงใจของฉัน ข้อมูลที่สังเกตได้เป็นร้อยละ ขณะนี้ฉันใช้การแยกส่วนแบบเฉพาะกิจที่ดูดีมากสำหรับฉัน แต่ฉันคิดว่านี่เป็นปัญหาที่น่าสนใจซึ่งเป็นวิธีแก้ปัญหาที่เป็นทางการ (และทั่วไป) เป็นไปได้
แก้ไข 2:การลดความแตกต่าง KL จริง ๆ แล้วจะเทียบเท่ากับการไม่แยกข้อมูลทั้งหมดดังนั้นแนวคิดนั้นจึงหมดไป ฉันแก้ไขร่างกายตามนั้น