นอกเหนือจากเมล็ดฟิชเชอร์


10

ชั่วครู่หนึ่งดูเหมือนว่าFisher Kernelsอาจจะได้รับความนิยมเนื่องจากพวกมันดูเหมือนจะเป็นวิธีในการสร้างเมล็ดจากแบบจำลองความน่าจะเป็น อย่างไรก็ตามฉันไม่ค่อยเห็นพวกเขาใช้ในทางปฏิบัติและฉันมีสิทธิ์ที่ดีที่พวกเขามักจะไม่ทำงานได้ดี พวกเขาพึ่งพาการคำนวณข้อมูลฟิชเชอร์ - การอ้างอิง Wikipedia:

ข้อมูลฟิชเชอร์เป็นข้อมูลเชิงลบของความคาดหวังของอนุพันธ์อันดับสองเกี่ยวกับ ar ของลอการิทึมธรรมชาติของ f ข้อมูลอาจถูกมองว่าเป็นมาตรวัดของ "ความโค้ง" ของเส้นโค้งการสนับสนุนใกล้กับค่าประมาณความน่าจะเป็นสูงสุด (MLE) ของθ

เท่าที่ฉันสามารถบอกได้ว่านี่หมายความว่าฟังก์ชั่นเคอร์เนลระหว่างสองจุดคือระยะทางตามพื้นผิวโค้งนี้ - ใช่ไหม?

อย่างไรก็ตามนี่อาจเป็นปัญหาสำหรับใช้ในวิธีเคอร์เนลเช่น

  1. MLE อาจเป็นการประเมินที่แย่มากสำหรับรุ่นที่กำหนด
  2. ความโค้งของเส้นโค้งการสนับสนุนรอบ ๆ MLE อาจไม่มีประโยชน์ใด ๆ สำหรับการแยกแยะระหว่างอินสแตนซ์ตัวอย่างเช่นถ้าพื้นผิวที่มีโอกาสสูงแหลมมาก
  3. ดูเหมือนว่าจะทิ้งข้อมูลจำนวนมากเกี่ยวกับโมเดล

หากเป็นกรณีนี้มีวิธีการสร้างเมล็ดที่ทันสมัยกว่าจากวิธีการที่น่าจะเป็นหรือไม่? ตัวอย่างเช่นเราสามารถใช้ชุดการระงับเพื่อใช้การประมาณค่า MAP ด้วยวิธีเดียวกันได้หรือไม่ แนวคิดอื่น ๆ ของระยะทางหรือความคล้ายคลึงกันจากวิธีความน่าจะเป็นสามารถทำงานเพื่อสร้างฟังก์ชั่นเคอร์เนล (ที่ถูกต้อง)?

คำตอบ:


9

คุณพูดถูกสามประเด็นและการตีความของคุณถูกต้อง

ผู้คนมองไปในทิศทางอื่นเพื่อสร้างเมล็ดจากแบบจำลองความน่าจะเป็น:

  • Moreno และคณะ เสนอ Kullback-Leiblerแม้ว่าเมื่อเงื่อนไขนี้เป็นไปตามเงื่อนไขของ Mercer ก็ไม่เป็นที่เข้าใจเมื่อฉันมองปัญหานี้กลับมาเมื่อฉันอ่าน

  • Jebara และคณะ เสนอผลิตภัณฑ์ภายในในพื้นที่ของการแจกแจง กระดาษนี้เสียงมากเช่นสิ่งที่คุณหลังจาก: คุณสามารถดาวน์โหลดได้ที่นี่

ฉันอ่านย้อนหลังไปสักครู่ (2551) ไม่แน่ใจว่าพื้นที่นั้นมีวิวัฒนาการในช่วงไม่กี่ปีที่ผ่านมา

นอกจากนี้ยังมีวิธีที่ไม่น่าจะเป็นเช่นนั้น ผู้คนใน Bioinformatics ได้ดูประเภทของการเขียนโปรแกรมแบบไดนามิกในพื้นที่ของสายอักขระและอื่น ๆ สิ่งเหล่านี้ไม่ใช่ PSD เสมอและมีปัญหาของตัวเอง


1
jmlr.org/papers/volume10/martins09a/martins09a.pdfพัฒนาทฤษฎีบางอย่างของเมล็ดที่เกี่ยวข้องกับการเบี่ยงเบนของ KL ที่มีและไม่ใช่เชิงบวกแน่นอน
Dougal
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.