แบนด์วิดท์เคอร์เนลในการประมาณความหนาแน่นของเคอร์เนล


10

ฉันกำลังทำการประมาณค่าความหนาแน่นเคอร์เนลโดยมีการตั้งค่าคะแนนถ่วงน้ำหนัก (เช่น. แต่ละตัวอย่างมีน้ำหนักที่ไม่จำเป็นต้องใช้) ในมิติ N นอกจากนี้ตัวอย่างเหล่านี้อยู่ในพื้นที่เมตริก (เช่น. เราสามารถกำหนดระยะห่างระหว่างพวกเขา) แต่ไม่มีอะไรอื่น ตัวอย่างเช่นเราไม่สามารถหาค่าเฉลี่ยของคะแนนตัวอย่างหรือค่าเบี่ยงเบนมาตรฐานหรือปรับขนาดตัวแปรหนึ่งเมื่อเทียบกับตัวแปรอื่น เคอร์เนลได้รับผลกระทบจากระยะทางนี้และน้ำหนักของตัวอย่างแต่ละตัว:

(x)=1ΣWอีผมก.ชั่วโมงเสื้อsผม* * * *ΣWอีผมก.ชั่วโมงเสื้อผมชั่วโมง* * * *KอีRnอีล.(dผมsเสื้อanอี(x,xผม)ชั่วโมง)

ในบริบทนี้ฉันกำลังพยายามที่จะหาการประเมินประสิทธิภาพสำหรับแบนด์วิดธ์เคอร์เนลอาจจะเป็นตำแหน่งที่แตกต่างกันและโดยเฉพาะอย่างยิ่งที่จะช่วยให้การฟื้นฟูที่ถูกต้องในการฝึกอบรมชุดxฉัน หากจำเป็นเราสามารถสันนิษฐานได้ว่าฟังก์ชั่นนั้นค่อนข้างราบรื่นชั่วโมงxผม

ฉันลองใช้ระยะทางกับเพื่อนบ้านที่ใกล้ที่สุดคนที่หนึ่งหรือสอง แต่ก็ให้ผลที่แย่มาก ฉันลองใช้การปรับให้เหมาะสมแบบไม่ใช้ครั้งเดียว แต่ฉันมีปัญหาในการหามาตรการที่ดีในการปรับให้เหมาะสมในบริบทนี้ใน Nd ดังนั้นจึงพบการประมาณการที่แย่มากโดยเฉพาะอย่างยิ่งสำหรับตัวอย่างการฝึกอบรมของตัวเอง ฉันไม่สามารถใช้การประเมินแบบโลภตามสมมติฐานปกติได้เนื่องจากฉันไม่สามารถคำนวณค่าเบี่ยงเบนมาตรฐานได้ ฉันพบการอ้างอิงโดยใช้เมทริกซ์ความแปรปรวนร่วมเพื่อรับเมล็ด anisotropic แต่อีกครั้งมันจะไม่อยู่ในพื้นที่นี้ ...

มีคนมีความคิดหรือข้อมูลอ้างอิงบ้าง


หากคุณสามารถวัดระยะทางได้คุณก็สามารถวัดค่าเฉลี่ยได้ นั่นถูกต้องใช่ไหม? ฉันอาจพูดว่า "ฉันกำลังใช้ระยะทางโคไซน์สำหรับคำว่า" ดังนั้น "คำที่มีความหมายไม่ได้มีความหมายมาก" แต่ฉันไม่เห็นว่าทำไมมันยังไม่สามารถคำนวณได้ คุณสามารถพูดได้ว่าคุณอยู่ในพื้นที่ที่มีลำดับดังนั้นค่าเฉลี่ยจะไม่ได้รับการประเมินอย่างต่อเนื่อง ทำไมค่าเฉลี่ยไม่สามารถระบุได้?
EngrStudent

คำตอบ:



2

บน Matlab ไฟล์แลกเปลี่ยนมีฟังก์ชั่นของ KDE ที่ให้แบนด์วิดธ์ที่ดีที่สุดกับสมมติฐานที่ว่าเคอร์เนล Gaussian จะใช้: Kernel หนาแน่นประมาณการ

แม้ว่าคุณจะไม่ได้ใช้ Matlab คุณก็สามารถวิเคราะห์รหัสนี้เพื่อหาวิธีการคำนวณแบนด์วิดท์ที่เหมาะสม นี่เป็นฟังก์ชั่นที่ได้รับความนิยมอย่างสูงในการแลกเปลี่ยนไฟล์และฉันใช้มันหลายครั้ง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.