หากความกว้างของเคอร์เนลตัวแปรมักจะดีสำหรับการถดถอยของเคอร์เนลทำไมพวกเขาถึงไม่ดีสำหรับการประมาณความหนาแน่นของเคอร์เนล?


17

คำถามนี้เป็นคำถามได้รับแจ้งจากที่อื่น ๆ การอภิปราย

เมล็ดแปรผันมักใช้ในการถดถอยแบบท้องถิ่น ตัวอย่างเช่นเหลืองถูกนำมาใช้กันอย่างแพร่หลายและทำงานได้ดีเช่นเดียวกับการถดถอยนุ่มนวลและขึ้นอยู่กับเคอร์เนลของความกว้างของตัวแปรที่ปรับให้เหมาะกับข้อมูล sparsity

ในทางตรงกันข้ามเมล็ดแปรผันมักจะคิดว่านำไปสู่การประมาณค่าที่ไม่ดีในการประมาณความหนาแน่นของเคอร์เนล (ดูTerrell and Scott, 1992 )

มีเหตุผลที่เข้าใจง่ายว่าทำไมพวกเขาจะทำงานได้ดีสำหรับการถดถอย แต่ไม่ใช่สำหรับการประเมินความหนาแน่น?


2
คุณเขียนว่า "ในทางตรงกันข้ามเมล็ดแปรผันมักจะคิดว่านำไปสู่การประมาณค่าที่ไม่ดีในการประมาณความหนาแน่นของเคอร์เนล" ส่วนของบทความที่คุณพูดถึงที่ทำให้คุณเชื่อคืออะไร? ฉันมีการอ้างอิงมากมายที่ไปในทางที่ผิดอื่นดูตัวอย่างการอ้างอิงที่กล่าวถึงในบทความนี้: arxiv.org/PS_cache/arxiv/pdf/1009/1009.1016v1.pdf
robin girard

1
บทคัดย่อของ Terrell และ Scott สรุปได้อย่างดีว่า: "ตัวประมาณค่าเพื่อนบ้านที่ใกล้ที่สุดในทุกรุ่นมีประสิทธิภาพต่ำในหนึ่งและสองมิติ" พวกเขาดูเหมือนจะพบประโยชน์มากในการประมาณค่าความหนาแน่นหลายตัวแปร
Rob Hyndman

3
"เพื่อนบ้านที่ใกล้ที่สุด" ไม่ใช่เคอร์เนลตัวแปรเท่านั้น เอกสารที่ฉันพูดถึงใช้เครื่องมืออื่น ๆ เช่นอัลกอริทึมของ Lepskii ฉันจะอ่านกระดาษ AOS แต่เนื่องจากการแสดงของเพื่อนบ้านที่ใกล้ที่สุดน่าจะลดลงตามขนาดฉันพบว่ามันแปลกที่การเพิ่มมิติให้ข้อดีกับตัวประมาณ "ที่ไม่เป็นพารามิเตอร์มาก" (ถ้าเรายอมรับแบนด์วิดท์คงที่น้อยกว่าพารามิเตอร์ แบนด์วิดธ์ที่แตกต่างกัน) ในสถานการณ์ประเภทนี้กรณีการประเมินที่ใช้มักจะเป็นตัวกำหนดผลลัพธ์ ...
robin girard

@Robin Girard:> * พบว่าแปลกที่การเพิ่มมิติให้ประโยชน์กับตัวประมาณ "ไม่มีพารามิเตอร์" (ถ้าเรายอมรับแบนด์วิดธ์คงที่ไม่ใช่พารามิเตอร์มากกว่าแบนด์ที่แตกต่างกัน) * มีการพิมพ์ผิดในประโยคนี้หรือไม่? มิฉะนั้นคุณจะเห็นด้วยกับผู้เขียนอย่างน้อยก็ในระดับที่เข้าใจง่าย ขอบคุณที่ยืนยัน / แก้ไข
user603

@kwak ขอบคุณที่สังเกตเห็นว่า! นี่คือการพิมพ์ผิด: ฉันต้องการที่จะบอกว่าแบนด์วิดธ์คงที่น้อย NP ... ฉันไม่สามารถแก้ไขความคิดเห็นของฉัน :( ขออภัยเกี่ยวกับเรื่องนั้น
robin girard

คำตอบ:


2

ดูเหมือนจะมีสองคำถามที่แตกต่างกันที่นี่ซึ่งฉันจะพยายามแยก:

1) KS, การทำให้เคอร์เนลราบเรียบแตกต่างจาก KDE อย่างไรการประมาณความหนาแน่นของเคอร์เนล ดีว่าฉันมีตัวประมาณ / นุ่มนวล / interpolator

est( xi, fi -> gridj, estj )

และเกิดขึ้นกับทราบความหนาแน่น "จริง" ที่ xi จากนั้นการรัน est( x, densityf ) จะต้องให้ค่าความหนาแน่นโดยประมาณ (): KDE อาจเป็นได้ว่า KS และ KDE ได้รับการประเมินต่างกัน - เกณฑ์ความเรียบที่แตกต่างกัน, บรรทัดฐานที่แตกต่างกัน - แต่ฉันไม่เห็นความแตกต่างพื้นฐาน ฉันพลาดอะไรไป

2) วิธีการที่ไม่ส่งผลกระทบต่อการประมาณมิติหรือเรียบintuitivly ? นี่คือตัวอย่างของเล่นเพียงเพื่อช่วยปรีชา พิจารณากล่อง N = 10,000 คะแนนในกริดสม่ำเสมอและหน้าต่างเส้นหรือสี่เหลี่ยมหรือคิวบ์ W = 64 คะแนนภายใน:

                1d          2d          3d          4d
---------------------------------------------------------------
data            10000       100x100     22x22x22    10x10x10x10
side            10000       100         22          10
window          64          8x8         4x4x4       2.8^4
side ratio      .64 %       8 %         19 %        28 %
dist to win     5000        47          13          7

ที่นี่ "อัตราส่วนด้าน" คือด้านข้างของหน้าต่าง / กล่องและ "dist to win" เป็นค่าประมาณคร่าวๆของระยะเฉลี่ยของจุดสุ่มในกล่องไปยังหน้าต่างที่วางแบบสุ่ม

สิ่งนี้สมเหตุสมผลหรือไม่? (รูปภาพหรือแอปเพล็ตจะช่วยได้จริง: ใคร?)

แนวคิดก็คือหน้าต่างขนาดคงที่ภายในกล่องขนาดคงที่นั้นมีความใกล้เคียงกันมากกับส่วนที่เหลือของกล่องใน 1d 2d 3d 4d นี่คือกริดที่เหมือนกัน บางทีการพึ่งพามิติที่แข็งแกร่งอาจนำไปสู่การแจกแจงอื่น อย่างไรก็ตามดูเหมือนว่าเอฟเฟกต์ทั่วไปที่แข็งแกร่งลักษณะของการสาปแช่งของมิติ


0

การประมาณความหนาแน่นของเคอร์เนลหมายถึงการรวมผ่านหน้าต่างโลคัล (ฝอย) และการทำให้เคอร์เนลราบเรียบหมายถึงค่าเฉลี่ยบนหน้าต่างโลคัล (ฟัซซี่)

Y~(x)α1ρ(x)ΣK(||x-xผม||)Yผม.

การประเมินความหนาแน่นของเคอร์เนล: ρ(x)αΣK(||x-xผม||).

สิ่งเหล่านี้เป็นอย่างไร

ลองพิจารณาตัวอย่างของฟังก์ชันที่มีค่าบูลีนเช่นชุดที่มีทั้ง "ตัวอย่างจริง" (แต่ละรายการมีค่าหน่วย) และ "ตัวอย่างเท็จ" (แต่ละรายการมีค่าศูนย์) สมมติว่าความหนาแน่นของตัวอย่างโดยรวมเป็นค่าคงที่ (เช่นกริด) ค่าเฉลี่ยในท้องถิ่นของฟังก์ชันนี้จะเป็นสัดส่วนเดียวกันกับความหนาแน่นของท้องถิ่น (บางส่วน -) ของเซตย่อยที่มีค่าจริง (ตัวอย่างที่ผิดพลาดทำให้เราไม่ต้องสนใจตัวหารของสมการการปรับให้เรียบอย่างต่อเนื่องในขณะที่การเพิ่มศูนย์เป็นศูนย์เพื่อการรวมเพื่อให้มันง่ายขึ้นในสมการการประเมินความหนาแน่น)

ในทำนองเดียวกันถ้าตัวอย่างของคุณแสดงเป็นองค์ประกอบกระจัดกระจายบนแรสเตอร์บูลีนคุณสามารถประเมินความหนาแน่นได้โดยใช้ตัวกรองเบลอกับแรสเตอร์

แตกต่างกันอย่างไร

โดยสังเขปคุณอาจคาดหวังว่าทางเลือกของอัลกอริธึมการปรับให้เรียบนั้นขึ้นอยู่กับว่าการวัดตัวอย่างมีข้อผิดพลาดในการวัดอย่างมีนัยสำคัญหรือไม่

ที่จุดสูงสุดหนึ่งจุด (ไม่มีจุดรบกวน) คุณเพียงแค่ต้องทำการประมาณค่าระหว่างค่าที่รู้จักกันในสถานที่ตัวอย่าง บอกว่าโดย Delaunay triangulation (พร้อมการแก้ไขแบบสองส่วน bilinear)

การประมาณความหนาแน่นมีลักษณะใกล้เคียงกับขั้วตรงข้ามมากที่สุดมันเป็นเสียงรบกวนทั้งหมดเนื่องจากตัวอย่างในการแยกไม่ได้มาพร้อมกับการวัดค่าความหนาแน่น ณ จุดนั้น (ดังนั้นจึงไม่มีอะไรจะสอดแทรกคุณอาจพิจารณาการวัด Voronoi แผนภาพพื้นที่เซลล์ แต่การปรับให้เรียบ / denoising จะยังคงมีความสำคัญ .. )

ประเด็นก็คือแม้จะมีความคล้ายคลึงกัน แต่ปัญหาต่างกันดังนั้นวิธีการต่าง ๆ อาจเหมาะสมที่สุด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.