การเลือก K ที่เหมาะสมที่สุดสำหรับ KNN


15

ฉันทำ CV 5 เท่าเพื่อเลือก K ที่ดีที่สุดสำหรับ KNN และดูเหมือนว่ายิ่งใหญ่กว่า K จะได้รับความผิดพลาดน้อยลง ...

ป้อนคำอธิบายรูปภาพที่นี่

ขออภัยฉันไม่มีตำนาน แต่สีที่ต่างกันแสดงถึงการทดลองที่แตกต่างกัน มีทั้งหมด 5 รายการและดูเหมือนว่าจะมีการเปลี่ยนแปลงเล็กน้อยระหว่างพวกเขา ดูเหมือนว่าข้อผิดพลาดจะลดลงเมื่อ K ใหญ่ขึ้น ดังนั้นฉันจะเลือก K ที่ดีที่สุดได้อย่างไร K = 3 จะเป็นตัวเลือกที่ดีที่นี่หรือไม่เนื่องจากกราฟแสดงระดับปิดหลังจาก K = 3


คุณจะทำอะไรกับกลุ่มเมื่อพบแล้ว ในที่สุดมันเป็นสิ่งที่คุณจะทำกับกลุ่มที่ผลิตโดยอัลกอริทึมการจัดกลุ่มของคุณที่จะช่วยในการตรวจสอบว่าการใช้กลุ่มมากขึ้นเพื่อรับข้อผิดพลาดเล็ก ๆ ที่มีค่าในขณะที่
Brian Borchers

ฉันต้องการพลังทำนายสูง ในกรณีนี้ ... ฉันควรไปด้วย K = 20 หรือไม่ เนื่องจากมีข้อผิดพลาดน้อยที่สุด อย่างไรก็ตามฉันได้พล็อตข้อผิดพลาดสำหรับ K สูงสุด 100 และ 100 มีข้อผิดพลาดต่ำที่สุดของทั้งหมด ... ดังนั้นฉันสงสัยว่าข้อผิดพลาดจะลดลงเมื่อ K เพิ่มขึ้น แต่ฉันไม่รู้ว่าอะไรเป็นจุดตัดที่ดี
Adrian

คำตอบ:


12

kkkkk เล็กกว่าขนาดเล็กถ้าความแตกต่างในข้อผิดพลาด CV นั้นเล็กน้อย

หากข้อผิดพลาด CV ไม่เริ่มขึ้นอีกนั่นอาจหมายความว่าแอตทริบิวต์นั้นไม่ได้ให้ข้อมูล (อย่างน้อยสำหรับการวัดระยะทางนั้น) และการให้เอาต์พุตคงที่เป็นวิธีที่ดีที่สุดที่ทำได้



0

มีความหมายทางกายภาพหรือทางธรรมชาติหลังจำนวนกลุ่มหรือไม่ ถ้าฉันไม่ผิดมันเป็นเรื่องธรรมดาที่ K เพิ่มขึ้นข้อผิดพลาดลดลง - ชนิดของการชอบมากเกินไป แทนที่จะตกปลาเพื่อหา K ที่ดีที่สุดคงดีกว่าถ้าเลือก K จากความรู้ในโดเมนหรือสัญชาตญาณ


ฉันคิดว่าคำตอบนี้เหมาะสำหรับการจัดกลุ่ม k-mean มากกว่าการจัดหมวดหมู่ k-nn หรือการถดถอย
Dikran Marsupial

หาก k มีขนาดใหญ่เกินไปคุณจะทำการแก้ไขไม่ถูกต้องข้อผิดพลาดจะเพิ่มขึ้นอีกครั้ง
James
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.