K-หมายถึง vs. K-หมายถึงออนไลน์


15

K-หมายความว่าเป็นอัลกอริทึมที่รู้จักกันดีสำหรับการจัดกลุ่ม แต่ยังมีการเปลี่ยนแปลงออนไลน์ของอัลกอริทึมดังกล่าว (ออนไลน์ K- หมายถึง) อะไรคือข้อดีข้อเสียของวิธีการเหล่านี้และแต่ละคนควรได้รับความนิยมเมื่อใด?

คำตอบ:


11

Online k-mean (รู้จักกันในอีกชื่อหนึ่งว่าSequential K-Mean ) และ K-Mean แบบดั้งเดิมนั้นคล้ายคลึงกัน ความแตกต่างคือออนไลน์ k- หมายถึงอนุญาตให้คุณอัปเดตโมเดลเมื่อได้รับข้อมูลใหม่

ควรใช้วิธี k ออนไลน์เมื่อคุณคาดหวังว่าข้อมูลจะได้รับทีละตัว (หรืออาจเป็นกลุ่ม) สิ่งนี้ช่วยให้คุณอัปเดตโมเดลของคุณเมื่อคุณได้รับข้อมูลเพิ่มเติมเกี่ยวกับมัน ข้อเสียของวิธีนี้คือมันขึ้นอยู่กับลำดับที่ได้รับข้อมูล ( อ้างอิง )


7

สิ่งพิมพ์ MacQueen k-แปลดั้งเดิม (ชื่อแรกที่ใช้ชื่อ "kmeans") เป็นอัลกอริทึมออนไลน์

MacQueen, JB (1967) "วิธีการบางอย่างสำหรับการจำแนกและการวิเคราะห์การสังเกตหลายตัวแปร" การประชุมทางวิชาการของเบิร์กลีย์ครั้งที่ 5 เรื่องสถิติและความน่าจะเป็นทางคณิตศาสตร์ 1. สำนักพิมพ์มหาวิทยาลัยแห่งแคลิฟอร์เนีย pp. 281–297

หลังจากกำหนดแต่ละจุดค่าเฉลี่ยจะได้รับการปรับปรุงเพิ่มขึ้นโดยใช้สูตรเฉลี่ยถ่วงน้ำหนักแบบง่าย (ค่าเฉลี่ยแบบเก่าจะถ่วงน้ำหนักด้วย n การสังเกตใหม่จะถูกถ่วงน้ำหนักด้วย 1 หากค่าเฉลี่ยมีการสังเกตก่อนหน้านี้)

เท่าที่ฉันสามารถบอกได้มันเป็นความตั้งใจที่จะส่งผ่านข้อมูลเพียงครั้งเดียวเท่านั้นแม้ว่าจะสามารถทำซ้ำ ๆ ได้หลายครั้งเพื่อกำหนดจุดอีกครั้งจนกว่าการบรรจบกัน

โดยปกติแล้ว MacQueen จะใช้การวนซ้ำน้อยกว่า Lloyds ในการบรรจบกันหากข้อมูลของคุณถูกสับ ข้อมูลที่สั่งซื้ออาจมีปัญหาได้ ข้อเสียนั้นต้องการการคำนวณเพิ่มเติมสำหรับแต่ละวัตถุดังนั้นการวนซ้ำแต่ละครั้งใช้เวลานานกว่าเล็กน้อย (การดำเนินการทางคณิตศาสตร์เพิ่มเติมเห็นได้ชัด)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.