การแมประหว่างผลลัพธ์สองชุดนั้นง่ายต่อการคำนวณเนื่องจากข้อมูลที่คุณได้รับในการทดสอบสามารถแสดงเป็นชุดของสาม tuples: องค์ประกอบแรกคือจุด (หลายมิติ) ที่สองคือป้ายคลัสเตอร์ (โดยพลการ) จัดทำโดยอัลกอริทึมของคุณและที่สามคือเลเบลคลัสเตอร์ (โดยพลการ) จัดทำโดยอัลกอริทึมอ้างอิง สร้างโดยkkkตารางการจำแนกประเภทสำหรับคู่ของฉลาก: หากผลลัพธ์เห็นด้วยจะเป็นเมทริกซ์การเปลี่ยนรูปหลายเท่า นั่นคือแต่ละแถวและแต่ละคอลัมน์ต้องมีเซลล์ที่ไม่ใช่ศูนย์อย่างแน่นอน นั่นเป็นโปรแกรมตรวจสอบอย่างง่าย นอกจากนี้ยังตรงไปตรงมาเพื่อติดตามการเบี่ยงเบนเล็กน้อยจากอุดมคตินี้กลับไปยังจุดข้อมูลแต่ละจุดเพื่อให้คุณสามารถเห็นได้อย่างแม่นยำว่าคำตอบทั้งสองแตกต่างกันอย่างไรหากพวกเขาต่างกัน ฉันจะไม่คิดคำนวณทางสถิติของข้อตกลง: มีข้อตกลงที่สมบูรณ์แบบ (มากถึงการเปลี่ยนแปลง) หรือไม่มีและในกรณีหลังคุณต้องติดตามทุกประเด็นที่ไม่เห็นด้วยเพื่อทำความเข้าใจว่ามันเกิดขึ้นได้อย่างไร ผลลัพธ์อาจเห็นด้วยหรือไม่ จำนวนของความขัดแย้งใด ๆ แม้เพียงจุดเดียวต้องตรวจสอบ
คุณอาจต้องการใช้ชุดข้อมูลหลายประเภทสำหรับการทดสอบ: (1) ชุดข้อมูลที่เผยแพร่พร้อมผลลัพธ์ k-หมายถึงที่เผยแพร่ (2) ชุดข้อมูลสังเคราะห์ที่มีกลุ่มที่แข็งแกร่งชัดเจน; (3) ชุดข้อมูลสังเคราะห์ที่ไม่มีการจัดกลุ่มที่ชัดเจน (1) เป็นวินัยที่ดีที่จะใช้เมื่อใดก็ตามที่คุณเขียนโปรแกรมคณิตศาสตร์หรือสถิติใด ๆ (2) ทำได้ง่ายในหลาย ๆ ด้านเช่นโดยการสร้างจุดสุ่มบางจุดเพื่อทำหน้าที่เป็นศูนย์กลางของกลุ่มแล้วสร้างจุดเมฆโดยสุ่มสุ่มย้ายศูนย์คลัสเตอร์ในปริมาณที่ค่อนข้างน้อย (3) ให้การตรวจสอบแบบสุ่มบางอย่างที่อาจเปิดเผยพฤติกรรมที่ไม่คาดคิด; อีกครั้งนั่นเป็นวินัยการทดสอบทั่วไปที่ดี
นอกจากนี้ให้พิจารณาการสร้างชุดข้อมูลที่เน้นอัลกอริทึมโดยการวางตัวบนขอบเขตระหว่างวิธีการแก้ปัญหาที่รุนแรง สิ่งนี้จะต้องใช้ความคิดสร้างสรรค์และความเข้าใจในอัลกอริทึมของคุณ (ซึ่งคุณน่าจะมี!) ตัวอย่างหนึ่งที่ฉันต้องการที่จะตรวจสอบในกรณีใด ๆ จะเป็นชุดของเวกเตอร์ของรูปแบบที่โวลต์เป็นเวกเตอร์ที่ไม่มีส่วนประกอบที่เป็นศูนย์และฉันจะใช้เวลาในค่าลำดับหนึ่ง0 , 1 , 2 , ... , n - 1 ฉันต้องการตรวจสอบอัลกอริทึมของเซตเวกเตอร์ที่ประกอบกันเป็นรูปหลายเหลี่ยมด้านเท่ากันหมด ในสถานการณ์อย่างใดอย่างหนึ่งกรณีที่nเป็นไม่ได้ฉันโวลต์โวลต์ผม0 , 1 , 2 , … , n - 1nหลายเป็นที่น่าสนใจโดยเฉพาะอย่างยิ่งรวมทั้งที่nคือน้อยกว่าk สิ่งที่พบได้ทั่วไปในสถานการณ์เหล่านี้คือ (a) พวกเขาใช้ทุกมิติของปัญหา แต่ (b) การแก้ปัญหาที่ถูกต้องชัดเจนทางเรขาคณิตและ (c) มีวิธีแก้ไขที่ถูกต้องหลายอย่างknk
(แบบรูปหลายเหลี่ยมด้านเท่ากันหมดสุ่มมิติโดยเริ่มต้นด้วยสองเวกเตอร์ภัณฑ์UและVสุ่มเลือก (วิธีที่ดีคือการปล่อยให้พวกเขา. 2 dส่วนประกอบเป็นอิสระ variates ปกติมาตรฐาน) rescale พวกเขาจะมีหน่วยความยาว. โทรขอให้xและzเหล่านี้ลบองค์ประกอบxออกจากzโดยใช้สูตรd≥ 2ยูโวลต์2 วันxZxZ
W = Z - ( Z ⋅ x ) x
YWxYxYdncos( 2 πk / n ) x + sin( 2 πk / n ) yk0n - 1