ไม่ทางใดก็ทางหนึ่งอัลกอริธึมการจัดกลุ่มทุกอย่างอาศัยแนวคิด "ความใกล้ชิด" ของคะแนน ดูเหมือนว่าชัดเจนว่าคุณสามารถใช้ความคิดแบบสัมพัทธ์ (มาตราส่วนไม่แปรปรวน) หรือความเชื่อแบบสัมบูรณ์ (ความสอดคล้อง) ของความใกล้ชิด แต่ไม่ใช่ทั้งสองอย่าง
ก่อนอื่นฉันจะพยายามอธิบายเรื่องนี้ให้เป็นตัวอย่างแล้วพูดต่อไปว่าสัญชาตญาณนี้เหมาะกับทฤษฎีบทของไคลน์เบิร์กอย่างไร
ตัวอย่างที่เป็นตัวอย่าง
สมมติว่าเรามีสองชุดและS 2จาก270คะแนนแต่ละชุดจัดเรียงในระนาบดังนี้:S1S2270
คุณอาจไม่เห็นคะแนนในภาพเหล่านี้ แต่นั่นเป็นเพราะจุดต่าง ๆ อยู่ใกล้กันมาก เราเห็นคะแนนมากขึ้นเมื่อเราซูมเข้า:270
คุณอาจจะเห็นด้วยตนเองว่าในชุดข้อมูลทั้งสองชุดจะมีการจัดเรียงคะแนนเป็นสามกลุ่ม อย่างไรก็ตามปรากฎว่าหากคุณซูมเข้าไปที่สามกลุ่มใด ๆ ของคุณจะเห็นสิ่งต่อไปนี้:S2
หากคุณเชื่อในความใกล้ชิดหรือความมั่นคงคุณจะยังคงรักษามันไว้ไม่ว่าคุณจะเห็นอะไรภายใต้กล้องจุลทรรศน์ประกอบด้วยเพียงสามกลุ่มเท่านั้น อันที่จริงความแตกต่างเพียงอย่างเดียวระหว่างS 1และS 2ก็คือภายในแต่ละกลุ่มจะมีบางจุดที่อยู่ใกล้กันมากขึ้น ในทางกลับกันถ้าคุณเชื่อในความคิดสัมพัทธ์ของความใกล้ชิดหรือในความแปรปรวนแบบสเกลคุณจะรู้สึกอยากจะโต้แย้งว่าS 2ประกอบด้วย3S2S1S2S23แต่กลุ่ม มุมมองเหล่านี้ไม่ถูกต้อง แต่คุณต้องเลือกทางเดียวหรืออย่างอื่น3×3=9
กรณีของค่าความแปรปรวนของ isometry
หากคุณเปรียบเทียบปรีชาข้างต้นกับทฤษฎีบทของไคลน์เบิร์กคุณจะพบว่าพวกเขามีความขัดแย้งเล็กน้อย อันที่จริงทฤษฎีบทของไคลน์เบิร์กดูเหมือนจะบอกว่าคุณสามารถบรรลุความแปรปรวนและความมั่นคงพร้อมกันตราบใดที่คุณไม่สนใจคุณสมบัติที่สามที่เรียกว่าความร่ำรวย อย่างไรก็ตามความร่ำรวยไม่ได้เป็นเพียงคุณสมบัติเดียวที่คุณสูญเสียหากคุณยืนยันความคงเส้นคงวาและความสม่ำเสมอ คุณสูญเสียคุณสมบัติที่สำคัญยิ่งกว่าไปอีก: isometry-invariance นี่คือคุณสมบัติที่ฉันจะไม่ยอมเสียสละ เนื่องจากไม่ปรากฏในกระดาษของ Kleinberg ฉันจะอยู่กับมันสักครู่
ในระยะสั้นอัลกอริทึมการจัดกลุ่มเป็นค่าคงที่ของรูปทรงเรขาคณิตหากผลลัพธ์ขึ้นอยู่กับระยะทางระหว่างจุดและไม่ได้อยู่ในข้อมูลเพิ่มเติมบางอย่างเช่นป้ายกำกับที่คุณแนบกับจุดของคุณหรือตามลำดับที่คุณกำหนดไว้ในจุด ฉันหวังว่านี่จะดูเหมือนสภาพที่ไม่รุนแรงและเป็นธรรมชาติมาก อัลกอริธึมทั้งหมดที่กล่าวถึงในกระดาษของ Kleinberg เป็นค่าคงที่เชิงมิติยกเว้นอัลกอริธึมเชื่อมโยงเดี่ยวที่มีเงื่อนไขการหยุด -cluster ตามคำอธิบายของไคลน์เบิร์กอัลกอริทึมนี้ใช้การเรียงลำดับตามคำศัพท์ตามจุดต่างๆดังนั้นผลลัพธ์ของมันอาจขึ้นอยู่กับว่าคุณติดป้ายกำกับไว้อย่างไร ตัวอย่างเช่นสำหรับชุดของสามจุดที่มีระยะเท่ากันเอาท์พุทของอัลกอริทึมเชื่อมโยงเดียวกับ2k2- เงื่อนไขการหยุดแบบกลุ่มจะให้คำตอบที่แตกต่างกันออกไปไม่ว่าคุณจะระบุจุดสามจุดของคุณว่า "cat", "dog", "mouse" (c <d <m) หรือเป็น "Tom", "Spike", "Jerry" (J <S <T):
แน่นอนว่าพฤติกรรมที่ผิดธรรมชาตินี้สามารถซ่อมแซมได้อย่างง่ายดายโดยแทนที่เงื่อนไขการหยุด -cluster ด้วยเงื่อนไข“ ( ≤ k ) -cluster stop” ความคิดนั้นไม่ใช่เพื่อทำลายความสัมพันธ์ระหว่างจุดเท่ากันและหยุดการรวมกลุ่มทันทีที่เราไปถึงkกลุ่มส่วนใหญ่ อัลกอริธึมที่ได้รับการซ่อมแซมนี้จะยังคงสร้างกลุ่มkอยู่ตลอดเวลาและมันจะเป็นค่าคงที่แบบคงที่และขนาดคงที่ ตามข้อตกลงกับสัญชาตญาณที่ระบุข้างต้นอย่างไรก็ตามจะไม่สอดคล้องกันอีกต่อไปk(≤k) kk
สำหรับคำจำกัดความที่แม่นยำของ isometry invariance ให้จำไว้ว่า Kleinberg กำหนดอัลกอริธึมการจัดกลุ่มบนเซต จำกัดเป็นแผนที่ที่กำหนดให้แต่ละเมตริกบนSพาร์ติชันของS :
Γ : {เมทริกซ์บน S } → { พาร์ติชันของ S }SSS isometryฉันระหว่างสองเมตริกวันที่และ d 'ใน Sคือการเปลี่ยนแปลงฉัน: S → Sดังกล่าวว่า d ' ( ฉัน( x ) , ฉัน( Y ) ) = d ( x , Y )สำหรับทุก จุด xและ y ที่ในS
Γ:{metrics on S}→{partitions of S}d↦Γ(d)
idd′Si:S→Sd′(i(x),i(y))=d(x,y)xyS
คำที่เกี่ยวข้อง:จัดกลุ่มอัลกอริทึมมีisometry คงที่ถ้ามันตอบสนองเงื่อนไขต่อไปนี้: สำหรับตัวชี้วัดใด ๆวันที่และd 'และ isometry ใด ๆฉันระหว่างพวกเขาจุดฉัน( x )และฉัน( Y )โกหกในคลัสเตอร์เดียวกันของΓ ( d ' )ถ้าหากจุดเดิมxและy ที่โกหกในคลัสเตอร์เดียวกันของΓ ( d )Γdd′ii(x)i(y)Γ(d′)xyΓ(d)
เมื่อเราคิดถึงอัลกอริธึมการจัดกลุ่มเรามักจะระบุเซตนามธรรมด้วยชุดของจุดที่เป็นรูปธรรมในระนาบหรือในพื้นที่รอบข้างอื่น ๆ และจินตนาการถึงการเปลี่ยนแปลงตัวชี้วัดของSในการเคลื่อนย้ายจุดSรอบ ๆ อันที่จริงนี่คือมุมมองที่เราได้รับในตัวอย่างตัวอย่างด้านบน ในบริบทนี้ isometry invariance นั้นหมายถึงอัลกอริทึมการจัดกลุ่มของเราไม่ตอบสนองต่อการหมุนการสะท้อนและการแปลSSS
ความแตกต่างของทฤษฎีบทของไคลน์เบิร์ก
สัญชาตญาณที่ได้รับข้างต้นถูกจับโดยตัวแปรของทฤษฎีบทของไคลน์เบิร์ก
ทฤษฎีบท:ไม่มีอัลกอริทึมการจัดกลุ่ม isometry-invariant ที่ไม่สำคัญซึ่งสอดคล้องกันและไม่แปรเปลี่ยนขนาด
ที่นี่โดยอัลกอริธึมการจัดกลุ่มเล็ก ๆ น้อย ๆฉันหมายถึงหนึ่งในสองอัลกอริทึมต่อไปนี้:
อัลกอริทึมที่กำหนดให้ทุกเมตริกในพาร์ติชันแยกซึ่งทุกคลัสเตอร์ประกอบด้วยจุดเดียวS
อัลกอริทึมที่กำหนดให้ทุกตัวชี้วัดบนพาร์ติชันก้อนประกอบด้วยคลัสเตอร์เดียวS
การอ้างสิทธิ์คืออัลกอริธึมที่โง่เง่าเหล่านี้เป็นอัลกอริธึมค่าคงที่ของ isometry เพียงสองตัวเท่านั้นที่มีความสอดคล้องและไม่แปรผันตามขนาด
SΓd₁Sd₁(x,y)=1x≠ySΓΓ(d₁)Γ(d₁)เป็นพาร์ทิชันที่ไม่ต่อเนื่องหรือΓ(d₁)Γ(d₁)dS≥1dΓ(d)=Γ(d₁)ΓΓ(d₁)dS≤1Γ(d)=Γ(d₁)Γ
แน่นอนว่าการพิสูจน์นี้มีความใกล้เคียงกับบทพิสูจน์ทฤษฎีบทดั้งเดิมของ Kleinberg ที่ Margareta Ackerman กล่าวถึงในคำตอบของ Alex Williams