การสร้างกลุ่มจุดจากคู่ lat / long โดยใช้ R?


11

ฉันมีฐานข้อมูลที่มีคู่ Lat / Long เพื่อระบุตำแหน่งของจุดสนใจ ฉันต้องการจัดกลุ่มจุดสนใจเป็นกลุ่ม 10 กลุ่มควรอยู่ในพื้นที่ทางภูมิศาสตร์และมี 10 คะแนนอย่างแน่นอน แต่ละกลุ่มควรมีพื้นที่น้อยที่สุด

ฉันได้ดูการใช้งานที่หลากหลายใน R แต่ไม่มีพวกเขา (ที่ฉันเห็น) อนุญาตให้คุณระบุขนาดคลัสเตอร์ที่แน่นอน

ก่อนหน้านี้ฉันถามจุดแผนที่การจัดกลุ่มเป็นขนาดคลัสเตอร์คงที่หรือไม่ แต่ฉันไม่คิดว่าฉันจะตอบคำถามได้ดีพอ


ทางภูมิศาสตร์ในท้องถิ่น - ฉันคิดว่าฉันหมายความว่ากลุ่มไม่ควรทับซ้อนกันอย่างมีนัยสำคัญ ในแอปพลิเคชันของฉัน (การจัดสรรผู้คนให้กับกลุ่มเพื่อการตรวจสอบ) มันจะเหมาะถ้าแต่ละกลุ่มมีขนาดเล็กที่สุดในพื้นที่ทางกายภาพ
พื้นที่ขั้นต่ำ - อีกครั้งพยายามรักษาพื้นที่กลุ่มให้น้อยที่สุด ฉันคิดว่านี่อาจเป็นปริมาณที่ทำให้พื้นที่ของแต่ละกลุ่มต่ำกว่าเกณฑ์ที่กำหนด (เพื่อหลีกเลี่ยงกลุ่มเล็ก ๆ นับสิบและกลุ่มใหญ่หนึ่งกลุ่ม)


2
มันจะช่วยให้แม่นยำมากขึ้นเกี่ยวกับสิ่งที่คุณกำลังมองหา คุณจะหาปริมาณ "พื้นที่ทางภูมิศาสตร์" และ "พื้นที่ขั้นต่ำ" ได้อย่างไร?
whuber

ในบางสถานการณ์จะไม่ "พื้นที่ขั้นต่ำ" และ "ตรง 10 คะแนน" จะไม่เกิดร่วมกันหรือไม่ คุณคาดหวังได้อย่างไรว่าจะใช้ทั้งสองอย่างเช่นคุณมี "พื้นที่ขั้นต่ำ" 1 ไมล์และคุณลักษณะ 1 อย่างที่ไม่มีคุณสมบัติอื่น ๆ ภายในระยะ 10 ไมล์ (อาจมีค่าใช้จ่ายสูงกว่า)
RyanKDalton

ฉันคาดว่าจะมีข้อยกเว้นบางอย่าง แต่สิ่งเหล่านี้สามารถจัดการได้ด้วยตนเอง ฉันมีชุดข้อมูลขนาดคงที่และไม่รังเกียจที่จะเล่นซอกลุ่มเองด้วยตนเอง แต่ฉันชอบโซลูชันอัตโนมัติที่เหลือจริงๆ! :)
แกรมฮิลตัน

ที่เกี่ยวข้อง: gis.stackexchange.com/questions/15906/...
whuber

คำอธิบายยังคงเป็น "มือหยัก" เกินไปที่จะแก้ไขได้ในวิธีอัตโนมัติ คุณสามารถทำให้ข้อมูลสาธารณะได้หรือไม่?
BradHards

คำตอบ:


1

ฉันคิดว่าคุณอาจกำลังมองหาเครื่องมือเพื่อนบ้านที่ใกล้ที่สุด เครื่องมือประเภทนี้สามารถใช้เพื่อระบุ 10 เพื่อนบ้านที่ใกล้ที่สุดของทุกจุดในชุดข้อมูลของคุณ ดูเหมือนจะมีตัวเลือกที่แตกต่างกันเล็กน้อยสำหรับเรื่องนี้ (บางอันใช้อัลกอริทึมที่แตกต่างกันหรือมีฟังก์ชั่นที่แตกต่างกันเล็กน้อย) และฉันไม่แน่ใจว่าจะเป็นตัวเลือกที่ดีที่สุด แต่นี่คือลิงค์ไม่กี่:

http://stat.ethz.ch/R-manual/R-patched/library/class/html/knn.html http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Classification/kNN

คุณอาจจำเป็นต้องรวมผลลัพธ์กับอัลกอริทึมการจัดกลุ่มหรือเครื่องมือชุดคลัสเตอร์เพื่อระบุกลุ่มของจุดที่มีชุดของเพื่อนบ้านที่คล้ายกันเพื่อรับการจำแนกประเภทของจุดที่มีการทับซ้อนกันเล็กน้อยเพื่อไม่มี คุณอาจจำเป็นต้องทำซอฟท์แวร์แบบแมนนวลเล็กน้อยกับเอาท์พุต แต่มันจะช่วยให้คุณทำงานส่วนใหญ่โดยอัตโนมัติ

บางลิงค์: http://jmlr.csail.mit.edu/papers/volume3/strehl02a/strehl02a.pdf http://cran.r-project.org/web/packages/clue/vignettes/clue.pdf

คุณอาจจะสามารถค้นหาเครื่องมือการจัดกลุ่ม k-mean ที่จะทำสิ่งนี้ได้ในขั้นตอนเดียวและบังคับใช้ 10 จุดในกฎของคลัสเตอร์ (เพียงหารจำนวนคะแนนทั้งหมดด้วย 10 และเลือกว่าเป็นจำนวนของกลุ่มที่ต้องการสำหรับ เครื่องมือ)


นอกจากนี้ฉันยังพบว่าการสอนของ YaRi มีประโยชน์สำหรับ R: ahandel.myweb.uga.edu/resources.htm
Jezibelle
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.