คำถามติดแท็ก clustering

การแบ่งพาร์ติชันของข้อมูลชี้ไปที่ส่วนย่อยของวัตถุตาม "ความคล้ายคลึงกัน" ซึ่งกันและกันโดยไม่ใช้ความรู้ที่มีอยู่ก่อนเช่นป้ายชื่อคลาส

2
ระบุจุดใน shapefile ที่ไม่มีจุดอื่นภายใน x km ด้วย QGIS
นี่อาจเป็นคำถามที่ไร้เดียงสา แต่ฉันดิ้นรนในฐานะผู้ใช้รายใหม่ของ QGIS ฉันมีไฟล์รูปร่างที่ใหญ่มาก (275,000 คะแนน แต่สามารถแบ่งออกเป็นย่อย ๆ ประมาณ 10 แห่งหากจำเป็นสำหรับการประมวลผลที่เร็วขึ้น) ฉันต้องการระบุจุดทั้งหมดที่ไม่มีจุดอื่นภายใน 200 เมตรจากนั้นให้เขียนรหัสแต่ละจุดด้วยค่า "ไม่ซ้ำกัน" ในฟิลด์ของไฟล์ สำหรับจุดอื่น ๆ ทั้งหมดที่เป็นส่วนหนึ่งของกลุ่มท้องถิ่นฉันต้องการรหัสเหล่านั้นเป็น "คลัสเตอร์" หลังจากประสบความสำเร็จแล้วฉันต้องการเลือกเพียงหนึ่งรายการสำหรับแต่ละคลัสเตอร์โดยการสุ่มเพื่อเก็บไว้ในชุดข้อมูลโดยละทิ้งกลุ่มอื่น ขณะนี้ฉันไม่สามารถบรรลุขั้นตอนที่ 1 ดังนั้นยินดีต้อนรับความช่วยเหลือใด ๆ

1
การวิเคราะห์เชิงพื้นที่และการจัดกลุ่มใกล้คุณสมบัติ
ฉันกำลังทำงานเกี่ยวกับพฤติกรรมการทำเครื่องหมายในสัตว์มีชีวิตกลุ่มและฉันสนใจว่าพฤติกรรมการทำเครื่องหมายได้รับผลกระทบจากลักษณะบางอย่างของกลุ่มเพื่อนบ้านอย่างไร ฉันได้วางแผนอาณาเขตของแต่ละกลุ่มจากกลุ่มคนที่มีความหนาแน่น 95% ที่สร้างขึ้นโดยใช้ a-LoCoH เครื่องหมายของแต่ละบุคคลจากกลุ่มถูกพล็อตเป็นเลเยอร์จุดแยก พฤติกรรมการทำเครื่องหมายไม่ปรากฏว่ามีการสุ่มและดูเหมือนว่าจะจัดกลุ่มรอบ ๆ ขอบเขตกับกลุ่มเพื่อนบ้าน ฉันต้องการตรวจสอบว่าบุคคลทำเครื่องหมายใกล้กลุ่มมากกว่ากลุ่มใกล้เคียงหรือไม่ตัวอย่างเช่นบุคคลทำเครื่องหมายกลุ่มใกล้น้อยกว่าที่เกี่ยวข้องอย่างใกล้ชิดหรือไม่ เป็นไปได้หรือไม่ที่จะแสดงให้เห็นว่ามีการจัดกลุ่มคะแนนไว้ใกล้กับคุณลักษณะบางอย่าง แต่ไม่ใกล้กับสถานที่อื่น ๆ ? ความช่วยเหลือใด ๆ ที่สามารถให้ได้จะได้รับการชื่นชมอย่างมาก เดฟฮัมฟรีส์ ##### อัปเดต สำหรับการสาธิตด้านล่างเป็นภาพของสี่พื้นที่ (A, B, C และ D) และตำแหน่งการทำเครื่องหมายของบุคคลสองคนจากกลุ่ม A กลุ่ม A และ B มีความสัมพันธ์กันอย่างใกล้ชิด กลุ่ม C และ D ไม่เกี่ยวข้องกับกลุ่ม A
11 clustering 

1
การสร้างกลุ่มจุดจากคู่ lat / long โดยใช้ R?
ฉันมีฐานข้อมูลที่มีคู่ Lat / Long เพื่อระบุตำแหน่งของจุดสนใจ ฉันต้องการจัดกลุ่มจุดสนใจเป็นกลุ่ม 10 กลุ่มควรอยู่ในพื้นที่ทางภูมิศาสตร์และมี 10 คะแนนอย่างแน่นอน แต่ละกลุ่มควรมีพื้นที่น้อยที่สุด ฉันได้ดูการใช้งานที่หลากหลายใน R แต่ไม่มีพวกเขา (ที่ฉันเห็น) อนุญาตให้คุณระบุขนาดคลัสเตอร์ที่แน่นอน ก่อนหน้านี้ฉันถามจุดแผนที่การจัดกลุ่มเป็นขนาดคลัสเตอร์คงที่หรือไม่ แต่ฉันไม่คิดว่าฉันจะตอบคำถามได้ดีพอ ทางภูมิศาสตร์ในท้องถิ่น - ฉันคิดว่าฉันหมายความว่ากลุ่มไม่ควรทับซ้อนกันอย่างมีนัยสำคัญ ในแอปพลิเคชันของฉัน (การจัดสรรผู้คนให้กับกลุ่มเพื่อการตรวจสอบ) มันจะเหมาะถ้าแต่ละกลุ่มมีขนาดเล็กที่สุดในพื้นที่ทางกายภาพ พื้นที่ขั้นต่ำ - อีกครั้งพยายามรักษาพื้นที่กลุ่มให้น้อยที่สุด ฉันคิดว่านี่อาจเป็นปริมาณที่ทำให้พื้นที่ของแต่ละกลุ่มต่ำกว่าเกณฑ์ที่กำหนด (เพื่อหลีกเลี่ยงกลุ่มเล็ก ๆ นับสิบและกลุ่มใหญ่หนึ่งกลุ่ม)

1
การสร้างรูปหลายเหลี่ยมรอยเท้าในเมืองจากการสร้างกลุ่มใน QGIS?
ฉันไม่แน่ใจว่าคำที่ถูกต้องคืออะไร แต่เป็นรูปแบบการออกแบบการทำแผนที่ทั่วไป ฉันต้องการแสดงโครงร่างของพื้นที่ที่ถูกสร้างขึ้นเป็นรูปหลายเหลี่ยมที่เต็มไปด้วยใต้ชั้นถนนและอาคาร ใน OpenStreetMap, พื้นที่ดังกล่าวบางครั้งก็สามารถใช้ได้เช่นการใช้ที่ดิน = ที่อยู่อาศัย ฉันสงสัยว่าทั้งหมดนี้จะถูกติดตามด้วยตนเอง นี่คือตัวอย่างนี่คือยิบรอลตาร์ ฉันขุดโครงร่างนี้ด้วยตนเองแล้วตัดเข้ากับชายฝั่ง "รอยเท้าในเมือง" ประกอบด้วยพื้นที่สีม่วง / ชมพู (นี่ขยายออกสู่ทะเลจากนั้นตัดกับโครงร่างที่ดินจาก OpenStreetMapData) มีเครื่องมือใน QGIS (หรือเครื่องมือ FOSS GIS อื่น ๆ ) เพื่อสร้างสิ่งเหล่านี้โดยอัตโนมัติจากชุดอาคารหรือไม่? สองวิธีที่ฉันได้ลองไปแล้ว ... ฉันลองปลั๊กอินตัวเรือเว้าแต่มีเพียงส่วนเดียว ฉันยังลองDelauney Triangulationบนโหนดที่แยกออกมาจากโครงร่างสิ่งปลูกสร้าง ฉันสงสัยว่าฉันสามารถทิ้งรูปหลายเหลี่ยมขนาดใหญ่หรือมุมที่มีความแหลมสูงระหว่างจุดยอดได้หรือไม่นั่นอาจใช้ได้ ...

1
อัลกอริทึมเบิร์ชไม่ได้จัดกลุ่มตามที่คาดไว้
ฉันใช้อัลกอริธึมเบิร์ชจากแพคเกจ Python แบบเรียนรู้ scipy สำหรับการจัดกลุ่มชุดของจุดในเมืองเล็ก ๆ แห่งหนึ่งในจำนวน 10 ชุด ฉันใช้รหัสต่อไปนี้: no = len(list_of_points)/10 brc = Birch(branching_factor=50, n_clusters=no, threshold=0.05,compute_labels=True) ในความคิดของฉันฉันมักจะจบลงด้วยชุด 10 คะแนน ในกรณีของฉันตอนนี้ฉันมี 650 คะแนนสำหรับการรวมกลุ่มและ n_clusters คือ 65 แต่ปัญหาของฉันคือการที่มีขีด จำกัด ต่ำเกินไปฉันจะจบลงด้วย 1 ที่อยู่ต่อหนึ่งคลัสเตอร์เพียงแค่ขีด จำกัด ที่ใหญ่กว่าเล็ก ๆ - 40 ที่อยู่ต่อหนึ่งคลัสเตอร์ ฉันทำอะไรผิดที่นี่

2
ฉันจะจัดกลุ่มจุดใกล้เคียงกับตำแหน่ง GPS ได้อย่างไร
ฉันเป็นคนไอทีดังนั้นฉันจึงไม่รู้มากเกินไปเกี่ยวกับการคาดการณ์และฉันหวังว่าคุณจะสามารถช่วยฉันได้ ฉันได้สร้างแอพพลิเคชั่นสำหรับ Android ที่รวบรวมตำแหน่ง GPS ดังนั้นฉันจึงมีละติจูดและลองจิจูดตามเวลาที่กำหนด ฉันต้องการบันทึกองค์ประกอบเหล่านั้นเข้าด้วยกันซึ่งอยู่ใกล้กันในกลุ่มของพื้นที่ภูมิประเทศที่มีขนาด phisical เดียวกัน ปัญหาคือว่าผมไม่ทราบว่าจุดก่อนและพวกเขาอาจจะมาจากตำแหน่งใด ๆ ในโลก ความคิดแรกของฉัน (เพื่ออธิบายปัญหาเพิ่มขึ้นอีกเล็กน้อย) คือใช้ทศนิยมของละติจูดและลองจิจูดสำหรับการจัดกลุ่ม ตัวอย่างเช่นกลุ่มหนึ่งจะเป็นตำแหน่งที่มีละติจูดระหว่าง 35.123 และ 35.124 และลองจิจูดระหว่าง 60.101 ถึง 60.102 ดังนั้นถ้าฉันได้รับตำแหน่งอย่าง lat = 35.1235647 และ lon = 60.1012254598 จุดนี้จะไปที่กลุ่มนั้น วิธีนี้จะโอเคสำหรับตัวแทน 2D คาร์ทีเซียนเนื่องจากฉันมีพื้นที่กว้าง 0.001 หน่วยและสูง อย่างไรก็ตามเนื่องจากขนาด 1degree ของลองจิจูดนั้นแตกต่างกันในละติจูดที่ต่างกันฉันจึงไม่สามารถใช้วิธีนี้ได้ ความคิดใด ๆ

1
การแบ่งกลุ่มของ OpenLayers แบ่งเป็นชั้น ๆ
ฉันมีแผนที่ OpenLayers พร้อมการจัดกลุ่มจุด แต่ฉันต้องการใช้ข้อมูลที่ละเอียดยิ่งขึ้นกับข้อมูลที่แสดงในแผนที่ โดยเฉพาะฉันต้องการแบ่งชั้นกลุ่มตามแอตทริบิวต์ในคุณสมบัติ (เราจะเรียกมันว่า 'หมวดหมู่') ดังนั้นสมมติว่าฉันมีห้าหมวดหมู่: อย่างมีประสิทธิภาพฉันต้องจัดกลุ่มจุดเฉพาะกับจุดอื่น ๆ จากหมวดหมู่เดียวกัน ฉันคิดว่านี่สามารถทำได้ด้วยห้าชั้นที่แตกต่างกัน แต่สิ่งนี้กลายเป็นเรื่องยุ่งยากอย่างรวดเร็วเนื่องจากจำนวนหมวดหมู่มีขนาดใหญ่ (ฉันมี 50+ ในขณะนี้) มีใครเห็นอะไรเช่นนี้กับ OpenLayers?

3
วิธีการจัดกลุ่มคะแนนตามความหนาแน่นของเคอร์เนล
ฉันมีชุดข้อมูลขนาดใหญ่ที่มี 36k คะแนนซึ่งแสดงถึงการใช้ประโยชน์ที่ดินเพื่อการพาณิชย์แต่ละแห่งมีเขตข้อมูลที่มีวิดีโอสแควร์ ฉันได้ทำการวิเคราะห์ความหนาแน่นของเคอร์เนลในชุดข้อมูลนี้สร้างภาพแรสเตอร์ที่แสดงความหนาแน่นของวิดีโอสแควร์เชิงพาณิชย์ในพื้นที่รถไฟใต้ดินทั้งหมด ฉันต้องแบ่งแรสเตอร์นี้ออกเป็นภูมิภาคที่สอดคล้องกับ maxima ท้องถิ่นซึ่งฉันเรียกว่า "ศูนย์กลาง" ฉันได้กำหนดที่ตั้งของศูนย์เรียบร้อยแล้วและตอนนี้ฉันต้องทำหนึ่งในสองสิ่งต่อไปนี้: ใช้เครื่องมือการทำคลัสเตอร์แบบจุดเช่น "การแบ่งพาร์ติชันรอบยาเม็ด" เพื่อจัดกลุ่มจุดให้เป็นกระจุกรอบ ๆ ศูนย์ที่ฉันระบุ ปัญหาของวิธีนี้ก็คือมันมีความเข้มข้นของการคำนวณและมากยิ่งขึ้นดังนั้นหากฉันพยายามใช้เมทริกซ์ที่แตกต่างกันเพื่อให้ได้คะแนนตามขนาด อย่างใดแบ่งความหนาแน่นเคอร์เนลแรสเตอร์ (ซึ่งประมาณคล้ายกับแรสเตอร์ภูมิประเทศ) เป็น "เนินเขา" แต่ละรอบแต่ละศูนย์ แต่ฉันไม่สามารถคิดถึงเครื่องมือใด ๆ สำหรับการทำเช่นนี้ ปัญหานี้ทำให้ฉันล้มเหลวในขณะที่และฉันหวังว่าฉันจะสามารถทำวิธีการจัดกลุ่มใน R แต่มันใช้เวลานานและฉันหมดเวลา ไม่มีใครรู้วิธีการง่ายๆในการแบ่งแรสเตอร์ความหนาแน่นเป็นละแวกใกล้เคียงของความเข้มหรือสำหรับการจัดกลุ่มชุดข้อมูลขนาดใหญ่ได้อย่างรวดเร็ว?

4
กำลังค้นหากลุ่มของหนึ่งชุดของคะแนนรอบ ๆ อีกหนึ่งจุดจากเลเยอร์ต่างกันหรือไม่?
ฉันต้องการดูว่ามีการจัดกลุ่มของอาคารประเภทหนึ่ง (x) รอบ ๆ อาคารประเภทอื่น (y) หรือไม่ ไฟล์สองจุดอยู่ในเลเยอร์ต่างกัน ฉันไม่สามารถหาเครื่องมือที่ฉันจะใช้ทำสิ่งนี้

1
การจัดกลุ่มจุดแผนที่เป็นขนาดคลัสเตอร์คงที่?
ฉันมีชุดข้อมูลของ 655 lat / long pairs ซึ่งฉันต้องการแบ่งออกเป็นประมาณ 100 กลุ่ม กลุ่มควรมี 5-10 คู่ซึ่งอยู่ใกล้กันทางภูมิศาสตร์ กลุ่มที่หนาแน่นควรมีคะแนนมากกว่ากลุ่มที่กระจัดกระจายควรมีจำนวนน้อยกว่า ตัวอย่างเช่นการจัดกลุ่มเมืองควรใหญ่กว่าชนบทเล็กกว่า มีอัลกอริธึมที่กำหนดขึ้นสำหรับการจัดกลุ่มแบบนี้หรือฉันจะต้องออกแบบจากขั้นตอนแรก? ฉันใช้ google maps v3 api เพื่อแสดงข้อมูลนี้ แต่มันเป็นชุดข้อมูลคงที่ฉันเตรียมที่จะทำการกระทืบหมายเลขออฟไลน์

1
คำศัพท์ย่านที่อยู่อาศัยตามธรรมชาติ
บางครั้งส่วนที่ยากที่สุดของการวิเคราะห์ก็คือการรู้ว่ามีบางสิ่งที่เรียกว่า แพ็คเกจ R คืออะไร แต่ที่สำคัญกว่านั้นคือคำศัพท์ที่ฉันควรค้นหาเพื่อกำหนดย่านที่อยู่อาศัยของเมืองที่ต่อเนื่องกันโดยขึ้นอยู่กับการเปลี่ยนแปลงของราคาบ้านโดยทั่วไปแผนที่ภูมิประเทศที่รักษาราคาเปลี่ยนแปลงเหล่านี้ ฉันไม่แน่ใจว่าสิ่งนี้เรียกว่า "การกำจัดเพื่อนบ้านตามธรรมชาติ" หรือ "การจัดกลุ่มที่ จำกัด เชิงพื้นที่" หรือเพียงแค่ "การวิเคราะห์การจัดกลุ่ม"

1
เปรียบเทียบรูปแบบคลัสเตอร์ / การรวมตัวกันเชิงพื้นที่สำหรับข้อมูลรูปหลายเหลี่ยม
ฉันมีข้อมูลการเกษตรในรูปของรูปหลายเหลี่ยมซึ่งฉันต้องการทดสอบสำหรับการจัดกลุ่มเชิงพื้นที่ / การรวมตัวกันเชิงพื้นที่ โดยรวมแล้วฉันมีตัวแปรประมาณ 40 ตัวซึ่งฉันสามารถรวบรวมและสร้างมาตรฐานในรูปแบบที่แตกต่างกัน วิธีหนึ่งในการสร้างมาตรฐานอาจเป็นตัวอย่างในการคำนวณมูลค่าการผลิตต่อหัวภายในแต่ละรูปหลายเหลี่ยม อีกวิธีหนึ่งคือการคำนวณมูลค่าการผลิตต่อเฮกแตร์ภายในแต่ละรูปหลายเหลี่ยม ทุกวิธีในการสร้างมาตรฐานและการรวมสร้างแผนที่ที่แตกต่างด้วยรูปแบบเชิงพื้นที่ที่แตกต่างกัน: การจัดกลุ่มและการไม่จัดกลุ่ม ดังนั้นเพื่อเป็นฐานสำหรับการวิเคราะห์ในภายหลังของฉันฉันไม่ต้องการระบุชุดค่าผสมรวม / มาตรฐานที่สร้างการจัดกลุ่มเชิงพื้นที่ที่แข็งแกร่ง ดังนั้นฉันจะต้องเปรียบเทียบผลลัพธ์ที่แตกต่างจากการรวมและมาตรฐาน แน่นอนว่าฉันสามารถดูแผนที่ได้ด้วยตนเอง (ดูตัวอย่างด้านล่าง) แต่นี่เป็นอัตนัยและในบางกรณีคุณสามารถสร้างความแตกต่างที่ชัดเจน ลองนึกภาพการทำสิ่งนี้กับตัวแปร 40 ตัวและสมมุติว่าเป็นไปได้ 8 วิธีในการจัดเตรียมข้อมูล ... ดังนั้นฉันอยากจะใช้การวัดที่เป็นกลางเช่นสถิติเชิงพื้นที่ ฉันใช้ R และ Arc GIS มีใครบ้างที่คิดว่าจะนำการวิเคราะห์ดังกล่าวไปใช้อย่างไร ตัวอย่างด้านล่างแสดงการผลิตกล้วยเพียงครั้งเดียวโดยไม่ต้องมีมาตรฐานและเมื่อมาตรฐานต่อหัว มันดูคล้ายกันมาก แต่อันไหนที่กระจุกกลุ่มกันมากกว่ากัน

2
เครื่องมือสถิติเชิงพื้นที่: การวิเคราะห์การจัดกลุ่มข้อมูล raster
ฉันเห็นได้ชัดว่าเป็นปัญหาที่เรียบง่าย แต่ฉันไม่สามารถหาวิธีการที่ชัดเจนในการใช้ ฉันมอบหมายให้กำหนดขอบเขต "เมือง" โดย vector convex polygons โดยใช้Gridded Population of the World dataset จาก CIESIN ชุดข้อมูลนี้ให้ค่าความหนาแน่นของประชากรทั่วโลกเป็นไฟล์แรสเตอร์ ปัญหาคือตามที่คุณเดาแล้วว่าค่าความหนาแน่นกำลังเปลี่ยนแปลงไปมากและคำจำกัดความของ "เมือง" นั้นค่อนข้างสัมพันธ์กัน ฉันพยายามใช้วิธีแบบคลาสสิกและคำนวณความลาดชันราวกับว่าค่าความหนาแน่นเป็นระดับความสูง แต่ค่าของความลาดชันก็ซับซ้อนและสลับซับซ้อนกันมาก ฉันได้ดูอัลกอริธึมการจัดกลุ่มเชิงพื้นที่เครื่องมือ LISA (Local Indocators of Spatial Association) ด้วย ArcGIS และ GeoDa แต่ฉันเสียเครื่องมือเหล่านี้ไปมาก วิธีการบางอย่างใช้งานได้กับรูปร่างเวกเตอร์เท่านั้นดังนั้นจึงจำเป็นต้องมีการจัดประเภทและการทำให้เป็นเวกเตอร์ (การคำนวณแบบยาว) คุณสามารถช่วยฉันปรับแต่งชุดวิธีการและเครื่องมือที่จะใช้ได้หรือไม่? ขอบคุณมาก!
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.