กำลังค้นหากลุ่มของหนึ่งชุดของคะแนนรอบ ๆ อีกหนึ่งจุดจากเลเยอร์ต่างกันหรือไม่?


10

ฉันต้องการดูว่ามีการจัดกลุ่มของอาคารประเภทหนึ่ง (x) รอบ ๆ อาคารประเภทอื่น (y) หรือไม่

ไฟล์สองจุดอยู่ในเลเยอร์ต่างกัน

ฉันไม่สามารถหาเครื่องมือที่ฉันจะใช้ทำสิ่งนี้

คำตอบ:


9

ไม่มีเครื่องมือนอกกรอบใน ArcGIS (หรือ GIS อื่น ๆ AFAIK) ที่จะทำงานได้อย่างถูกต้อง

ในปัญหาเช่นนี้คุณต้องวัดปริมาณความหมายโดย "การจัดกลุ่ม" จากนั้นคุณต้องวางแบบจำลองความน่าจะเป็นเพื่อประเมินว่าระดับการจัดกลุ่มที่วัดได้อาจเกิดจากความบังเอิญ

เป็นตัวอย่างของวิธีการดำเนินการคุณอาจเลือกที่จะวัดการจัดกลุ่มในแง่ของระยะทางระหว่างอาคารทั่วไปประเภทxและใกล้ที่สุดอาคารประเภทY นี่เป็นการคำนวณที่ง่าย: เพียงแสดงชุดของอาคารทั้งสองโดยแยกจุดเลเยอร์และทำการเชื่อมโยงเชิงพื้นที่ของ Y กับ X ตารางแอตทริบิวต์ซึ่งยังคงมีหนึ่งระเบียนสำหรับแต่ละประเภทxอาคารตอนนี้จะรวมถึงระยะทางที่ใกล้ที่สุดY คุณสามารถใช้ระยะทางเฉลี่ยเป็นวัดของคุณ

การทดสอบว่าสิ่งนี้อาจเป็นผลมาจากโอกาสที่มีเล่ห์เหลี่ยม หนึ่งการตีความที่เป็นไปได้ของการตั้งค่านี้ก็คือการปรากฏตัวก่อนหน้านี้ปีอาคารประเภทได้รับการสนับสนุนการพัฒนาของxประเภทอาคารที่ค่อนข้างใกล้เคียงกับปี 's มิฉะนั้นเราอาจตั้งสมมติฐานว่าอาคารประเภทxสามารถสร้างได้ทุกที่ที่อาคารอื่นปรากฏเช่นกัน นำไปสู่การง่ายๆดังต่อไปนี้การทดสอบการเปลี่ยนแปลง สร้างเลเยอร์จุดของตำแหน่งที่เป็นไปได้ทั้งหมดที่อาจมีสิ่งปลูกสร้างประเภทxปรากฏขึ้น เลเยอร์นี้อาจเป็นที่ตั้งของสิ่งปลูกสร้างทั้งหมดในพื้นที่ที่สร้างขึ้นในช่วงเวลาเดียวกับxอาคารต่าง ๆ (รวมถึงอาคารxด้วยกันเอง) เข้าร่วมชั้นyเพื่อรับระยะทางไปยังอาคารประเภทy ที่ใกล้ที่สุด การคำนวณที่เหลือจะทำงานนอกตารางแอตทริบิวต์: การคำนวณทางภูมิศาสตร์เสร็จแล้ว สิ่งที่คุณจะทำคือใช้ตัวสร้างตัวเลขสุ่มซ้ำ ๆ เพื่อสุ่มตัวอย่างแบบง่าย ๆ ของสิ่งปลูกสร้างเหล่านี้แต่ละตัวอย่างมีองค์ประกอบตามที่คุณมีอาคารประเภทx คำนวณระยะทางเฉลี่ยสำหรับตัวอย่างนี้ ทำซ้ำจนกว่าคุณจะมีสถิติระยะทางเฉลี่ยมากมาย ถ้าเกือบทั้งหมดเหล่านี้ได้รับการสุ่มระยะทางเฉลี่ยมากขึ้นกว่าระยะทางเฉลี่ยที่คุณวัดสำหรับxอาคารประเภทคุณสามารถสรุปได้ว่าxไม่ได้ถูกจัดกลุ่มโดยบังเอิญ: ผลกระทบเป็นจริง

(การคำนวณดังกล่าวเป็นโปรแกรมที่ดีที่สุดบนแพลตฟอร์มที่เหมาะสมกับวัตถุประสงค์ดังกล่าวเช่น `R 'แต่เกือบทุกซอฟต์แวร์สามารถกดลงในบริการแม้แต่ Excel การเขียนโปรแกรมเป็นอย่างมากต้องใช้น้อยกว่ารู้วิธีการเขียนลูปและเลือก องค์ประกอบจากอาร์เรย์โดยการสุ่ม)

วิธีการทดสอบการเปลี่ยนรูปแบบนี้เหนือกว่าโซลูชันที่ตั้งโปรแกรมไว้ล่วงหน้าเนื่องจากเป็นรูปแบบของการพัฒนาอาคารในบริเวณนี้อย่างชัดเจน หากคุณไม่ทำเช่นนี้คุณมักจะพบหลักฐาน "สำคัญ" ของการจัดกลุ่ม แต่คุณไม่สามารถสรุปสิ่งที่มีประโยชน์จากมันได้เนื่องจากการจัดกลุ่มอาจเกิดจากปัจจัยอื่น ๆ เช่นรูปแบบของถนนสถานที่ตั้งของ ไซต์ที่เหมาะสมสำหรับการพัฒนาและอื่น ๆ อีกมากมาย


1
ฉันรู้ว่าคำตอบนี้เป็นนามธรรมเล็กน้อย เมื่อฉันมีเวลามากขึ้นฉันจะพยายามสร้างภาพประกอบที่เหมือนจริง
whuber

สำหรับผู้ที่ใช้ R ฉันขอแนะนำให้ใช้แพคเกจspatstat ( cran.r-project.org/web/packages/spatstat/index.html ) ดูการวิเคราะห์คลัสเตอร์
om_henners

2

แน่นอนวิธีการวิเคราะห์ข้อมูลของคุณควรขึ้นอยู่กับปัญหาสำคัญที่กระตุ้นการวิเคราะห์

แต่นี่คือแนวคิดบางส่วน:

จาก ESRI:

วิธีการวิเคราะห์เชิงพื้นที่แบบหลายระยะทาง: ฟังก์ชัน k ของ Ripley (สถิติเชิงพื้นที่) ทำงานโดยที่ i และ j ในสมการจะแสดงถึงอาคาร x และ y ของคุณ ฟังก์ชัน K ของ Ripley จะให้การอนุมานความน่าจะเป็น

จากวิทยาการคอมพิวเตอร์:

มีอัลกอริทึมที่ซับซ้อนสำหรับการค้นพบรูปแบบตำแหน่งร่วมที่คุณสามารถใช้ Google


"แนวคิดเรื่องการแปลงแบบง่าย" นั้นน่าสนใจ แต่คุณต้องการบางสิ่งบางอย่างในการเปรียบเทียบกับ: โดยตัวมันเองยากที่จะดึงข้อมูลที่เป็นประโยชน์ออกมา ฟังก์ชั่น K ของ Ripley เป็นเครื่องมือที่มีประโยชน์เช่นกัน แต่น่าเสียดายที่ในหลาย ๆ กรณีมันเพียงสะท้อนให้เห็นถึงรูปทรงเรขาคณิตของชุดข้อมูล ด้วยบ้านในเขตชานเมืองหรือในชนบทซึ่งมีแนวโน้มที่จะอยู่ตามแนวเส้นตรง (ถนน) ฟังก์ชั่น K จะแสดงการจัดกลุ่ม "สำคัญ" อย่างชัดเจนด้วยเหตุผลนี้เพียงอย่างเดียว ดังนั้นมันจึงไม่มีอะไรที่เป็นประโยชน์เกี่ยวกับบ้านอื่นนอกจากที่พวกเขาสร้างขึ้นใกล้ถนน!
whuber

@whuber ขอบคุณมากสำหรับคำอธิบายปัญหาของฟังก์ชัน K ของ Ripley อันดับที่ 2 เมื่อเราเห็นราคาหุ้นในช่วงเวลาหนึ่งเราสามารถมองหาแนวโน้มทั่วไปขึ้นหรือลงหรือสุ่มเรายังสามารถเลือกเวลาที่มีการลดลงหรือเพิ่มขึ้นจำนวนมากและถามว่าทำไม พล็อตว่าความเข้มข้นของอาคารเปลี่ยนแปลงอย่างไรเมื่อมีการเปลี่ยนแปลงระยะทางในลักษณะเดียวกัน มันสามารถใช้เพื่อค้นหา spikes ในความเข้มข้นซึ่งเป็นหลักฐานต่อต้านการกระจายแบบสุ่มนอกจากนี้ยังสามารถใช้เพื่อมุ่งเน้นการตรวจสอบเพิ่มเติมของ spikes ที่อยากรู้อยากเห็น
b_dev

คุณถูก. ประเด็นของฉันคือพล็อตในและของตัวเองบอกอะไรเราเกี่ยวกับการจัดกลุ่ม บางทีการเปรียบเทียบที่ดี (แทนที่จะเป็นราคาหุ้น) เป็นแผนที่ที่มีจำนวนผู้ป่วยมะเร็งไตในรัฐ 2,000-2010 ในสหรัฐอเมริกา ที่มากเกินไปบอกเราไม่มีอะไรเกี่ยวกับ (ทางภูมิศาสตร์) การจัดกลุ่มเพราะมันไม่ได้บัญชีสำหรับการเปลี่ยนแปลงในประชากรระหว่างรัฐ ในทำนองเดียวกันครอส - เคพล็อตต้องการการทำให้เป็นมาตรฐานหรือการอ้างอิงที่เหมาะสมที่สามารถตีความได้ แนวโน้มทั่วไป, แหลม, ฯลฯ อาจเป็นเพียงการสะท้อนให้เห็นถึงรูปแบบทางภูมิศาสตร์ของที่ตั้งอาคารทั้งหมด
whuber

@ เมื่อไรคุณพูดถูก หลังจากอ่านความคิดเห็นข้างต้นของคุณฉันได้ตัดสินใจว่า Simple Plot Idea ของฉันจะไม่ให้ข้อมูลมากอย่างน้อยตามที่อธิบายไว้ดังนั้นฉันจึงลบมันออกเพื่อไม่ให้ผู้คนสับสน ตอนนี้ฉันเชื่อว่าสถิติการนับร่วมเป็นวิธีที่ง่ายที่สุดในการเข้าถึงปัญหา
b_dev

2

ฉันไม่เคยทำการวิเคราะห์คลัสเตอร์ใน GIS ด้วยตัวเอง แต่มันจะง่ายขึ้นหรือไม่ถ้าคุณสร้างคะแนน / รูปหลายเหลี่ยมเพื่อแทนกลุ่มของ X และ / หรือ Y ที่กำหนดตัวอย่างเช่นถ้าคุณสร้างคะแนนเพื่อแสดงถึงสิ่งปลูกสร้าง Y คุณสามารถทำได้ ใช้เครื่องมือPoint Distanceเพื่อรับคะแนนทั้งหมดของการสร้าง X ภายในระยะทางที่กำหนดจากตำแหน่งต้นทางของคุณ

มิฉะนั้นการสร้างบัฟเฟอร์รอบสิ่งปลูกสร้างประเภท Y และการเลือกสิ่งปลูกสร้างประเภท X ทั้งหมดจะได้ผลลัพธ์เช่นเดียวกันหากคุณไม่มี ArcInfo


0

คุณสามารถรวมเลเยอร์ทั้งสองโดยเพิ่มคอลัมน์ไบนารี (0,1) เพื่อระบุว่าสิ่งปลูกสร้างนั้นมาจาก X หรือ Y

จากที่นั่นโดยใช้GeoDaคุณสามารถระบุความสัมพันธ์เชิงพื้นที่อัตโนมัติ (การจัดกลุ่ม) และตรวจสอบว่ามันเป็น high-low (หนึ่งเลเยอร์คลัสเตอร์รอบ ๆ เลเยอร์อื่น) low-high (the inverse) หรือ high-high หรือ low-low (self- การจัดกลุ่ม) คู่มือผู้ใช้ที่นี่ (.pdf)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.