หากฉันมีการแจกแจงแบบแผนสองจุดในพื้นที่ทางภูมิศาสตร์เดียวกันฉันจะเปรียบเทียบการแจกแจงสองแบบนี้ได้อย่างไร
สมมติว่าฉันมีหลายจุดในพื้นที่เล็ก ๆ ดังนั้นการแสดงแผนที่พินนั้นไม่เป็นไปตามปกติ
หากฉันมีการแจกแจงแบบแผนสองจุดในพื้นที่ทางภูมิศาสตร์เดียวกันฉันจะเปรียบเทียบการแจกแจงสองแบบนี้ได้อย่างไร
สมมติว่าฉันมีหลายจุดในพื้นที่เล็ก ๆ ดังนั้นการแสดงแผนที่พินนั้นไม่เป็นไปตามปกติ
คำตอบ:
เช่นเคยขึ้นอยู่กับวัตถุประสงค์และลักษณะของข้อมูล สำหรับแมปสมบูรณ์ข้อมูลเครื่องมือที่มีประสิทธิภาพเป็นฟังก์ชั่น L ริบลีส์, ญาติสนิทของฟังก์ชั่น K ริบลีส์ ซอฟต์แวร์จำนวนมากสามารถคำนวณสิ่งนี้ได้ ArcGIS อาจจะทำมันในตอนนี้ ฉันไม่ได้ตรวจสอบ CrimeStatทำมัน เพื่อทำGeoDa และ R ตัวอย่างของการใช้งานพร้อมแผนที่ที่เกี่ยวข้องปรากฏขึ้นใน
Sinton, DS และ W. Huber การทำแผนที่ลายและมรดกทางชาติพันธุ์ในสหรัฐอเมริกา วารสารภูมิศาสตร์. 106: 41-47 2007
นี่คือสกรีนช็อตของ CrimeStat ในเวอร์ชั่น "L function" ของ Ripley's K:
เส้นโค้งสีน้ำเงินแสดงการกระจายของจุดที่ไม่สุ่มเพราะมันไม่ได้อยู่ระหว่างแถบสีแดงและสีเขียวรอบศูนย์ซึ่งเป็นจุดที่สีน้ำเงินสำหรับการ L-function ของการกระจายแบบสุ่มควรอยู่
สำหรับข้อมูลตัวอย่างมากขึ้นอยู่กับลักษณะของการสุ่มตัวอย่าง ทรัพยากรที่ดีสำหรับการนี้สามารถเข้าถึงได้กับผู้ที่มี จำกัด ( แต่ไม่ทั้งหมดอยู่) พื้นหลังในวิชาคณิตศาสตร์และสถิติเป็นตำราสตีเว่น ธ อมป์สันในการสุ่มตัวอย่าง
โดยทั่วไปแล้วเป็นกรณีที่การเปรียบเทียบทางสถิติส่วนใหญ่สามารถแสดงเป็นภาพกราฟิกและการเปรียบเทียบแบบกราฟิกทั้งหมดสอดคล้องกับหรือแนะนำคู่สถิติ ดังนั้นความคิดใด ๆ ที่คุณได้รับจากวรรณกรรมทางสถิติมีแนวโน้มที่จะแนะนำวิธีที่มีประโยชน์ในการทำแผนที่หรือเปรียบเทียบชุดข้อมูลทั้งสองแบบกราฟิก
หมายเหตุ: ข้อมูลต่อไปนี้ได้รับการแก้ไขตามความคิดเห็นของ whuber
คุณอาจต้องการใช้วิธีมอนติคาร์โล นี่คือตัวอย่างง่ายๆ สมมติว่าคุณต้องการพิจารณาว่าการกระจายของเหตุการณ์อาชญากรรม A นั้นคล้ายคลึงกับสถิติของ B หรือไม่คุณสามารถเปรียบเทียบสถิติระหว่างเหตุการณ์ A และ B กับการกระจายเชิงประจักษ์ของมาตรการดังกล่าวสำหรับ 'เครื่องหมาย' ที่กำหนดใหม่แบบสุ่ม
เช่นกำหนดการกระจายของ A (สีขาว) และ B (สีน้ำเงิน)
คุณสุ่มกำหนดป้ายกำกับ A และ B เป็นคะแนนทั้งหมดในชุดข้อมูลที่รวมกัน นี่คือตัวอย่างของการจำลองเดียว:
คุณทำซ้ำหลาย ๆ ครั้ง (พูด 999 ครั้ง) และสำหรับการจำลองแต่ละครั้งคุณคำนวณสถิติ (สถิติเพื่อนบ้านที่ใกล้ที่สุดโดยเฉลี่ยในตัวอย่างนี้) โดยใช้จุดที่มีป้ายกำกับแบบสุ่ม ตัวอย่างโค้ดที่ตามมาอยู่ในR (ต้องใช้ไลบรารีspatstat )
nn.sim = vector()
P.r = P
for(i in 1:999){
marks(P.r) = sample(P$marks) # Reassign labels at random, point locations don't change
nn.sim[i] = mean(nncross(split(P.r)$A,split(P.r)$B)$dist)
}
จากนั้นคุณสามารถเปรียบเทียบผลลัพธ์แบบกราฟิก (เส้นแนวตั้งสีแดงเป็นสถิติดั้งเดิม)
hist(nn.sim,breaks=30)
abline(v=mean(nncross(split(P)$A,split(P)$B)$dist),col="red")
หรือตัวเลข
# Compute empirical cumulative distribution
nn.sim.ecdf = ecdf(nn.sim)
# See how the original stat compares to the simulated distribution
nn.sim.ecdf(mean(nncross(split(P)$A,split(P)$B)$dist))
โปรดทราบว่าสถิติเพื่อนบ้านโดยเฉลี่ยที่ใกล้ที่สุดอาจไม่ใช่วิธีการทางสถิติที่ดีที่สุดสำหรับปัญหาของคุณ สถิติเช่นฟังก์ชั่น K สามารถเปิดเผยได้มากขึ้น (ดูคำตอบของผู้ขายตั๋ว)
สามารถนำไปใช้งานได้อย่างง่ายดายใน ArcGIS โดยใช้ Modelbuilder ในลูปให้สุ่มกำหนดค่าแอททริบิวใหม่ให้กับแต่ละจุดจากนั้นคำนวณสถิติเชิงพื้นที่ คุณควรจะสามารถนับผลลัพธ์ในตารางได้
spatstat
แพคเกจ
คุณอาจต้องการดู CrimeStat
ตามเว็บไซต์:
CrimeStat เป็นโปรแกรมสถิติเชิงพื้นที่สำหรับการวิเคราะห์สถานที่เกิดเหตุอาชญากรรมที่พัฒนาโดยเน็ด Levine & Associates ซึ่งได้รับทุนจากทุนจากสถาบันแห่งชาติของความยุติธรรม (ทุน 1997-IJ-CX-0040, 1999-IJ-CX-0044, 2002-IJ-CX-0007 และ 2005-IJ-CX-K037) โปรแกรมนี้ใช้ Windows และอินเตอร์เฟสกับโปรแกรม GIS บนเดสก์ท็อปส่วนใหญ่ มีวัตถุประสงค์เพื่อจัดทำเครื่องมือทางสถิติเพิ่มเติมเพื่อช่วยหน่วยงานบังคับใช้กฎหมายและนักวิจัยด้านกระบวนการยุติธรรมทางอาญาในการทำแผนที่อาชญากรรม CrimeStat กำลังถูกใช้งานโดยหน่วยงานตำรวจหลายแห่งทั่วโลกเช่นเดียวกับความยุติธรรมทางอาญาและนักวิจัยอื่น ๆ รุ่นล่าสุดคือ 3.3 (CrimeStat III)
วิธีที่ง่ายและรวดเร็วคือการสร้างแผ่นความร้อนและแผนที่ที่แตกต่างของแผ่นความร้อนทั้งสองนั้น ที่เกี่ยวข้อง: วิธีสร้างแผนที่ความร้อนที่มีประสิทธิภาพได้อย่างไร
สมมติว่าคุณได้ทบทวนวรรณกรรมเกี่ยวกับความสัมพันธ์เชิงพื้นที่อัตโนมัติ ArcGIS มีจุดและคลิกเครื่องมือต่างๆที่จะทำเรื่องนี้ให้คุณผ่านสคริปต์ Toolbox: Spatial สถิติเครื่องมือ -> รูปแบบการวิเคราะห์
คุณสามารถทำงานย้อนหลังได้ - ค้นหาเครื่องมือและตรวจสอบอัลกอริทึมที่ใช้เพื่อดูว่ามันเหมาะกับสถานการณ์ของคุณหรือไม่ ฉันใช้ดัชนีโมแรนย้อนกลับไปในขณะที่ตรวจสอบความสัมพันธ์เชิงพื้นที่ในการเกิดแร่ธาตุในดิน
คุณสามารถรันการวิเคราะห์ความสัมพันธ์แบบ bivariate ในโปรแกรมสถิติหลายตัวเพื่อกำหนดระดับความสัมพันธ์ทางสถิติระหว่างตัวแปรทั้งสองและระดับนัยสำคัญ จากนั้นคุณสามารถสำรองการค้นพบทางสถิติของคุณโดยการจับคู่หนึ่งตัวแปรโดยใช้ชุดรูปแบบ chloropleth และตัวแปรอื่น ๆ ที่ใช้สัญลักษณ์ที่สำเร็จการศึกษา เมื่อซ้อนทับแล้วคุณสามารถกำหนดได้ว่าพื้นที่ใดแสดงความสัมพันธ์เชิงพื้นที่สูง / สูงสูง / ต่ำและต่ำ / ต่ำ งานนำเสนอนี้มีตัวอย่างที่ดี
นอกจากนี้คุณยังสามารถลองใช้ซอฟท์แวร์ geovisualization ฉันชอบ CommonGIS สำหรับการสร้างภาพชนิดนี้ คุณสามารถเลือกพื้นที่ใกล้เคียง (ตัวอย่างของคุณ) และสถิติและแผนการที่มีประโยชน์ทั้งหมดจะพร้อมใช้งานทันที มันทำให้การวิเคราะห์แผนที่หลายตัวแปรนั้นง่ายดายมาก
การวิเคราะห์ควอดราตจะดีสำหรับสิ่งนี้ เป็นวิธีการ GIS ที่สามารถเน้นและเปรียบเทียบรูปแบบเชิงพื้นที่ของชั้นข้อมูลจุดต่าง ๆ
ร่างของการวิเคราะห์ quadrat ว่าการประเมินความสัมพันธ์เชิงพื้นที่ระหว่างชั้นข้อมูลหลายจุดสามารถพบได้ที่ http://www.nccu.edu/academics/sc/artsandsciences/geospatialscience/_documents/se_daag_poster.pdf