คำตอบนี้อธิบายวิธีการที่มีวัตถุประสงค์เพื่อวัดความคลาดเคลื่อนโดยพลการระหว่างชุดข้อมูลเชิงพื้นที่สองชุด ความแตกต่างดังกล่าวอาจรวมถึงการเลื่อนตำแหน่งการเปลี่ยนแปลงรูปร่างและคุณสมบัติที่มีอยู่ในชุดข้อมูลหนึ่ง แต่ไม่ได้อยู่ในชุดข้อมูลอื่น การตอบกลับนี้ไม่ได้ให้วิธีการใด ๆ ในการพิจารณาว่า "ดีกว่า" เพราะขึ้นอยู่กับมากกว่าแค่ข้อมูลและขึ้นอยู่กับว่าจะใช้ข้อมูลใดเป็นพิเศษ
พื้นหลัง
รากฐานที่ดีสำหรับชุดการวัดขนาดใหญ่ขึ้นอยู่กับการแปลงระยะทางแบบยุคลิดของชุดข้อมูลแต่ละชุด มุมมองนี้แต่ละชุดข้อมูลแสดงถึงชุดของคะแนนในเครื่องบิน ลองเรียกคอลเล็กชั่นBเหล่านี้สำหรับคุณสมบัติสีน้ำเงินและRสำหรับคุณสมบัติสีแดง
สำหรับจุดใดxในระนาบที่ระยะทางยุคลิดเปลี่ยนจุดชุดคำนวณที่ยิ่งใหญ่ที่สุดขอบเขตล่างของระยะทางระหว่างxและ เราอาจจะคิดว่านี้เปลี่ยนเป็นการสร้าง "ผิว" ที่มีความสูงที่xเท่ากับระยะทางที่สั้นที่สุดจากxไป ดังนั้นพื้นผิวนี้มีหุบเขาในทุกจุดของที่สูงเป็นศูนย์และเพิ่มขึ้นที่ 1: 1 ลาดห่างจาก เป็นที่ชัดเจนว่าการแปลงระยะทางกลับกันเป็นตัวกำหนดA (หรือในทางเทคนิคการปิดตัวชี้วัดซึ่งสำหรับชุดข้อมูล GIS นั้นเหมือนกับA) เป็นชุดของจุดทั้งหมดที่ความสูงเป็นศูนย์ ดังนั้นการแปลงระยะทางจึงรวบรวมข้อมูลเชิงพื้นที่ทั้งหมดของAที่ GIS สามารถนำเสนอได้อย่างสมบูรณ์
รูปนี้แสดงการแปลงระยะทางของ B (ทางซ้าย) และ R (ทางด้านขวา) ในแบบจำลองการผ่อนปรน
การเปรียบเทียบสองชุด
หากต้องการเปรียบเทียบBและRให้วางซ้อนกันด้วยการแปลงระยะทางของอีกอัน:
ค่าระยะทางแสดงเป็นสีที่เปลี่ยนจากสีน้ำเงิน (ใกล้ 0) ไปจนถึงสีแดง
แผนที่ซ้ายเช่นแสดงให้เห็นจุดของBและสีได้ตามระยะทางของพวกเขาจากR บทบาทของBและRถูกสลับในแผนที่ด้านขวา
สิ่งเหล่านี้ช่วยในการเปรียบเทียบ: แต่ละแผนที่แสดงจุดของชุดข้อมูลหนึ่งและโดยการใช้สีเน้นจุดที่อยู่ห่างจากจุดใด ๆ ในชุดข้อมูลอื่น โปรดทราบว่าจำเป็นต้องใช้แผนที่ทั้งสองเพื่อการเปรียบเทียบเนื่องจากแต่ละจุดแสดงให้เห็นว่าไม่ได้อยู่ที่อื่น
บนแผนที่ที่มีรายละเอียดสีอาจมองเห็นได้ยากดังนั้นเราอาจเลือกที่จะทำให้สีเบลอเล็กน้อยสำหรับการนำเสนอหรือการประเมินด้วยภาพ:
หมายเหตุ: สีไม่สามารถเปรียบเทียบได้ระหว่างแผนที่ทั้งสอง: ในแต่ละแผนที่จะถูกปรับอัตราส่วนเพื่อแสดงระยะทางทั้งหมดในแผนที่นั้น
การวิเคราะห์ทางสถิติของความแตกต่าง
ความสวยงามของวิธีการนี้อยู่ในสิ่งที่สามารถทำได้ในขั้นตอนหลังการประมวลผล การใช้แรสเตอร์เพื่อเป็นตัวแทนของการแปลงระยะทางและการซ้อนทับเราสามารถรับสถิติได้อย่างง่ายดายทั้งในระดับท้องถิ่นและระดับโลกเพื่อวัดความแตกต่าง ตัวอย่างเช่นเราสามารถมุ่งเน้นทุกระยะทางที่ใหญ่กว่าขีด จำกัด เล็ก ๆ บางจุดเพื่อสำรวจการแจกแจงความถี่:
ในแถบสีน้ำเงินฮิสโทแกรมนี้ใช้สำหรับคุณสมบัติสีน้ำเงินแถบสีแดงสำหรับคุณสมบัติสีแดง (หมายเหตุมาตราส่วนลอการิทึมบนแกนนอน) ฮิสโตแกรมนี้แสดงข้อมูลที่ซ้อนทับอยู่ไม่ใช่ข้อมูลเบลอที่ได้มา มันเลือกเฉพาะระยะทางที่ใหญ่กว่าสามพิกเซลในภาพต้นฉบับ
ฮิสโทแกรมเหล่านี้แสดงให้เห็นว่ามีความเป็นไปได้มากที่ฟีเจอร์สีน้ำเงินจะอยู่ไกลจากฟีเจอร์สีแดงมากกว่าในทางกลับกัน : แท่งสีน้ำเงินจะสูงกว่าสีแดงและขยายออกไปเป็นระยะทางไกลขึ้น (ทางขวา) คลังสรรพาวุธทั้งหมดของสถิติเชิงพรรณนาพร้อมใช้งานแล้วสำหรับการหาปริมาณความแตกต่างระหว่างชุดข้อมูลสองชุด สถิติเหล่านี้สามารถนำไปใช้กับภูมิภาคที่น่าสนใจทั้งหมดหรือ "หน้าต่าง" เพื่อดูว่าชุดข้อมูลสองชุดแตกต่างกันอย่างไรตามสถานที่ตั้ง
การดำเนินงาน
GIS แบบแรสเตอร์ส่วนใหญ่จะให้การแปลงระยะทางแบบยุคลิด (เช่นEuclideanDistanceใน ArcGIS และr.grow.distanceใน GRASS) และสนับสนุนการซ้อนทับแบบเรียบง่ายที่จำเป็นสำหรับการวิเคราะห์นี้ การเบลอหากต้องการสามารถทำได้ด้วยค่าเฉลี่ยย่านใกล้เคียงหรือการบิดเคอร์เนล (ซึ่งรวมถึง "Gaussian เบลอ" ที่มีอยู่ในซอฟต์แวร์ประมวลผลภาพทั้งหมด) GISes ส่วนใหญ่ไม่ให้การสนับสนุนที่เพียงพอสำหรับการวิเคราะห์เชิงสถิติของข้อมูลแรสเตอร์อย่างเต็มรูปแบบ แต่พวกเขาสามารถส่งออกข้อมูลดังกล่าวในรูปแบบที่สามารถอ่านได้โดยซอฟต์แวร์ทางสถิติและคณิตศาสตร์เช่นR
หรือMathematica (ซึ่งทำให้ตัวเลขทั้งหมดที่นี่)