Moran Iซึ่งเป็นมาตรวัดความสัมพันธ์เชิงพื้นที่อัตโนมัตินั้นไม่ได้เป็นสถิติที่แข็งแกร่งเป็นพิเศษ
เทคนิคที่แข็งแกร่งกว่านี้สำหรับการวัดค่าความสัมพันธ์เชิงพื้นที่มีอะไรบ้าง ฉันสนใจเป็นพิเศษในการแก้ปัญหาที่พร้อมใช้งาน / นำไปใช้ในภาษาสคริปต์เช่นอาร์หากการแก้ปัญหานำไปใช้กับสถานการณ์ / การแจกแจงข้อมูลที่ไม่ซ้ำกันโปรดระบุคำตอบของคุณ
แก้ไข : ฉันกำลังขยายคำถามด้วยตัวอย่างบางส่วน (เพื่อตอบสนองต่อความคิดเห็น / คำตอบของคำถามเดิม)
มีคนแนะนำว่าเทคนิคการเปลี่ยนแปลง (ที่การกระจายตัวตัวอย่างฉันของโมแรนสร้างขึ้นโดยใช้วิธีการมอนติคาร์โล) เสนอวิธีแก้ปัญหาที่มีประสิทธิภาพ ความเข้าใจของฉันคือว่าการทดสอบดังกล่าวจะช่วยลดความจำเป็นที่จะต้องทำให้สมมติฐานใด ๆ เกี่ยวกับการกระจายผมโมแรน (ระบุว่าสถิติการทดสอบสามารถได้รับอิทธิพลจากโครงสร้างเชิงพื้นที่ของชุดข้อมูล) แต่ผมไม่เห็นว่าการเปลี่ยนแปลงแก้ไขเทคนิคในการที่ไม่ปกติ ข้อมูลแอตทริบิวต์กระจาย ฉันเสนอสองตัวอย่าง: ตัวหนึ่งที่แสดงให้เห็นถึงอิทธิพลของข้อมูลที่บิดเบือนที่มีต่อสถิติของโมแรน I ในท้องที่และอีกอันเกี่ยวกับโมแรน I ของโลก - แม้ภายใต้การทดสอบการเปลี่ยนรูป
ฉันจะใช้จางและคณะ 's (2008) วิเคราะห์เป็นตัวอย่างแรก ในบทความของพวกเขาพวกเขาแสดงอิทธิพลของการกระจายข้อมูลคุณลักษณะที่มีต่อMoran I ในท้องถิ่นโดยใช้การทดสอบการเปลี่ยนรูป (9999 แบบจำลอง) ฉันทำซ้ำผลลัพธ์ฮอตสปอตของผู้เขียนสำหรับความเข้มข้นของสารตะกั่ว (Pb) (ที่ระดับความเชื่อมั่น 5%) โดยใช้ข้อมูลดั้งเดิม (แผงด้านซ้าย) และการแปลงบันทึกของข้อมูลเดียวกัน (แผงด้านขวา) ใน GeoDa Boxplots ของความเข้มข้น Pb ดั้งเดิมและบันทึกการแปลงจะถูกนำเสนอด้วย ที่นี่จำนวนฮอตสปอตที่สำคัญเกือบสองเท่าเมื่อข้อมูลถูกแปลง ตัวอย่างนี้แสดงให้เห็นว่าสถิติท้องถิ่นมีความอ่อนไหวต่อการกระจายข้อมูลแอ็ตทริบิวต์ - แม้ว่าจะใช้เทคนิค Monte Carlo!
ตัวอย่างที่สอง (ข้อมูลจำลอง) แสดงให้เห็นถึงข้อมูลที่มีอิทธิพลต่อการเอียงที่มีต่อMoran I ทั่วโลกแม้ในขณะที่ใช้การทดสอบการเปลี่ยนรูป ตัวอย่างในRดังนี้:
library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n <- length(NB)
set.seed(4956)
x.norm <- rnorm(n)
rho <- 0.3 # autoregressive parameter
W <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value
สังเกตความแตกต่างในค่า P ข้อมูลที่เบ้บ่งชี้ว่าไม่มีการทำคลัสเตอร์ที่ระดับนัยสำคัญ 5% (p = 0.167) ในขณะที่ข้อมูลที่แจกแจงตามปกติแสดงว่ามี (p = 0.013)
Chaosheng Zhang, Lin Luo, Weilin Xu, Valerie Ledwith, ใช้ Moran I และ GIS เพื่อระบุฮอตสปอตมลพิษของ Pb ในเมืองในเมืองกัลเวย์, ไอร์แลนด์, วิทยาศาสตร์ของสิ่งแวดล้อมโดยรวม, เล่ม 398, ฉบับที่ 1-3, 15 กรกฎาคม 2008 , หน้า 212-221