ทำไมการทดสอบของ Mantel จึงเป็นที่ต้องการมากกว่า Moran I


36

การทดสอบของ Mantelใช้กันอย่างแพร่หลายในการศึกษาทางชีววิทยาเพื่อตรวจสอบความสัมพันธ์ระหว่างการกระจายของพื้นที่ของสัตว์ (ตำแหน่งในอวกาศ) ด้วยเช่นความสัมพันธ์ทางพันธุกรรมอัตราการรุกรานหรือคุณลักษณะอื่น ๆ มีวารสารที่ดีมากมายที่ใช้มัน ( PNAS, พฤติกรรมสัตว์, นิเวศวิทยาโมเลกุล ... )

ฉันประดิษฐ์รูปแบบบางอย่างที่อาจเกิดขึ้นตามธรรมชาติ แต่การทดสอบของ Mantel ดูเหมือนว่าไม่มีประโยชน์เลยที่จะตรวจจับพวกมัน บนมืออื่น ๆ , โมแรนฉันได้ผลลัพธ์ที่ดีกว่า(ดูหน้าค่าในแต่ละล็อต)

ทำไมนักวิทยาศาสตร์ไม่ใช้โมแรนฉันแทน? มีเหตุผลซ่อนเร้นที่ฉันไม่เห็นหรือไม่? และถ้ามีเหตุผลบางอย่างฉันจะรู้ได้อย่างไร (จะต้องสร้างสมมติฐานต่างกันอย่างไร) เพื่อใช้การทดสอบของ Mantel หรือ Moran I อย่างเหมาะสม? ตัวอย่างในชีวิตจริงจะเป็นประโยชน์

ลองนึกภาพสถานการณ์นี้:มีสวนผลไม้ (17 x 17 ต้น) ที่มีอีกากำลังนั่งอยู่บนต้นไม้แต่ละต้น ระดับของ "เสียงรบกวน" สำหรับแต่ละอีกานั้นมีให้บริการและคุณต้องการทราบว่าการกระจายของอีกาในอวกาศนั้นถูกกำหนดโดยเสียงรบกวนหรือไม่

มี (อย่างน้อย) 5 ความเป็นไปได้:

  1. "นกขนนกแห่กันไป" กาที่คล้ายกันมากขึ้นมีขนาดเล็กของระยะทางระหว่างพวกเขา(กลุ่มเดียว)

  2. "นกขนนกแห่กันไป" อีกครั้งที่อีกาที่คล้ายกันคือระยะทางทางภูมิศาสตร์ที่เล็กกว่า(หลายกลุ่ม)แต่กลุ่มที่มีเสียงดังกาไม่มีความรู้เกี่ยวกับการมีอยู่ของกระจุกดาวที่สอง

  3. "แนวโน้มแบบโมโนโทนิก"

  4. "ตรงกันข้ามดึงดูด" อีกาที่คล้ายกันไม่สามารถยืนหยัดได้

  5. "รูปแบบสุ่ม" ระดับเสียงไม่มีผลกระทบอย่างมีนัยสำคัญต่อการกระจายเชิงพื้นที่

สำหรับแต่ละกรณีฉันสร้างจุดและใช้การทดสอบหิ้งเพื่อคำนวณความสัมพันธ์ (ไม่น่าแปลกใจที่ผลลัพธ์ของมันไม่สำคัญฉันจะไม่พยายามค้นหาความสัมพันธ์เชิงเส้นในรูปแบบของคะแนนดังกล่าว)

ป้อนคำอธิบายรูปภาพที่นี่


ข้อมูลตัวอย่าง: (บีบอัดมากที่สุด)

r.gen   <- seq(-100,100,5)
r.val   <- sample(r.gen, 289, replace=TRUE)
z10     <- rep(0, times=10)
z11     <- rep(0, times=11)
r5      <- c(5,15,25,15,5)
r71     <- c(5,20,40,50,40,20,5)
r72     <- c(15,40,60,75,60,40,15)
r73     <- c(25,50,75,100,75,50,25)
rbPal   <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
             c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
             z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
             seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
             seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
             seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
             seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289, 
             replace=TRUE))

# adding colors
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]

การสร้างเมทริกซ์ของระยะทางภูมิศาสตร์ (สำหรับ Moran I ถูกรุกราน):

point.dists           <- dist(cbind(my.data$x, my.data$y))
point.dists.inv       <- 1/point.dists
point.dists.inv       <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0

การสร้างแปลง:

X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))

library(ape)
for (i in 3:7) {
  my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
  plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="", 
       ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
  text(4.5, -2.25, paste("Mantel's test", "\n z.stat =", round(my.res$z.stat, 
   2), "\n p.value =", round(my.res$p, 3)))

  my.res <- Moran.I(my.data[ ,i], point.dists.inv)
  text(12.5, -2.25, paste("Moran's I", "\n observed =", round(my.res$observed, 
   3), "\n expected =",round(my.res$expected,3), "\n std.dev =", 
       round(my.res$sd,3), "\n p.value =", round(my.res$p.value, 3)))
}

par(mar=c(5,4,4,2)+0.1)

for (i in 3:7) {
  plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="geographical distance", 
       ylab="behavioural distance")
}

PS ในตัวอย่างบนเว็บไซต์ช่วยเหลือสถิติของ UCLA ใช้การทดสอบทั้งคู่กับข้อมูลเดียวกันและสมมติฐานเดียวกันซึ่งไม่เป็นประโยชน์ (cf. , Mantel test , Moran I )

การตอบสนองต่อ IM คุณได้เขียน:

... มัน [Mantel] ทำการทดสอบว่ากาที่เงียบสงบอยู่ใกล้กับกาที่เงียบสงบอื่น ๆ หรือไม่ในขณะที่อีกาที่มีเสียงดังนั้นมีเพื่อนบ้านที่มีเสียงดัง

ผมคิดว่าสมมติฐานดังกล่าวอาจไม่ได้รับการทดสอบโดยการทดสอบ Mantel ในทั้งสองแปลงสมมติฐานที่ถูกต้อง แต่ถ้าคุณคิดว่าหนึ่งในกลุ่มของอีกาที่ไม่มีเสียงดังอาจไม่มีความรู้เกี่ยวกับการดำรงอยู่ของกลุ่มที่สองของอีกาที่ไม่มีเสียงดัง - การทดสอบ Mantels ไร้ประโยชน์อีกครั้ง การแยกดังกล่าวน่าจะเป็นไปได้มากในธรรมชาติ (ส่วนใหญ่เมื่อคุณทำการรวบรวมข้อมูลในระดับที่ใหญ่กว่า)

ป้อนคำอธิบายรูปภาพที่นี่

คำตอบ:


18

การทดสอบหิ้งและโมแรนฉันอ้างถึงสองแนวคิดที่แตกต่างกันมาก

เหตุผลในการใช้ Moran I คือคำถามเกี่ยวกับความสัมพันธ์เชิงพื้นที่: ความสัมพันธ์ของตัวแปรกับตัวมันเองผ่านอวกาศ ใครคนหนึ่งใช้โมแรนฉันเมื่อต้องการรู้ว่าเหตุการณ์ที่เกิดขึ้นในหน่วยที่มีขนาดใหญ่ทำให้มีโอกาสมากขึ้นหรือไม่เกิดเหตุการณ์ที่เกิดขึ้นในหน่วยพื้นที่ใกล้เคียง กล่าวอีกนัยหนึ่ง (โดยใช้ตัวอย่างของคุณ): หากมีอีกาที่มีเสียงดังบนต้นไม้จะมีอีกาที่มีเสียงรบกวนอื่น ๆ ในพื้นที่ใกล้เคียงหรือไม่ สมมติฐานว่างสำหรับโมแรนฉันไม่มีความสัมพันธ์เชิงพื้นที่ในตัวแปรที่น่าสนใจ

เหตุผลในการใช้การทดสอบแบบแมนเทลคือคำถามของความเหมือนหรือความแตกต่างระหว่างตัวแปร เราใช้การทดสอบหิ้งเมื่อต้องการทราบว่าตัวอย่างที่มีความคล้ายคลึงกันในแง่ของตัวแปรทำนาย (ช่องว่าง) ก็มีแนวโน้มที่จะเหมือนกันในแง่ของตัวแปรตาม (สปีชีส์) พูดง่าย ๆ : ตัวอย่างที่อยู่ใกล้กันก็มีองค์ประกอบที่คล้ายคลึงกันและเป็นตัวอย่างที่อยู่ห่างไกลจากกันและกัน ใช้ตัวอย่างของคุณ: ทดสอบว่ากาที่เงียบสงบอยู่ใกล้กับกาที่เงียบสงบอื่น ๆ หรือไม่ในขณะที่อีกาที่มีเสียงดังมีเพื่อนบ้านที่มีเสียงดัง สมมติฐานว่างไม่มีความสัมพันธ์ระหว่างตำแหน่งเชิงพื้นที่กับ DV
นอกจากนี้การทดสอบ Mantel บางส่วนช่วยให้การเปรียบเทียบตัวแปรสองตัวในขณะที่การควบคุมสำหรับหนึ่งในสาม
ตัวอย่างเช่นหนึ่งต้องการการทดสอบหิ้งเมื่อเปรียบเทียบ

  • สิ่งมีชีวิตสองกลุ่มซึ่งประกอบไปด้วยชุดตัวอย่างชุดเดียวกัน
  • โครงสร้างชุมชนก่อนและหลังการรบกวน
  • ระยะทางพันธุกรรม / นิเวศวิทยาและระยะทางภูมิศาสตร์

นี่คือการอภิปรายที่ดีเกี่ยวกับการทดสอบ Mantel และการใช้งาน

(แก้ไขเพื่อตอบสนองต่อตัวอย่างใหม่ของ Ladislav Nado)

ถ้าฉันเดาได้ว่าเหตุผลที่ทำให้คุณสับสนคือคุณคิดถึงพื้นที่และเสียงรบกวนในตัวอย่างของคุณไม่ว่าจะเป็นตัวแปรต่อเนื่องสองตัวหรือเป็นเมทริกซ์ระยะทางเดียว (ตำแหน่งในอวกาศ) และตัวแปรต่อเนื่องหนึ่งตัว (เสียงรบกวน) ในความเป็นจริงในการวิเคราะห์ความคล้ายคลึงกันระหว่างสองตัวแปรเช่นหนึ่งควรคิดว่าทั้งสองของพวกเขาเช่นการฝึกอบรมทางไกล นั่นคือ:

  • หนึ่งเมทริกซ์ (ตัวอย่างเช่นสำหรับช่องว่าง) อธิบายความแตกต่างสำหรับพิกัดทางภูมิศาสตร์แต่ละคู่ ราคาสำหรับอีกา 2 ตัวที่อยู่ติดกันจะต่ำกว่าค่าของอีกาที่อยู่ห่างกัน
  • เมทริกซ์อื่น (สำหรับสิ่งแวดล้อมพันธุกรรมหรือโครงสร้างอื่น ๆ ) อธิบายความแตกต่างระหว่างผลลัพธ์ที่วัดที่จุดที่กำหนด ค่าสำหรับ 2 อีกาที่มีระดับเสียงใกล้เคียงกัน (ไม่สำคัญว่ามันเงียบหรือมีเสียงดัง - มันเป็นเพียงการวัดความคล้ายคลึงกัน!) ต่ำกว่าค่าของอีกาคู่หนึ่งที่มีระดับเสียงต่างกัน

จากนั้นการทดสอบ Mantel จะคำนวณผลคูณของค่าที่ตรงกันในเมทริกซ์สองตัวนี้ ขอให้ฉันขีดเส้นใต้อีกครั้งว่าสถิติหิ้งเป็นความสัมพันธ์ระหว่างเมทริกซ์ระยะทางสองตัวและไม่เท่ากับความสัมพันธ์ระหว่างตัวแปรที่ใช้สร้างเมทริกซ์เหล่านั้น

ทีนี้ลองหาโครงสร้างสองอย่างที่คุณแสดงในรูป A และ B
ในรูป A ระยะทางในแต่ละคู่ของอีกาสอดคล้องกับความคล้ายคลึงกันในระดับเสียงรบกวน กามีความแตกต่างเล็กน้อยในระดับเสียง (แต่ละอีกาที่เงียบและอีกาที่เงียบอีกอีกาที่มีเสียงดังและอีกาที่มีเสียงดัง) อยู่ใกล้ในขณะที่อีกาแต่ละคู่จะมีความแตกต่างกันในระดับเสียง (อีกาที่เงียบสงบ vs. อีกาที่มีเสียงดัง) จงอยู่ห่างจากกันและกัน การทดสอบหิ้งถูกต้องแสดงว่ามีความสัมพันธ์เชิงพื้นที่ระหว่างสองเมทริกซ์
อย่างไรก็ตามในรูปภาพ B ระยะทางระหว่างกาไม่ได้สอดคล้องกับความคล้ายคลึงกันในระดับเสียงรบกวน ในขณะที่อีกาที่มีเสียงรบกวนอยู่ด้วยกัน แต่อีกาที่เงียบอาจจะอยู่ใกล้ ๆ อันที่จริงแล้วระยะทางในกาคู่ที่แตกต่างกัน (หนึ่งอันเงียบ + หนึ่งเสียงดัง) มีขนาดเล็กกว่าระยะทางสำหรับคู่อีกาที่คล้ายกันบางคู่ (เมื่อทั้งคู่เงียบ)
ไม่มีหลักฐานในภาพ B ว่าหากนักวิจัยเลือกอีกาที่คล้ายกันสองตัวโดยการสุ่มพวกเขาจะเป็นเพื่อนบ้าน ไม่มีหลักฐานว่าหากนักวิจัยหยิบกาใกล้เคียง (หรือไม่ไกลมาก) กาโดยการสุ่มพวกเขาจะคล้ายกัน ดังนั้นการเรียกร้องเริ่มต้นที่On both plots the hypothesis validไม่ถูกต้อง โครงสร้างดังในภาพ B ไม่แสดงความสัมพันธ์เชิงพื้นที่ระหว่างสองเมทริกซ์ดังนั้นจึงล้มเหลวในการทดสอบหิ้ง

แน่นอนว่าโครงสร้างประเภทต่าง ๆ (ที่มีอย่างน้อยหนึ่งกลุ่มของวัตถุที่คล้ายกันหรือไม่มีเส้นขอบคลัสเตอร์ที่ชัดเจนเลย) มีอยู่จริง และการทดสอบ Mantel นั้นใช้ได้อย่างสมบูรณ์และมีประโยชน์มากสำหรับการทดสอบการทดสอบ ถ้าฉันอาจแนะนำให้อ่านอีกดีบทความนี้ใช้ข้อมูลจริงและกล่าวถึง Moran I, Geary c และการทดสอบ Mantel ในแง่ง่ายและเข้าใจง่าย

หวังว่าทุกอย่างจะชัดเจนขึ้นในตอนนี้ แม้ว่าฉันสามารถขยายคำอธิบายนี้หากคุณรู้สึกว่ายังมีบางสิ่งที่ขาดหายไป


1
ขอบคุณสำหรับคำตอบของคุณ แต่ฉันคิดว่าสมมติฐานที่คุณเขียน (จากสมมติฐานการทดสอบ Mantel ในชีวิตจริง) ไม่มีประโยชน์กับข้อมูลในชีวิตจริง ฉันเพิ่มคำตอบของคุณไว้ด้านบนฉันจะดีใจมากถ้าคุณตอบกลับ บางทีฉันผิด
Ladislav Naďo

@Ladislav Nado ฉันได้อัพเดทคำตอบแล้ว โปรดอย่าลังเลที่จะขอคำอธิบายเพิ่มเติมหากจำเป็น
IM

ขอบคุณมากเมื่อฉัน "เคี้ยวผ่าน" บทความที่คุณแนะนำในที่สุดฉันก็เข้าใจ
Ladislav Naďo

1
@ LadislavNado เยี่ยมมาก! ดีใจที่ได้รับความช่วยเหลือ
IM
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.