วิธีที่ฉันใช้คือเงาเมทริกซ์ซึ่งชุดข้อมูลประกอบด้วยตัวแปรตัวบ่งชี้ที่ 1 จะได้รับถ้ามีค่าอยู่และ 0 ถ้ามันไม่ได้ การเชื่อมโยงสิ่งเหล่านี้เข้าด้วยกันและข้อมูลดั้งเดิมสามารถช่วยตัดสินว่าตัวแปรมีแนวโน้มที่จะหายไปด้วยกัน (MAR) หรือไม่ (MCAR) ใช้R
เป็นตัวอย่าง (ยืมมาจากหนังสือ "R in action" โดย Robert Kabacoff):
#Load dataset
data(sleep, package = "VIM")
x <- as.data.frame(abs(is.na(sleep)))
#Elements of x are 1 if a value in the sleep data is missing and 0 if non-missing.
head(sleep)
head(x)
#Extracting variables that have some missing values.
y <- x[which(sapply(x, sd) > 0)]
cor(y)
#We see that variables Dream and NonD tend to be missing together. To a lesser extent, this is also true with Sleep and NonD, as well as Sleep and Dream.
#Now, looking at the relationship between the presence of missing values in each variable and the observed values in other variables:
cor(sleep, y, use="pairwise.complete.obs")
#NonD is more likely to be missing as Exp, BodyWgt, and Gest increases, suggesting that the missingness for NonD is likely MAR rather than MCAR.