ตัวอย่างชีวิตจริงของความแตกต่างระหว่างความเป็นอิสระและสหสัมพันธ์


9

เป็นที่ทราบกันดีว่าความเป็นอิสระของตัวแปรสุ่มหมายถึงความสัมพันธ์แบบศูนย์ แต่ความสัมพันธ์แบบศูนย์นั้นไม่จำเป็นต้องหมายความถึงความเป็นอิสระ

ฉันเจอตัวอย่างทางคณิตศาสตร์มากมายที่แสดงถึงการพึ่งพาแม้ว่าจะไม่มีสหสัมพันธ์ มีตัวอย่างชีวิตจริงที่สนับสนุนความจริงข้อนี้หรือไม่?


2
ระวังความสัมพันธ์เป็นศูนย์เท่านั้นและตัวแปรปกติร่วมกันบ่งบอกถึงความเป็นอิสระ
Francis

2
@Siddesh "แต่เนื่องจากปริมาณไม่ใช่ฟังก์ชันเชิงเส้นของความยาวจึงไม่มีความสัมพันธ์กัน" ก็ไม่สัมพันธ์กันอย่างสมบูรณ์ แต่พวกเขาจะมีความสัมพันธ์เชิงบวก
Silverfish

1
@Siddhesh: ที่จะทำงานเฉพาะถ้า ...E[length4]E[length]E[length3]=0
ฟรานซิส

1
รู้สึกอิสระที่จะใส่ความคิดเห็นเกี่ยวกับการกระจายปกติกลับมาถ้าคุณไม่เห็นด้วยกับการแก้ไขของฉัน แต่ฉันคิดว่ามันจะถูกลบออกได้ดีกว่าเนื่องจาก (1) มันเป็นประเด็นที่กวนใจคำถามหลักของคุณ (2) มี (ฉันคิดว่า) ถูกถามในประวัติย่อแล้วก่อนหน้านี้ดังนั้นจึงเป็นเนื้อหาที่มีอยู่เดิมที่นี่ 3) ฉันไม่ต้องการให้เกิดความสับสนในหมู่ผู้อ่านในอนาคต ฉันพยายามแก้ไขคำถามด้วยวิธีที่จะเพิ่มโอกาสในการเปิดใหม่: ฉันคิดว่าคำถามนี้ค่อนข้างแตกต่างจาก "สถิติทางคณิตศาสตร์" ในหัวข้อเดียวกัน
Silverfish

2
ฉันยังคิดว่าคำถามนี้ดีมากและอาจดึงดูดคำตอบที่น่าสนใจเพิ่มเติมหากสามารถเปิดใหม่ได้ (ซึ่งอาจเกี่ยวข้องกับการแก้ไขบางอย่างเพื่อแยกความแตกต่างอย่างชัดเจนจากเธรดที่ปัจจุบันถือว่าซ้ำกัน) ฉันได้ยกหัวข้อใน Metaเกี่ยวกับสิ่งที่จะใช้สำหรับคำถามนี้ที่จะเปิดใหม่ ความคิดเห็นทั้งหมดยินดีต้อนรับ
Silverfish

คำตอบ:


6

การคืนสินค้าเป็นตัวอย่างที่ดีในชีวิตจริงของสิ่งที่คุณต้องการ มีความสัมพันธ์ใกล้เคียงกับศูนย์อย่างมากระหว่างผลตอบแทน S&P 500 ของวันนี้และเมื่อวาน อย่างไรก็ตามมีการพึ่งพาที่ชัดเจน: ผลตอบแทนกำลังสองมีความสัมพันธ์เชิงบวกโดยอัตโนมัติ ช่วงเวลาที่มีความผันผวนสูงจะรวมเป็นกลุ่มตามเวลา

รหัส R:

library(ggplot2)
library(grid)
library(quantmod)

symbols   <- new.env()
date_from <- as.Date("1960-01-01")
date_to   <- as.Date("2016-02-01")
getSymbols("^GSPC", env=symbols, src="yahoo", from=date_from, to=date_to)  # S&P500

df <- data.frame(close=as.numeric(symbols$GSPC$GSPC.Close),
                 date=index(symbols$GSPC))
df$log_return     <- c(NA, diff(log(df$close)))
df$log_return_lag <- c(NA, head(df$log_return, nrow(df) - 1))

cor(df$log_return,   df$log_return_lag,   use="pairwise.complete.obs")  # 0.02
cor(df$log_return^2, df$log_return_lag^2, use="pairwise.complete.obs")  # 0.14

acf(df$log_return,     na.action=na.pass)  # Basically zero autocorrelation
acf((df$log_return^2), na.action=na.pass)  # Squared returns positively autocorrelated

p <- (ggplot(df, aes(x=date, y=log_return)) +
      geom_point(alpha=0.5) +
      theme_bw() + theme(panel.border=element_blank()))
p
ggsave("log_returns_s&p.png", p, width=10, height=8)

บันทึกเวลาของชุดบันทึกจะกลับมาที่ S&P 500:

บันทึกชุดเวลาส่งคืน

หากผลตอบแทนเป็นอิสระตลอดเวลา (และอยู่กับที่) มันคงไม่น่าเป็นไปได้มากที่จะเห็นรูปแบบของความผันผวนของคลัสเตอร์เหล่านั้นและคุณจะไม่เห็นความสัมพันธ์อัตโนมัติในการส่งคืนบันทึกกำลังสอง


3

อีกตัวอย่างหนึ่งคือความสัมพันธ์ระหว่างความเครียดและผลการเรียนในการสอบ ความสัมพันธ์เป็นรูปตัว U ผกผันและความสัมพันธ์อยู่ในระดับต่ำมากแม้ว่าสาเหตุจะดูชัดเจน


2
นั่นเป็นตัวอย่างที่เรียบร้อย คุณมีข้อมูลหรือสิ่งนี้ขึ้นอยู่กับประสบการณ์วิปัสสนา / การสอน?
Adrian

1
ฉันเห็นการศึกษาเรื่องนี้ แต่ฉันเห็นมันเมื่อหลายปีก่อนดังนั้นฉันจึงไม่มีการอ้างอิงหรือข้อมูลจริง
Peter Flom
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.