ฉันมีการวัดหลายร้อย ตอนนี้ฉันกำลังพิจารณาใช้ซอฟต์แวร์บางชนิดเพื่อเชื่อมโยงทุกการวัดกับทุกการวัด ซึ่งหมายความว่ามีความสัมพันธ์นับพัน ในกลุ่มคนเหล่านี้ควรมีความสัมพันธ์ทางสถิติสูงแม้ว่าข้อมูลจะสุ่มอย่างสมบูรณ์ (แต่ละการวัดมีเพียง 100 ดาต้าพอยน์)
เมื่อฉันพบความสัมพันธ์ฉันจะรวมข้อมูลเกี่ยวกับความยากลำบากที่ฉันมองหาความสัมพันธ์ลงไปได้อย่างไร
ฉันไม่ได้อยู่ในระดับสูงในสถิติดังนั้นโปรดอดทนกับฉัน
R
บนเครื่องนี้ใช้เวลา 18 วินาทีในการรับ 1000 การกระจายตัวของโมฆะสัมประสิทธิ์สัมประสิทธิ์สหสัมพันธ์สำหรับ 300 โดย 100 เมทริกซ์x
:correl <- function(x, k=1) { n <- dim(x)[2] * (dim(x)[2]-1) / 2; v <- cor(x); sort(v[lower.tri(v)])[(n-k+1):n] }; sim <- replicate(1000, correl(apply(x,2,sample)))