ตัวแปรสุ่มมีความสัมพันธ์หากว่าอันดับของพวกเขามีความสัมพันธ์กันหรือไม่


20

สมมติว่าเป็นตัวแปรสุ่มแบบต่อเนื่องโดยมีช่วงเวลาที่ จำกัด ประชากรรุ่นของสเปียร์แมนยศค่าสัมประสิทธิ์สหสัมพันธ์สามารถกำหนดเป็นผลิตภัณฑ์ที่ช่วงเวลาที่มีค่าสัมประสิทธิ์ρของเพียร์สันน่าจะเป็นปริพันธ์แปลงF_X (X)และF_Y (Y)ที่F_X, F_Yเป็น CDF ของXและYคือρ s F X ( X ) F Y ( Y ) F X , F Y X YX,YρsFX(X)FY(Y)FX,FYXY

ρs(X,Y)=ρ(F(X),F(Y))(Y))

ฉันสงสัยว่าคนทั่วไปสามารถสรุปได้หรือไม่

ρ(X,Y)0ρ(F(X),F(Y))0 ?

คือเรามีความสัมพันธ์เชิงเส้นถ้าหากเรามีความสัมพันธ์เชิงเส้นระหว่างแถวหรือไม่?

ปรับปรุง:ในความคิดเห็นทั้งสองตัวอย่างจะได้รับทำไม

ρ(FX(X),FY(Y))=0ρ(X,Y)=0

ไม่เป็นความจริงโดยทั่วไปแม้ว่าXและYจะมีการแจกแจงแบบเดียวกัน ดังนั้นควรตั้งคำถามใหม่เป็น

ρ(X,Y)=0ρ(FX(X),FY(Y)) ?

มันเป็นเรื่องที่น่าสนใจอย่างมากสำหรับฉันไม่ว่าจะเป็นเรื่องจริง / เท็จถ้าXและYมีการแจกแจงแบบเดียวกัน

(หมายเหตุ: ถ้าXและYมีความสัมพันธ์เชิงบวกในเชิงบวกนั่นคือδ(x,y)=FX,Y(x,y)FX(x)FY(y)>0ดังนั้นสูตรความแปรปรวนร่วมของ Hoeffding Cov(X,Y)=δ(x,y)dxdyให้ผลตอบแทนที่ρ(X,Y)>0และρ (F (X), F (Y))> 0.ρ(F(X),F(Y))>0 )


4
คำแนะนำ: เพื่อให้ได้คำตอบให้คิดเกี่ยวกับสิ่งที่เกิดขึ้นกับแต่ละมาตรการความสัมพันธ์ภายใต้การเปลี่ยนแปลงแบบโมโนโทนิคอย่างเด็ดขาด
พระคาร์ดินัล

1
@ cardinal: ดีห่าของ spearman คือค่าคงที่ภายใต้การแปลง monotonic อย่างเคร่งครัดสัมประสิทธิ์สหสัมพันธ์เชิงเส้นแบบดั้งเดิมจะเปลี่ยน แต่ไม่ชัดเจนว่าอย่างไร (?) ... โดยเฉพาะอย่างยิ่งฉันไม่ทราบว่าค่าความสัมพันธ์เชิงเส้นสามารถเปลี่ยนค่าแบบฟอร์มศูนย์เป็น ไม่ใช่ศูนย์ภายใต้การแปลงแบบโมโนโทนิคอย่างเข้มงวด ... แต่ฉันอาจพลาดจุดของคุณ
FSpanhel

คุณมาถูกทางแล้ว! Letและ 2 ทีนี้ลองดูการเปลี่ยนรูปแบบโมโนโทนิกของทั้งสองอย่างเคร่งครัด ฉันยังไม่ได้ตรวจสอบอย่างชัดเจน แต่มีแนวโน้มที่จะทำงาน Y = X 2 g ( z ) = exp ( - z / 2 )XN(0,1)Y=X2g(z)=exp(z/2)
พระคาร์ดินัล

2
คุณถูกต้อง ตัวอย่างที่สองไม่ทำงานตามที่ฉันตั้งใจ / สงสัย อย่างไรก็ตามหลักการทั่วไปเกี่ยวกับวิธีการสร้างตัวอย่างเคาน์เตอร์ยังคงมีอยู่ และใช่เรื่องนี้สามารถเชื่อมโยงอย่างแน่นแฟ้นกับ copulas :-)
พระคาร์ดินัล

2
เมื่อคุณยืนยันตัวอย่างเคาน์เตอร์ของคุณแล้วโปรดพิจารณาเขียนคำตอบลงในโพสต์นี้ ฉันยินดีที่จะลงคะแนนมัน ไชโย
พระคาร์ดินัล

คำตอบ:


8

ความสัมพันธ์ที่เป็นศูนย์ไม่จำเป็นต้องบอกอะไรคุณมากนักเนื่องจากข้อมูลเหล่านั้น 'น้ำหนัก' โดยเฉพาะอย่างยิ่งข้อมูลที่รุนแรงมากแตกต่างกัน ฉันแค่ไปเล่นกับตัวอย่าง แต่ตัวอย่างที่คล้ายกันสามารถสร้างขึ้นด้วยการแจกแจง / โคปิล่าแบบ bivariate

1. Spearman correlation 0 ไม่ได้หมายความถึง Pearson correlation 0 :

ดังที่ได้กล่าวไว้ในคำถามมีตัวอย่างในความคิดเห็น แต่โครงสร้างพื้นฐานคือ "สร้างกรณีที่ความสัมพันธ์ของสเปียร์แมนคือ 0 จากนั้นนำจุดที่มากที่สุดและทำให้มันสุดขั้วมากขึ้นโดยไม่เปลี่ยนความสัมพันธ์สเปียร์แมน"

ตัวอย่างในความคิดเห็นนั้นดีมาก แต่ฉันจะเล่นกับตัวอย่าง 'สุ่ม' มากขึ้นที่นี่ ดังนั้นให้พิจารณาข้อมูลนี้ (ใน R) ซึ่งจากการก่อสร้างมีทั้ง Spearman และ Pearson correlation 0:

x=c(0.660527211673069, 0.853446087136149, -0.00673848667511427, 
-0.730570343152498, 0.0519171047989013, 0.00190761493801791, 
-0.72628058443299, 2.4453231076856, -0.918072410495674, -0.364060229489348, 
-0.520696233492491, 0.659907250608776)
y=c(-0.0214697990371976, 0.255615059485107, 1.10561181413232, 0.572216886959267, 
-0.929089680725018, 0.530329993414123, -0.219422799586819, -0.425186120279194, 
-0.848952532832652, 0.859700836483046, -0.00836246690850083, 
1.43806947831794)

cor(x,y);cor(x,y,method="sp")
[1] 1.523681e-18
[1] 0

ทีนี้เพิ่ม 1,000 ถึง y [12] และลบ 0.6 จาก x [9]; ความสัมพันธ์ของสเปียร์แมนนั้นไม่เปลี่ยนแปลง แต่ความสัมพันธ์ของเพียร์สันอยู่ในขณะนี้ 0.1841:

  ya=y
  ya[12]=ya[12]+1000
  xa=x
  xa[9]=xa[9]-.6
  cor(xa,ya);cor(xa,ya,method="sp")
[1] 0.1841168
[1] 0

(หากคุณต้องการความสำคัญอย่างยิ่งต่อความสัมพันธ์ของเพียร์สันให้ทำซ้ำตัวอย่างทั้งหมดหลายครั้ง)

2. เพียร์สันสหสัมพันธ์ 0 ไม่ได้บ่งบอกถึงความสัมพันธ์ของสเปียร์แมน 0 :

ต่อไปนี้เป็นสองตัวอย่างที่มีค่าสหสัมพันธ์แบบเพียร์สัน แต่ไม่มีความสัมพันธ์แบบสเปียร์แมน (และอีกครั้งหากคุณต้องการความสำคัญอย่างยิ่งสำหรับความสัมพันธ์สเปียร์แมนเหล่านี้เพียงทำซ้ำตัวอย่างทั้งหมดหลายครั้ง)

ตัวอย่างที่ 1:

 x1=c(rep(-3.4566679074320789866,20),-2:5)
 y1=x1*x1
 cor(x1,y1);cor(x1,y1,method="spe")
[1] -8.007297e-17 
[1] -0.3512699   

คะแนนพาราโบลาจัดให้ 0 เพียร์สัน แต่ไม่ใช่ศูนย์สเปียร์แมนสหพันธ์

ตัวอย่างที่ 2:

 k=16.881943016134132 
 x2=c(-9:9,-k,k)
 y2=c(-9:9,k,-k)
 cor(x2,y2);cor(x2,y2,method="spe")
[1] -9.154471e-17
[1] 0.4805195

จุดบนบรรทัด ay = x ยกเว้นขนาดเล็กที่สุดและใหญ่ที่สุดซึ่งอยู่บน y = -x

ในตัวอย่างสุดท้ายนี้ความสัมพันธ์ของสเปียร์แมนสามารถทำให้แข็งแกร่งขึ้นโดยการเพิ่มคะแนนมากขึ้นใน y = x ในขณะที่ทำให้ทั้งสองจุดที่มุมบนซ้ายและขวาล่างสุดสุดขีดมากขึ้นเพื่อรักษาความสัมพันธ์ของเพียร์สันที่ 0

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.