ผูกพันกับความสัมพันธ์ของตัวแปรสุ่มสามตัว


28

มีสามตัวแปรสุ่มเป็นx,y,z Z ความสัมพันธ์สามประการระหว่างตัวแปรทั้งสามนั้นเหมือนกัน นั่นคือ,

ρ=cor(x,y)=cor(x,z)=cor(y,z)

แคบผูกคุณสามารถให้สำหรับคืออะไรρ ?


1
สมมุติโดย "pho" คุณหมายถึงrho ( ρ ) อย่างไรก็ตามคำถามของคุณยังไม่ชัดเจน คุณหมายถึงอะไรโดย "อะไรคือขอบเขตที่แคบที่สุดที่คุณสามารถให้ได้"
gung - Reinstate Monica

ชื่อของตัวแปรก็แค่ดัมมี่ ตามขอบเขตที่แคบที่สุดฉันหมายถึงบางสิ่งบางอย่างเช่น [-1, 1] สำหรับความสัมพันธ์ แต่สิ่งนี้ชัดเจนว่าไม่ใช่ขอบเขตที่แคบที่สุดเท่าที่จะเป็นไปได้
user1352399

คุณหมายถึง rho = cor (x, y) = cor (x, z) = cor (y, z) และขีด จำกัด ของ rho คืออะไร?
user31264

ใช่ฉันหมายความว่า rho = cor (x, y) = cor (x, z) = cor (y, z) และขีด จำกัด ของ rho คืออะไร คุณสามารถขยายให้พูดว่า rho ต้องไม่ใช่ค่าลบเช่น> = 0 หรือไม่?
user1352399

1
หนังสืออ้างอิงสำหรับเรื่องนี้คือ Seber & Lee "การวิเคราะห์การถดถอยเชิงเส้น" (อย่างน้อยก็ในฉบับพิมพ์ครั้งแรก ... )
kjetil b halvorsen

คำตอบ:


29

ความสัมพันธ์ทั่วไปสามารถมีค่า+ 1แต่ไม่- 1 ถ้าρ X , Y = ρ X , Z = - 1แล้วρ Y , Zไม่สามารถที่เท่าเทียมกัน- 1แต่ในความเป็นจริง+ 1 ค่าที่น้อยที่สุดของความสัมพันธ์ทั่วไปของตัวแปรสุ่มสามตัวคือ- 1ρ+11ρX,Y=ρX,Z=1ρY,Z1+1 . โดยทั่วไปแล้วความสัมพันธ์ขั้นต่ำทั่วไปของตัวแปรสุ่มnคือ-112n เมื่อการยกย่องว่าเป็นพาหะพวกเขาอยู่ที่จุดของเริม (ที่ของมิติn-1) ในnพื้นที่มิติ1n1n1n

พิจารณาความแปรปรวนของผลรวมของที่ ตัวแปรสุ่มหน่วยความแปรปรวนXฉัน เรามี วาร์( n i = 1 X i )nXi ที่ ˉ ρเป็นค่าเฉลี่ยของค่าสัมประสิทธิ์สหสัมพันธ์ แต่เนื่องจากเราได้รับจาก ว่า

var(i=1nXi)=i=1nvar(Xi)+i=1njincov(Xi,Xj)=n+i=1njinρXi,Xj(1)=n+n(n1)ρ¯
ρ¯(n2)( 1 ) ˉ ρ- 1var(iXi)0(1)
ρ¯1n1.

ดังนั้นค่าเฉลี่ยของค่าสัมประสิทธิ์สหสัมพันธ์เป็น อย่างน้อย {n-1} ถ้าทุกค่าสัมประสิทธิ์สหสัมพันธ์มีเดียวกันค่าแล้วพวกเขายังเฉลี่ยเท่ากับและเพื่อให้เรามีที่ มันเป็นไปได้ที่จะมีตัวแปรสุ่มที่ที่พบความสัมพันธ์ค่าเท่ากับ ? ใช่. สมมติว่ามีuncorrelated หน่วยความแปรปรวนตัวแปรสุ่มและการตั้งค่า {X} จากนั้นในขณะที่ ρρρ-11n1ρρ ρ-1

ρ1n1.
ρ XiYi=Xi-11n1Xi E[Yi]=0var(Yi)= ( n - 1Yi=Xi1nj=1nXj=XiX¯E[Yi]=0 cov(Yi,Yj)=-2(n-1
var(Yi)=(n1n)2+(n1)(1n)2=n1n
และ ให้ ดังนั้นเป็นตัวแปรสุ่มบรรลุขั้นต่ำค่าทั่วไปของความสัมพันธ์{n-1} หมายเหตุบังเอิญที่ และดังนั้นถือว่าเป็นเวกเตอร์ตัวแปรสุ่มอยู่ในมิติไฮเปอร์เพลนมิติของ
cov(Yi,Yj)=2(n1n)(1n)+(n2)(1n)2=1n
ρYi,Yj=cov(Yi,Yj)var(Yi)var(Yj)=1/n(n1)/n=1n1.
YiiYi=0(n-1)n1n1iYi=0(n1)n- มิติพื้นที่

25

ที่เป็นไปได้แคบที่ถูกผูกไว้เป็น1 1/2ρ1 ค่าดังกล่าวทั้งหมดสามารถปรากฏได้จริง - เป็นไปไม่ได้

เพื่อแสดงให้เห็นว่าไม่มีสิ่งใดที่ลึกหรือลึกลับเป็นพิเศษเกี่ยวกับผลลัพธ์คำตอบนี้นำเสนอวิธีแก้ปัญหาเบื้องต้นอย่างสมบูรณ์โดยต้องการเพียงความจริงที่ชัดเจนว่าความแปรปรวนซึ่งเป็นค่าคาดหวังของสี่เหลี่ยมจัตุรัสจะต้องไม่ใช่เชิงลบ ตามด้วยวิธีแก้ปัญหาทั่วไป (ซึ่งใช้ข้อเท็จจริงเชิงพีชคณิตที่ซับซ้อนกว่านี้เล็กน้อย)

วิธีการแก้ปัญหาเบื้องต้น

ความแปรปรวนของการรวมกันเชิงเส้นใด ๆ ของต้องไม่เป็นลบ x,y,z ปล่อยให้ความแปรปรวนของตัวแปรเหล่านี้เป็นและตามลำดับ ทั้งหมดเป็นค่าที่ไม่ใช่ศูนย์ (ไม่เช่นนั้นความสัมพันธ์บางอย่างจะไม่ถูกกำหนด) การใช้คุณสมบัติพื้นฐานของความแปรปรวนที่เราอาจคำนวณυ 2σ2,τ2,υ2

0Var(αx/σ+βy/τ+γz/υ)=α2+β2+γ2+2ρ(αβ+βγ+γα)

สำหรับตัวเลขจริงทั้งหมดแกมมา)(α,β,γ)

สมมติว่า , การจัดการพีชคณิตเล็กน้อยหมายถึงสิ่งนี้เทียบเท่ากับα+β+γ0

ρ1ρ13((α2+β2+γ2)/3(α+β+γ)/3)2.

คำ Squared บนด้านขวามือคืออัตราส่วนของสองหมายถึงอำนาจของแกมมา) ประถมศึกษาไม่เท่าเทียมกันพลังงานเฉลี่ย (ที่มีน้ำหนัก ) อ้างว่าอัตราส่วนไม่เกิน (และจะเท่ากับเมื่อ ) พีชคณิตอีกเล็กน้อยจากนั้นก็หมายถึง(α,β,γ)(1/3,1/3,1/3)11α=β=γ0

ρ1/2.

ตัวอย่างที่ชัดเจนของด้านล่าง (เกี่ยวข้องกับตัวแปรปกติ trivariate ) แสดงให้เห็นว่าค่าดังกล่าวทั้งหมดคือจริงๆแล้วเกิดขึ้นในลักษณะที่สัมพันธ์กัน ตัวอย่างนี้ใช้เพียงคำจำกัดความของ Normals หลายตัวแปร แต่ไม่ได้เรียกผลลัพธ์ของแคลคูลัสหรือพีชคณิตเชิงเส้นn=3(x,y,z)1/2ρ1

วิธีแก้ปัญหาทั่วไป

ภาพรวม

เมทริกซ์สหสัมพันธ์ใด ๆ คือเมทริกซ์ความแปรปรวนร่วมของตัวแปรสุ่มมาตรฐานดังนั้นไหน - เหมือนกับเมทริกซ์สหสัมพันธ์ทั้งหมด - มันต้องเป็นค่ากึ่งบวกแน่นอน ค่าลักษณะเฉพาะของมันนั้นไม่เท่ากัน สิ่งนี้กำหนดเงื่อนไขอย่างง่ายใน : ต้องไม่น้อยกว่า (และแน่นอนไม่เกิน ) ในทางกลับกันใด ๆ ที่สอดคล้องกับเมทริกซ์สหสัมพันธ์ของการแจกแจงแบบวริยาบางส่วนการพิสูจน์ขอบเขตเหล่านี้เป็นไปได้ที่แคบที่สุดρ1/21ρ


ที่มาของเงื่อนไขในρ

พิจารณาโดยเมทริกซ์ความสัมพันธ์กับค่าปิดเส้นทแยงมุมเท่ากับ(คำถามนี้เกี่ยวข้องกับกรณีแต่การวางนัยทั่วไปนี้ไม่ยากต่อการวิเคราะห์) ลองเรียกมันว่า ตามคำนิยามเป็นค่าเฉพาะของการให้มีอยู่ไม่ใช่ศูนย์เวกเตอร์เช่นนั้นnnρ.n=3,C(ρ,n).λxλ

C(ρ,n)xλ=λxλ.

ค่าลักษณะเฉพาะเหล่านี้หาได้ง่ายในกรณีปัจจุบันเพราะ

  1. ให้คำนวณให้1=(1,1,,1)

    C(ρ,n)1=(1+(n1)ρ)1.
  2. การให้โดยที่มีเฉพาะในสถานที่ (สำหรับ ) คำนวณว่าyj=(1,0,,0,1,0,,0)1jthj=2,3,,n

    C(ρ,n)yj=(1ρ)yj.

เพราะ eigenvectors พบเพื่อให้ห่างไกลครอบคลุมเต็มมิติ (หลักฐาน: ง่ายต่อการแสดงการลดแถวค่าสัมบูรณ์ของปัจจัยของพวกเขาเท่ากับซึ่งไม่ใช่ศูนย์) พวกเขาเป็นพื้นฐานของทุก eigenvectors ดังนั้นเราจึงพบค่าลักษณะเฉพาะทั้งหมดและพิจารณาว่าเป็นหรือ (หลังที่มี multiplicity ) นอกเหนือจากความไม่เสมอภาคที่รู้จักกันดีพอใจจากสหสัมพันธ์ทั้งหมดnnn1+(n1)ρ1ρn11ρ1

ρ1n1

ในขณะที่การปฏิเสธของค่าลักษณะเฉพาะที่สองไม่มีเงื่อนไขใหม่


หลักฐานความเพียงพอของเงื่อนไข

ความหมายของการทำงานในทั้งสองทิศทาง: ให้เดอะเมทริกซ์เป็น nonnegative - แน่นอนและเป็นความสัมพันธ์ที่ถูกต้อง ตัวอย่างเช่นเมทริกซ์สหสัมพันธ์สำหรับการแจกแจงแบบพหุคูณ โดยเฉพาะเขียน1/(n1)ρ1,C(ρ,n)

Σ(ρ,n)=(1+(n1)ρ)Inρ(1ρ)(1+(n1)ρ)11

สำหรับการผกผันของเมื่อ ตัวอย่างเช่นเมื่อC(ρ,n)1/(n1)<ρ<1.n=3

Σ(ρ,3)=1(1ρ)(1+2ρ)(ρ+1ρρρρ+1ρρρρ+1).

ให้เวกเตอร์ของตัวแปรสุ่มมีฟังก์ชันการแจกแจง(X1,X2,,Xn)

fρ,n(x)=exp(12xΣ(ρ,n)x)(2π)n/2((1ρ)n1(1+(n1)ρ))1/2

ที่x_n) ตัวอย่างเช่นเมื่อนี่เท่ากับx=(x1,x2,,xn)n=3

1(2π)3(1ρ)2(1+2ρ)exp((1+ρ)(x2+y2+z2)2ρ(xy+yz+zx)2(1ρ)(1+2ρ)).

เมทริกซ์สหสัมพันธ์สำหรับตัวแปรสุ่มตัวนี้คือnC(ρ,n).

รูป

ส่วนของฟังก์ชันความหนาแน่น จากซ้ายไปขวา8/10 หมายเหตุวิธีการเปลี่ยนแปลงความหนาแน่นจากการถูกความเข้มข้นใกล้เครื่องบินจะเป็นความเข้มข้นที่อยู่ใกล้เส้น Zfρ,3.ρ=4/10,0,4/10,8/10x+y+z=0x=y=z

กรณีพิเศษและสามารถรับรู้ได้โดยการแจกแจงที่ลดลง ฉันจะไม่เข้าไปดูรายละเอียดยกเว้นเพื่อชี้ให้เห็นว่าในกรณีก่อนหน้านี้การพิจารณาการแจกจ่ายสามารถพิจารณาได้ในไฮเปอร์เพลนซึ่งเป็นผลรวมของค่าเฉลี่ยที่กระจายตัวเหมือนกัน -แจกแจงแบบปกติในขณะที่ในกรณีหลัง (ความสัมพันธ์เชิงบวกที่สมบูรณ์แบบ) จะได้รับการสนับสนุนในบรรทัดที่สร้างโดยซึ่งมีการกระจายแบบเฉลี่ย-ρ=1/(n1)ρ=1x.1=0010


เพิ่มเติมเกี่ยวกับการเสื่อมสภาพ

การทบทวนการวิเคราะห์นี้ทำให้เห็นได้ชัดว่าความสัมพันธ์เมทริกซ์มีอันดับของและมีอันดับ จาก (เพราะมีเพียงหนึ่งไอเกนิคเตอร์เท่านั้นที่มีค่าศูนย์ไม่เท่ากัน) สำหรับนี่จะทำให้เมทริกซ์สหสัมพันธ์ลดลงในทั้งสองกรณี มิฉะนั้นการดำรงอยู่ของสิ่งที่ตรงกันข้ามพิสูจน์ได้ว่ามันไม่ได้ถูกสร้างC(1/(n1),n)n1C(1,n)1n2Σ(ρ,n)


20

เมทริกซ์ความสัมพันธ์ของคุณคือ

(1ρρρ1ρρρ1)

เมทริกซ์นั้นเป็นค่าเซมิตีบวกบวกหากผู้เยาว์หลักชั้นนำไม่ได้เป็นลบ ผู้เยาว์หลักเป็นตัวกำหนดของบล็อก "ทางตะวันตกเฉียงเหนือ" ของเมทริกซ์คือ 1 ซึ่งเป็นดีเทอร์มิแนนต์ของ

(1ρρ1)

และดีเทอร์มีแนนต์ของเมทริกซ์สหสัมพันธ์นั้น

1 เป็นบวกอย่างเห็นได้ชัดผู้เยาว์หลักที่สองคือซึ่งเป็นค่าลบสำหรับความสัมพันธ์ที่ยอมรับใด ๆ[-1,1] ดีเทอร์มิแนนต์ของเมทริกซ์สหสัมพันธ์ทั้งหมดคือ1ρ2ρ[1,1]

2ρ33ρ2+1.

พล็อตแสดงให้เห็นว่าปัจจัยของการทำงานในช่วงของความสัมพันธ์ที่ยอมรับ[-1,1] [1,1]ป้อนคำอธิบายรูปภาพที่นี่

คุณเห็นว่าฟังก์ชั่นนั้นไม่เป็นลบในช่วงที่กำหนดโดย @stochazesthai (ซึ่งคุณสามารถตรวจสอบได้โดยการค้นหารากของสมการดีเทอร์แนนตัล)


เราไม่ได้สมมติในคำตอบของคุณว่าหรือไม่? ทำไมเรา Var()=1
ชายชราในทะเล

1
@Anold คุณดูเหมือนจะอ่าน "ความแปรปรวนร่วม" ที่เขียน "ความสัมพันธ์"
whuber

6

มีตัวแปรสุ่ม ,และมีความสัมพันธ์แบบจับคู่ถ้าหากเมทริกซ์สหสัมพันธ์นั้นเป็น semidefinite เชิงบวก นี้เกิดขึ้นเฉพาะสำหรับ1]Y Z ρ X Y = ρ Y Z = ρ X Z = ρ ρ [ - 1XYZρXY=ρYZ=ρXZ=ρρ[12,1]


2
คุณสามารถอธิบายสิ่งนี้ในแง่ง่ายมาก
Elizabeth Susan Joseph

1
ฉันไม่คิดว่ามีคำอธิบายที่ไม่ต้องการความรู้เกี่ยวกับพีชคณิตเมทริกซ์ ฉันแนะนำให้คุณดูที่หน้า Wikipedia ( en.wikipedia.org/wiki/… )
stochazesthai

4
ฉันพบคำอธิบายที่ต้องการเพียงพีชคณิตพื้นฐาน (ระดับมัธยม) และได้รวมไว้ในคำตอบของฉัน
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.