ความไม่เท่าเทียมกันของสามเหลี่ยมเป็นจริงสำหรับระยะทางตามความสัมพันธ์เหล่านี้หรือไม่?


13

สำหรับการจัดกลุ่มแบบลำดับชั้นฉันมักจะเห็น "ตัวชี้วัด" สองตัวต่อไปนี้ (พวกเขาพูดไม่ตรงกัน) สำหรับการวัดระยะห่างระหว่างตัวแปรสุ่มสองตัวและ : \ newcommand {\ Cor} {\ mathrm {Cor}} \ start {align} d_1 (X, Y) และ = 1- | \ คอร์ (X, Y) | \\ d_2 (X, Y) และ = 1 - (\ คอร์ (X, Y)) ^ 2 \ end {} จัด ทำอย่างใดอย่างหนึ่ง ตอบสนองความไม่เท่าเทียมกันของสามเหลี่ยมหรือไม่? ถ้าเป็นเช่นนั้นฉันควรจะพิสูจน์ได้อย่างไรนอกจากการคำนวณแบบ bruteforce? หากไม่ใช่ตัวชี้วัดตัวอย่างการนับง่ายๆคืออะไรYXY

d1(X,Y)=1|Cor(X,Y)|,d2(X,Y)=1(Cor(X,Y))2

คุณอาจจะสนใจในการทบทวนบทความนี้: arxiv.org/pdf/1208.3145.pdf
Chris

คำตอบ:


5

ความไม่เท่าเทียมกันสามเหลี่ยมบนd1จะให้ผลผลิต:

d1(X,Z)d1(X,Y)+d1(Y,Z)1|Cor(X,Z)|1|Cor(X,Y)|+1|Cor(Y,Z)||Cor(X,Y)|+|Cor(Y,Z)|1+|Cor(X,Z)|

ดูเหมือนว่าความไม่เท่าเทียมจะเอาชนะได้ง่าย เราสามารถทำให้ด้านขวามีขนาดเล็กที่สุดเท่าที่จะเป็นไปได้ (ตรงจุดเดียว) โดยทำให้XและZเป็นอิสระ ถ้าอย่างนั้นเราจะหาYที่ด้านซ้ายมีมากกว่าหนึ่งอันได้หรือไม่?

ถ้าและและมีความแปรปรวนเหมือนกันดังนั้นและในทำนองเดียวกันสำหรับดังนั้น ด้านซ้ายมือเหนือระดับใดด้านหนึ่งและความไม่เท่าเทียมนั้นถูกละเมิด ตัวอย่างการละเมิดนี้ใน R โดยที่และเป็นส่วนประกอบของตัวแปรหลายตัวแปร:Y=X+ZXZCor(X,Y)=220.707Cor(Y,Z)XZ

library(MASS)
set.seed(123)
d1 <- function(a,b) {1 - abs(cor(a,b))}

Sigma    <- matrix(c(1,0,0,1), nrow=2) # covariance matrix of X and Z
matrixXZ <- mvrnorm(n=1e3, mu=c(0,0), Sigma=Sigma, empirical=TRUE)
X <- matrixXZ[,1] # mean 0, variance 1
Z <- matrixXZ[,2] # mean 0, variance 1
cor(X,Z) # nearly zero
Y <- X + Z

d1(X,Y) 
# 0.2928932
d1(Y,Z)
# 0.2928932
d1(X,Z)
# 1
d1(X,Z) <= d1(X,Y) + d1(Y,Z)
# FALSE

แม้ว่าการก่อสร้างนี้จะไม่ทำงานกับของคุณ:d2

d2 <- function(a,b) {1 - cor(a,b)^2}
d2(X,Y) 
# 0.5
d2(Y,Z)
# 0.5
d2(X,Z)
# 1
d2(X,Z) <= d2(X,Y) + d2(Y,Z)
# TRUE

แทนที่จะเปิดตัวการโจมตีทางทฤษฎีบนในขั้นตอนนี้ฉันเพิ่งพบว่าง่ายต่อการเล่นกับเมทริกซ์ความแปรปรวนร่วมใน R จนกว่าจะมีตัวอย่างที่ดีโผล่ออกมา อนุญาตให้ ,และให้:d2SigmaVar(X)=2Var(Z)=1Cov(X,Z)=1

Var(Y)=Var(X+Y)=Var(X)+Var(Z)+2Cov(X,Z)=2+1+2=5

นอกจากนี้เรายังสามารถตรวจสอบความแปรปรวนร่วม:

Cov(X,Y)=Cov(X,X+Z)=Cov(X,X)+Cov(X,Z)=2+1=3
Cov(Y,Z)=Cov(X+Z,Z)=Cov(X,Z)+Cov(Z,Z)=1+1=2

ความสัมพันธ์กำลังสอง:

Cor(X,Z)2=Cov(X,Z)2Var(X)Var(Z)=122×1=0.5
Cor(X,Y)2=Cov(X,Y)2Var(X)Var(Y)=322×5=0.9
Cor(Y,Z)2=Cov(Y,Z)2Var(Y)Var(Z)=225×1=0.8

จากนั้นในขณะที่และดังนั้นความไม่เท่าเทียมกันของสามเหลี่ยมจึงถูกละเมิดd2(X,Z)=0.5d2(X,Y)=0.1d2(Y,Z)=0.2

Sigma    <- matrix(c(2,1,1,1), nrow=2) # covariance matrix of X and Z
matrixXZ <- mvrnorm(n=1e3, mu=c(0,0), Sigma=Sigma, empirical=TRUE)
X <- matrixXZ[,1] # mean 0, variance 2
Z <- matrixXZ[,2] # mean 0, variance 1
cor(X,Z) # 0.707
Y  <- X + Z
d2 <- function(a,b) {1 - cor(a,b)^2}
d2(X,Y) 
# 0.1
d2(Y,Z)
# 0.2
d2(X,Z)
# 0.5
d2(X,Z) <= d2(X,Y) + d2(Y,Z)
# FALSE

5

ให้เรามีสามเวกเตอร์ (มันอาจจะเป็นตัวแปรหรือบุคคล) ,และZและเรากำหนดมาตรฐานให้กับแต่ละคะแนน z (ค่าเฉลี่ย = 0, ความแปรปรวน = 1)XYZ

จากนั้นตามโคไซน์ทฤษฎีบท ( "กฎแห่งความผาสุก") ยืดระยะทางยุคลิดระหว่างสองเวกเตอร์มาตรฐาน (พูด, X และ Y) ถูก , โดยที่ความคล้ายคลึงกันของโคไซน์คือ Pearsonเนื่องจากมาตรฐานเวกเตอร์ของ z เราอาจละเว้นตัวคูณคงที่อย่างปลอดภัยจากการพิจารณาของเราdXY2=2(n1)(1cosXY)cosXYrXY2(n1)

ดังนั้นระยะทางที่แสดงในคำถามเป็นจะเป็นระยะ euclidean กำลังสองถ้าสูตรไม่สนใจเครื่องหมายของสัมประสิทธิ์สหสัมพันธ์d1(X,Y)=1|Cor(X,Y)|

หากเมทริกซ์ของs เกิดขึ้นเป็น gramian (semidefinite บวก) จากนั้นรากที่สองของระยะทาง "d1" คือระยะทางแบบยุคลิดซึ่งเป็นตัวชี้วัดแน่นอน ด้วยเมทริกซ์ไม่มากของมันมักจะเป็นกรณีหรือใกล้กรณีเมื่อระยะทางไม่ไกลจากการบรรจบกันในพื้นที่ยูคลิด เนื่องจากเมตริกเป็นคลาสที่กว้างกว่าแบบยูคลิดเมทริกซ์ระยะทางที่กำหนด "sqrt (d1)" อาจคาดว่าจะปรากฏตัวชี้วัดบ่อยครั้ง|r||r|

สำหรับ "d1" ต่อ se ซึ่งก็คือ "เหมือน" ระยะทางแบบยุคลิดกำลังสองมันไม่แน่นอน แม้แต่ระยะทางยูคลิดที่แท้จริงกำลังสองไม่ได้เป็นตัวชี้วัด: มันละเมิดบางครั้งหลักการความไม่เท่าเทียมกันของรูปสามเหลี่ยม [ในการวิเคราะห์กลุ่มใช้ระยะทางแบบยุคลิดกำลังสองค่อนข้างบ่อย อย่างไรก็ตามกรณีดังกล่าวส่วนใหญ่บอกเป็นนัยถึงการสร้างการวิเคราะห์ระยะห่างที่ไม่ต้องถามผู้ยกกำลังสองเป็นเพียงอินพุตที่สะดวกสำหรับการคำนวณ] หากต้องการดู (ประมาณ euclidean กำลังสอง ) เราจะวาดเวกเตอร์สามตัวของเราd

ป้อนคำอธิบายรูปภาพที่นี่

เวกเตอร์เป็นหน่วยความยาว (เนื่องจากเป็นมาตรฐาน) โคไซน์ของมุม ( , , ) คือ , ,ตามลำดับ มุมเหล่านี้แพร่กระจายที่สอดคล้องกันระยะทางแบบยุคลิดระหว่างเวกเตอร์: , ,{} สำหรับความเรียบง่ายเวกเตอร์สามตัวล้วนอยู่ในระนาบเดียวกัน (และมุมระหว่างและคือผลรวมของอีกสองตัว ) มันเป็นตำแหน่งที่มีการละเมิดความไม่เท่าเทียมกันของสามเหลี่ยมโดยระยะทางกำลังสองที่โดดเด่นที่สุดαβα+βrXYrXZrYZdXYdXZdYZXZα+β

สำหรับการที่คุณสามารถมองเห็นได้ด้วยตาพื้นที่สี่เหลี่ยมสีเขียว excels ผลรวมของสองสี่เหลี่ยมสีแดง: 2dYZ2>dXY2+dXZ2

ดังนั้นเกี่ยวกับ

d1(X,Y)=1|Cor(X,Y)|

ระยะทางเราบอกได้ว่ามันไม่ได้เป็นตัวชี้วัด เพราะถึงแม้เมื่อ s ทั้งหมดเป็นบวก แต่เดิมระยะทางคือ euclideanซึ่งตัวมันเองไม่ได้เป็นตัวชี้วัดrd2

ระยะทางที่สองเป็นเท่าไหร่?

d2(X,Y)=1(Cor(X,Y))2

ตั้งแต่ความสัมพันธ์ในกรณีของเวกเตอร์มาตรฐานคือ ,เป็น 2 (อันที่จริงมีความถดถอยเชิงเส้นปริมาณซึ่งเป็นสหสัมพันธ์กำลังสองของตัวแปรตามด้วยบางสิ่งบางอย่างorthogonalเพื่อทำนาย) ในกรณีนี้วาดไซน์ของเวกเตอร์และทำให้พวกเขายกกำลังสอง (เพราะเรา กำลังพูดถึงระยะทางซึ่งเป็น ):rcos1r2sin21r2SSerror/SStotalsin2

ป้อนคำอธิบายรูปภาพที่นี่

แม้ว่าจะไม่เห็นได้ชัดทีเดียวสายตาสีเขียวตารางเป็นอีกครั้งที่มีขนาดใหญ่กว่าผลรวมของพื้นที่สีแดง 2sinYZ2sinXY2+sinXZ2

มันสามารถพิสูจน์ได้ บนเครื่องบิน\ ตารางทั้งสองข้างตั้งแต่เรามีความสนใจใน 2sin(α+β)=sinαcosβ+cosαsinβsin2

sin2(α+β)=sin2α(1sin2β)+(1sin2α)sin2β+2sinαcosβcosαsinβ=sin2α+sin2β2[sin2αsin2β]+2[sinαcosαsinβcosβ]

ในนิพจน์สุดท้ายคำสำคัญสองคำจะแสดงเป็นวงเล็บ ถ้าวินาทีที่สองคือ (หรืออาจใหญ่กว่าครั้งแรก)และระยะทาง "d2" ละเมิด อสมการสามเหลี่ยม และในภาพของเราที่ประมาณ 40 องศาและประมาณ 30 องศา (เทอม 1 คือและเทอม 2 คือ) "D2" ไม่ใช่ตัวชี้วัดsin2(α+β)>sin2α+sin2βαβ.1033.2132

รากที่สองของระยะทาง "d2" - ความแตกต่างของไซน์ - เป็นตัวชี้วัด (ฉันเชื่อ) คุณสามารถเล่นกับและ angles ต่าง ๆ ในวงกลมของฉันเพื่อให้แน่ใจ ไม่ว่าจะเป็น "d2" จะแสดงเป็นตัวชี้วัดในการตั้งค่าที่ไม่ใช่ collinear (เช่นสามเวกเตอร์ไม่ได้อยู่บนเครื่องบิน) ด้วย - ฉันไม่สามารถพูดได้ในเวลานี้แม้ว่าฉันจะคิดว่ามันจะไม่แน่นอนαβ


3

ดูเพิ่มเติม preprint นี้ที่ผมเขียน: http://arxiv.org/abs/1208.3145 ฉันยังต้องใช้เวลาและส่งอย่างถูกต้อง นามธรรม:

เราตรวจสอบการแปลงสองชั้นของความเหมือนโคไซน์และความสัมพันธ์ของเพียร์สันและสเปียร์แมนเป็นระยะทางเมตริกโดยใช้เครื่องมือง่าย ๆ ของฟังก์ชั่นการรักษาตัวชี้วัด ชั้นแรกวางวัตถุที่มีความสัมพันธ์กันให้ห่างกันมากที่สุด การแปลงที่รู้จักก่อนหน้านี้อยู่ในคลาสนี้ คลาสที่สองเรียงวัตถุที่สัมพันธ์กันและมีความสัมพันธ์กัน ตัวอย่างของการแปลงดังกล่าวที่ให้ระยะทางเมทริกคือฟังก์ชันไซน์เมื่อใช้กับข้อมูลกึ่งกลาง

ผลที่สุดสำหรับคำถามของคุณคือd1 , d2ไม่ใช่ตัวชี้วัดและจริง ๆ แล้วสแควร์รูทของd2นั้นเป็นตัวชี้วัดที่เหมาะสม


2

เลขที่

ตัวอย่างเคาน์เตอร์ที่ง่ายที่สุด:

สำหรับระยะทางที่ไม่ได้กำหนดไว้ในทุกสิ่งที่คุณคือYX=(0,0)Y

อนุกรมคงที่ใด ๆ ที่มีค่าเบี่ยงเบนมาตรฐานและทำให้เกิดการหารด้วยศูนย์ในคำจำกัดความของ ...C o rσ=0Cor

ส่วนใหญ่มันเป็นตัวชี้วัดในส่วนย่อยของพื้นที่ข้อมูลไม่รวมชุดคงที่ใด ๆ


จุดดี! ฉันต้องพูดถึงสิ่งนี้ในการพิมพ์ล่วงหน้าที่กล่าวถึงที่อื่น
micans
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.