ฉันจะแปลงระยะทาง (ยูคลิดแดน) เป็นคะแนนความคล้ายคลึงกันได้อย่างไร


13

ฉันใช้หมายถึงการรวมกลุ่มเป็นเสียงของกลุ่มลำโพง เมื่อฉันเปรียบเทียบคำพูดกับข้อมูลลำโพงแบบคลัสเตอร์ฉันจะได้รับความผิดเพี้ยนเฉลี่ย (อิงตามปริภูมิแบบยุคลิด) ระยะนี้อาจจะอยู่ในช่วงinfty] ฉันต้องการแปลงระยะทางนี้เป็นคะแนนความเหมือนโปรดแนะนำฉันเกี่ยวกับวิธีที่ฉันสามารถบรรลุสิ่งนี้[ 0 , ] [ 0 , 1 ]k[0,][0,1]

คำตอบ:


16

หากหมายถึงระยะทางยุคลิดจากจุดไปยังจุด ,p 1 p 2d(p1,p2)p1p2

11+d(p1,p2)

ที่ใช้กันทั่วไป


โปรดแก้ไขให้ฉันถ้าฉันผิดถ้าเรามีและโดยที่แต่ละและ เป็นมิติ . จากนั้นเราสามารถกำหนดความคล้ายคลึงกันเช่น Y)} Y = ( Y 1 , Y 2 , Y 3 , . . . , Y n ) x Y D S ฉันm ฉันลิตรR ฉันทีy = 1X=(x1,x2,x3,...,xt)Y=(Y1,Y2,Y3,...,Yn)xyD
Similarity=1ti=1t11+minDistance(xi,Y)
มูฮัมหมัด

ฉันเข้าใจว่าเครื่องหมายบวก 1 ในตัวหารคือการหลีกเลี่ยงการหารด้วยข้อผิดพลาดศูนย์ แต่ฉันได้พบว่าค่าบวกหนึ่งค่ามีผลต่อค่า d (p1, p2) ที่มีค่ามากกว่า 1 และลดคะแนนความคล้ายคลึงกันในที่สุด มีวิธีอื่นในการทำเช่นนี้หรือไม่? อาจเป็น s = 1-d (p1, p2)
aamir23

9

คุณสามารถใช้: ซึ่งเป็นฟังก์ชั่นระยะที่คุณต้องการ1edistdist


คุณช่วยกรุณาให้หนังสืออ้างอิง / เอกสารที่เกี่ยวข้องกับสมการนี้ที่คุณพบมันได้หรือไม่? @Dougal
Justlife

@AnimeshKumarPaul ฉันไม่ได้เขียนคำตอบนี้เพียงปรับปรุงการจัดรูปแบบของมัน แต่มันถูกใช้งานบ่อยๆเป็นเวอร์ชั่นของ "เคอร์เนล RBF ทั่วไป"; เห็นเช่นที่นี่ คำถามนั้นเกี่ยวกับว่าผลลัพธ์เป็นเคอร์เนลที่แน่นอนบวกหรือไม่ หากคุณไม่สนใจสิ่งนั้นอย่างน้อยก็เป็นไปตามความคิดที่เข้าใจง่ายของความคล้ายคลึงกันว่าจุดที่อยู่ไกลกว่านั้นมีความคล้ายคลึงกันน้อยกว่า
Dougal

@Justlife: Google สำหรับ "สารานุกรมของระยะทาง" และเลือกผลลัพธ์ด้วยเอกสาร PDF
ข้อยกเว้นที่ไม่สามารถจัดการได้

7

ดูเหมือนว่าคุณต้องการบางสิ่งที่คล้ายกับความเหมือนโคไซน์ซึ่งเป็นคะแนนความคล้ายคลึงในช่วงหน่วยการเรียนรู้ ในความเป็นจริงความสัมพันธ์โดยตรงระหว่างระยะทางแบบยุคลิดกับความคล้ายคลึงของโคไซน์นั้นมีอยู่จริง!

||xx||2=(xx)T(xx)=||x||+||x||2||xx||.

f(x,x)=xTx||x||||x||=cos(θ)
θxx

||x||=||x||=1,

||xx||2=2(1f(x,x))
f(x,x)=xTx,

ดังนั้น

1||xx||22=f(x,x)=cos(θ)

จากมุมมองการคำนวณมันอาจมีประสิทธิภาพมากกว่าที่จะคำนวณโคไซน์แทนระยะทางแบบยุคลิดแล้วทำการแปลง


3

เคอร์เนลเกาส์เซียเป็นอย่างไร?

K(x,x)=exp(xx22σ2)

ระยะทางถูกใช้ในเลขชี้กำลัง ค่าเคอร์เนลอยู่ในช่วง1] มีปรับพารามิเตอร์หนึ่ง\โดยทั่วไปหากสูงจะใกล้เคียงกับ 1 สำหรับใด ๆ หากอยู่ในระดับต่ำระยะห่างเล็กน้อยจากถึงจะทำให้อยู่ใกล้กับ 0[ 0 , 1 ] σ σ K ( x , x ' ) x , x ' σ x x ' K ( x , x ' )xx[0,1]σσK(x,x)x,xσxxK(x,x)


1
โปรดทราบว่าคำตอบนี้และ@ Unhandled exceptionมีความสัมพันธ์กันมาก: นี่คือโดยที่หนึ่ง [แนะนำการปรับสัดส่วน] คือ , เคอร์เนลแบบเกาส์ที่มีเป็นตัวชี้วัด นี้จะยังคงเป็นเคอร์เนลที่ถูกต้องแม้ว่า OP ไม่จำเป็นต้องสนใจ exp ( - γ d ( x , x ) ) exp(γd(x,x)2)exp(γd(x,x))d
Dougal

0

หากคุณใช้การวัดระยะทางที่เป็นธรรมชาติระหว่าง 0 และ 1 เช่นระยะทาง Hellinger จากนั้นคุณสามารถใช้ 1 - ระยะทางเพื่อให้ได้ความเหมือนกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.