ระยะห่างของโกเวอร์คำนวณความแตกต่างระหว่างตัวแปรไบนารีอย่างไร


13

ฉันมี 17 ตัวเลขและ 5 ไบนารี (0-1) ตัวแปรโดยมี 73 ตัวอย่างในชุดข้อมูลของฉัน ฉันต้องการเรียกใช้การวิเคราะห์คลัสเตอร์ ฉันรู้ว่าระยะทางของโกเวอร์เป็นตัวชี้วัดที่ดีสำหรับชุดข้อมูลที่มีตัวแปรแบบผสม อย่างไรก็ตามฉันไม่เข้าใจว่าระยะทางของโกเวอร์คำนวณความแตกต่างระหว่างตัวแปรไบนารีได้อย่างไร สำหรับฉันดูเหมือนว่ามันไม่แตกต่างจากระยะทางแบบยุคลิด


คำถามของคุณยังไม่ชัดเจน คุณเพียงแค่ถามว่า 'ระยะทางโกเวอร์คำนวณความแตกต่างระหว่างตัวแปรไบนารี' อย่างไร "ไม่มีความแตกต่างจากแบบยุคลิด" หมายความว่าอะไร?
gung - Reinstate Monica

1
ขอบคุณ. ขออภัยฉันถามว่า Gower คำนวณความแตกต่างระหว่างตัวแปรไบนารีได้อย่างไร ฉันหมายถึงฉันไม่เข้าใจความแตกต่าง btw Euclidean และ Gower สำหรับตัวแปรไบนารี
Emrah Bilgiç

คุณค้นหาเว็บไซต์นี้เพื่อGower? stats.stackexchange.com/a/15313/3277
ttnphns

ใช่ฉันทำ. ระยะทางแบบยุคลิดคือ 0, ถ้าทั้งสองตัวอย่างมีค่าเท่ากัน, 1 ถ้าไม่ใช่ แล้วโกเวอร์ล่ะ
Emrah Bilgiç

4
@ EmrahBilgiç, Gower metric มีความคล้ายคลึงกันไม่ใช่ระยะทาง มันจะกลายเป็น "ระยะทาง" เมื่อถูกลบออกจาก 1 อ่านภายใต้ลิงก์ด้านบนวิธีการประมวลผลข้อมูลไบนารี
ttnphns

คำตอบ:


5

วิธีการเกี่ยวกับคุณลักษณะไบนารีที่มีค่า "m" และ "f" สำหรับ "ชาย" และ "หญิง"?

คุณตระหนักดีว่าสำหรับตัวแปร dicotomous ทั้งหมดที่คุณสามารถทำได้คือ "เหมือนกัน" หรือ "แตกต่าง" จุดแตกต่างที่สำคัญระหว่างระยะทางไม่ได้หากค่าเป็น 1 หรือ 0 แต่จะรวมตัวแปรหลายตัวเข้าด้วยกันได้อย่างไร


3

ระยะทางโกเวอร์ใช้แมนฮัตตันในการคำนวณระยะห่างระหว่างดาต้าพอยน์ต่อเนื่องและลูกเต๋าสำหรับการคำนวณระยะห่างระหว่างดาต้าพอยน์ตามหมวดหมู่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.