เรารู้ว่า Jaccard (คำนวณระหว่างสองคอลัมน์ของข้อมูลไบนารี ) คือขณะที่ Rogers-Tanimoto คือโดยที่Xaa + b + ca + da + d+ 2 ( b + c )
- a - จำนวนแถวที่ทั้งสองคอลัมน์เป็น 1
- b - จำนวนแถวโดยที่ไม่ใช่คอลัมน์อื่นคือ 1
- c - จำนวนแถวที่อื่น ๆ และไม่ใช่คอลัมน์นี้คือ 1
- d - จำนวนแถวที่ทั้งสองคอลัมน์เป็น 0
a + b + c + d= n , จำนวนแถวในX
จากนั้นเรามี:
X′X=Aคือเมทริกซ์สมมาตรแบบจัตุรัสของระหว่างคอลัมน์ทั้งหมดa
(notX)′(notX)=Dคือเมทริกซ์จตุรัสสมมาตรของระหว่างคอลัมน์ทั้งหมด ("ไม่ใช่ X" กำลังแปลง 1-> 0 และ 0-> 1 ใน X)d
ดังนั้นคือเมทริกซ์สมมาตรแบบสี่เหลี่ยมจัตุรัสของ Jaccard ระหว่างคอลัมน์ทั้งหมดAn−D
A+DA+D+2(n−(A+D))=A+D2n−A−Dเป็นเมทริกซ์สมมาตรแบบสมมาตรของ Rogers-Tanimoto ระหว่างคอลัมน์ทั้งหมด
ฉันตรวจสอบตัวเลขถ้าสูตรเหล่านี้ให้ผลลัพธ์ที่ถูกต้อง พวกเขาทำ.
UPD นอกจากนี้คุณยังสามารถรับเมทริกซ์และ :BC
B=[1]′X−Aที่ไหน "[1]" หมายถึงเมทริกซ์ของคนขนาดเป็นX คือเมทริกซ์จตุรัสไม่สมมาตรของระหว่างคอลัมน์ทั้งหมด; องค์ประกอบของIJเป็นจำนวนแถวในด้วย 0 ในคอลัมน์ฉันและ 1 ในคอลัมน์JXBbX
ดังนั้นB'C=B′
เมทริกซ์ยังสามารถคำนวณด้วยวิธีนี้ของหลักสูตร:-ABCDn−A−B−C
การรู้เมทริกซ์ , คุณสามารถคำนวณเมทริกซ์ของสัมประสิทธิ์ความคล้ายคลึงกันของคู่ (dis) ใด ๆ ที่คิดค้นขึ้นสำหรับข้อมูลไบนารีA,B,C,D
vegan
แพ็คเกจแล้ว ฉันคิดว่าพวกเขามีแนวโน้มที่จะได้รับการปรับให้เหมาะสมกับความเร็วด้วย