ฉันมีสามคุณสมบัติที่ฉันใช้เพื่อแก้ไขปัญหาการจัดหมวดหมู่ แต่เดิมคุณสมบัติเหล่านี้สร้างค่าบูลีนดังนั้นฉันสามารถประเมินความซ้ำซ้อนของพวกเขาได้โดยดูว่าชุดของการจำแนกประเภทที่เป็นบวกและลบนั้นทับซ้อนกันมากแค่ไหน ตอนนี้ฉันได้ขยายคุณสมบัติเพื่อสร้างมูลค่าที่แท้จริง (คะแนน) แทนและฉันต้องการวิเคราะห์ความซ้ำซ้อนของพวกเขาอีกครั้ง แต่ฉันรู้สึกสูญเสียอย่างสิ้นเชิงกับวิธีการทำเช่นนั้น ทุกคนสามารถให้ตัวชี้หรือแนวคิดเกี่ยวกับวิธีการเกี่ยวกับสิ่งนั้นให้ฉันได้หรือไม่
ฉันรู้ว่าคำถามนี้คลุมเครือมากนั่นเป็นเพราะฉันไม่มีความเข้าใจในสถิติอย่างชัดเจน ดังนั้นหากคุณไม่มีคำตอบให้ฉันบางทีคุณอาจมีคำถามที่ช่วยให้ฉันเข้าใจตัวเองดีขึ้น
แก้ไข:ขณะนี้ฉันกำลังสืบค้น Wikipedia ในเรื่องนี้ฉันรู้สึกว่าสิ่งที่ฉันต้องการคือสัมประสิทธิ์สหสัมพันธ์ แต่ฉันยังไม่แน่ใจว่านี่เป็นวิธีการที่ถูกต้องหรือไม่และสัมประสิทธิ์ใดที่เหมาะสม
แก้ไข 2:ในกรณีบูลีนฉันสร้างครั้งแรกสำหรับแต่ละคุณสมบัติชุดตัวอย่างที่เป็นจริง จากนั้นความสัมพันธ์ระหว่างสองคุณลักษณะคือขนาดของการตัดกันของเซตเหล่านี้มากกว่าขนาดของการรวมกันของเซตเหล่านี้ หากค่านี้เป็น 1 พวกเขาจะซ้ำซ้อนอย่างสมบูรณ์เพราะเหมือนกันเสมอ ถ้าเป็น 0 พวกมันจะไม่เหมือนเดิม