ฉันต้องการลดมิติของระบบการสั่งซื้อที่สูงขึ้นและจับความแปรปรวนส่วนใหญ่ในฟิลด์ 2 มิติหรือ 1 มิติ ฉันเข้าใจว่าสามารถทำได้ผ่านการวิเคราะห์องค์ประกอบหลักและฉันใช้ PCA ในหลาย ๆ สถานการณ์ อย่างไรก็ตามฉันไม่เคยใช้กับชนิดข้อมูลบูลีนและฉันสงสัยว่ามันมีความหมายที่จะทำ PCA กับชุดนี้หรือไม่ ตัวอย่างเช่นสมมติว่าฉันมีตัวชี้วัดเชิงคุณภาพหรือเชิงพรรณนาและฉันกำหนด "1" หากการวัดนั้นใช้ได้สำหรับมิตินั้นและ "0" หากไม่ใช่ (ข้อมูลไบนารี) ตัวอย่างเช่นสมมติว่าคุณกำลังพยายามเปรียบเทียบคนแคระทั้งเจ็ดในสโนว์ไวท์ เรามี:
Doc, Dopey, Bashful, Grumpy, Sneezy, Sleepy และ Happy และคุณต้องการจัดเรียงตามคุณสมบัติและทำตามที่:
ดังนั้นตัวอย่างเช่น Bashful แลคโตสทนไม่ได้และไม่ได้อยู่ในม้วนเกียรติ นี่คือเมทริกซ์สมมุติอย่างหมดจดและเมทริกซ์จริงของฉันจะมีคอลัมน์อธิบายอีกมากมาย คำถามของฉันคือมันจะยังคงเหมาะสมที่จะทำ PCA ในเมทริกซ์นี้เป็นวิธีการค้นหาความคล้ายคลึงกันระหว่างบุคคล?
a means of finding the similarity between individuals
. แต่งานนี้มีไว้สำหรับการวิเคราะห์กลุ่มไม่ใช่ PCA