CCA ระหว่างสองชุดข้อมูลที่เหมือนกันเทียบเท่ากับ PCA ในชุดข้อมูลนี้หรือไม่


9

การอ่านวิกิพีเดียเกี่ยวกับการวิเคราะห์สหสัมพันธ์แคนนอน (CCA) สำหรับเวกเตอร์สุ่มสองตัวและYฉันสงสัยว่าองค์ประกอบหลัก anslysis (PCA) เหมือนกับ CCA เมื่อX = Yหรือไม่XYX=Y


โปรดทำให้ชัดเจนยิ่งขึ้น: 1) vectors X and Yนั่นคือตัวแปรสองตัว (คอลัมน์ข้อมูล) หรือสองกรณี (แถว); เนื่องจากเราจะทำการวิเคราะห์ตัวแปร 2) X and Y are the sameคุณต้องการที่จะบอกว่า X = Y หรือวิธีอื่น ๆ รอบ?
ttnphns

@ttnphns: 1) XและYเป็นสองเวกเตอร์แบบสุ่ม เป็นตัวแปรสุ่มสองเวกเตอร์คอลัมน์ข้อมูลสองชุดไม่ใช่สองกรณี (แถว) 2) X=Y Y
ทิม

หากแต่ละชุดประกอบด้วยตัวแปรเดียวก็จะมีค่าสหสัมพันธ์ที่ยอมรับกันซึ่งเป็นเพียร์สันอาร์ระหว่างค่าเหล่านั้น และ CCA จะถดถอยเชิงเส้นของ X โดย Y และในทางกลับกัน การสลายตัวของrโดยวิธี PCA เป็นอีกเรื่องหนึ่ง PCA และ CCA เป็นการวิเคราะห์ที่แตกต่างกัน
ttnphns

สวัสดี @Tim ฉันสงสัยว่าคำตอบของฉันมีประโยชน์หรือไม่ถ้าคุณยังอาจมีคำถามเพิ่มเติม ถ้าเป็นเช่นนั้นฉันยินดีที่จะชี้แจง
อะมีบา

@ amoeba: ใช่มันเป็น ฉันไม่มีคำถามเพิ่มเติมและจะอ่านคำตอบของคุณในภายหลัง ขอบคุณสำหรับคำตอบของคุณ + 1
Tim

คำตอบ:


6

ให้เป็นและเป็นเมทริกซ์ข้อมูลแทนสองชุดข้อมูลพร้อมตัวอย่าง (เช่นการสังเกตของเวกเตอร์แถวสุ่มของคุณและ ) ในแต่ละชุดXn×p1Yn×p2nXY

CCA ค้นหาการรวมกันเชิงเส้นของตัวแปรในและการรวมกันเชิงเส้นของตัวแปรในเพื่อให้พวกเขามีความสัมพันธ์กันมากที่สุดระหว่างกัน จากนั้นจะค้นหาคู่ถัดไปภายใต้ข้อ จำกัด ที่ไม่มีสหสัมพันธ์กับคู่แรก เป็นต้นp1Xp2Y

ในกรณีที่ (และ ) ชุดค่าผสมเชิงเส้นใด ๆ ในชุดข้อมูลหนึ่งจะมีความสัมพันธ์โดยมีชุดค่าเชิงเส้นเดียวกันในชุดข้อมูลอื่น ดังนั้นคู่ CCA ทั้งหมดจะมีสหสัมพันธ์และลำดับของคู่นั้นโดยพลการ ข้อ จำกัด ที่เหลืออยู่เพียงอย่างเดียวคือการรวมกันเชิงเส้นควรไม่เกี่ยวข้องกัน มีจำนวนอนันต์ของวิธีการที่จะเลือกเป็นผลรวมเชิงเส้น uncorrelated (ทราบว่าน้ำหนักไม่ได้จะต้องมีฉากในพื้นที่มิติ) และใด ๆ ของพวกเขาจะแก้ปัญหาการผลิต CCA ที่ถูกต้อง วิธีหนึ่งดังกล่าวได้รับจาก PCA อย่างแน่นอนเนื่องจากพีซีสองเครื่องใดก็ตามมีความสัมพันธ์เป็นศูนย์X=Yp1=p2=p11pp

ดังนั้นโซลูชัน PCA จะเป็นโซลูชัน CCA ที่ถูกต้อง แต่มีจำนวน CCA ที่ดีไม่แพ้กันในกรณีนี้


ศาสตร์ CCA ค้นหาทางขวา ( ) และ ( ) เวกเตอร์เอกพจน์ของ , ซึ่งในกรณีนี้เท่ากับ , กับเวกเตอร์ใด ๆ ที่เป็นไอเกนเวกเตอร์ ดังนั้นสามารถเป็นอะไรก็ได้ มะเร็งท่อน้ำดีนั้นรับน้ำหนักรวมกันเป็นเส้นตรงและข ในกรณีนี้มันเดือดลงไปถ่ายเป็นประจำโดยพลการและเปลี่ยนมันด้วยซึ่งแน่นอนจะผลิตทิศทาง uncorrelatedabCXX1/2CXYCYY1/2Ia=bCXX1/2aCYY1/2bCXX1/2

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.