การวิเคราะห์ความสัมพันธ์ของ Canonical ที่มีสหสัมพันธ์อันดับ


15

การวิเคราะห์ความสัมพันธ์ของ Canonical (CCA) มีจุดมุ่งหมายเพื่อเพิ่มความสัมพันธ์ของเพียร์สันในช่วงเวลาปกติ (เช่นค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้น) ของการรวมกันเชิงเส้นของชุดข้อมูลทั้งสอง

ตอนนี้ให้พิจารณาความจริงที่ว่าสัมประสิทธิ์สหสัมพันธ์นี้วัดได้เพียงการเชื่อมโยงเชิงเส้นเท่านั้น - นี่คือเหตุผลที่เราใช้เช่น Spearman-หรือ Kendall-ρτ (อันดับ) สัมประสิทธิ์สหสัมพันธ์ การเชื่อมต่อระหว่างตัวแปร

ดังนั้นฉันคิดต่อไปนี้: ข้อ จำกัด หนึ่งของ CCA คือพยายามจับความสัมพันธ์เชิงเส้นระหว่างชุดค่าผสมเชิงเส้นที่เกิดขึ้นเนื่องจากฟังก์ชันวัตถุประสงค์เท่านั้น เป็นไปได้ไหมที่จะขยาย CCA ในบางแง่มุมโดยการเพิ่มพูด Spearman- แทน Pearson-ρ ?r

ขั้นตอนดังกล่าวจะนำไปสู่สิ่งที่ตีความและมีความหมายทางสถิติหรือไม่ (มันสมเหตุสมผลหรือไม่ - ตัวอย่างเช่น - เพื่อดำเนินการ CCA ในอันดับ ... ?) ฉันสงสัยว่ามันจะช่วยได้เมื่อเราจัดการกับข้อมูลที่ไม่ปกติหรือไม่ ...


4
จะOVERALS - การวิเคราะห์เชิงเส้นที่ยอมรับที่ดีที่สุดเครื่องชั่งน้ำหนัก (แปลง monotonically) ตัวแปรเพื่อเพิ่มความสัมพันธ์ที่ยอมรับ - เป็นที่ชื่นชอบของคุณหรือไม่
ttnphns

@ttnphns: ขอบคุณสำหรับความคิดฉันไม่เคยได้ยินมาก่อนและดูน่าสนใจจริงๆ! อย่างไรก็ตามฉันไม่คิดว่ามันจะพูดถึงประเด็น: เท่าที่ฉันเข้าใจมันเป็นการผสมผสานระหว่างการปรับขนาดที่ดีที่สุดและ CCA - แต่การปรับขนาดที่เหมาะสมนั้นเหมาะสมที่สุดสำหรับตัวแปรเชิงหมวดหมู่เท่านั้น ดูเหมือนจะไม่เปลี่ยนแปลงมากนักสำหรับตัวแปรต่อเนื่องที่วัดตามอัตราส่วนอัตราส่วน (ซึ่งฉันมีในใจ!) แต่ถูกต้องฉันถ้าฉันผิด
Tamas Ferenci

1
@ttnphns: ในทำนองเดียวกันบางครั้งคุณก็ใช้ความสัมพันธ์ Spearman กับตัวแปรต่อเนื่อง! (แน่นอนมันจัดการกับข้อมูลที่เป็นลำดับ ... แต่เรา neverthless ใช้ในตัวแปรอย่างต่อเนื่องแน่นอนที่จะอธิบายลักษณะเดียวทั่วไป (และไม่เชิงเส้นเท่านั้น) ความสัมพันธ์ระหว่างตัวแปร.) นั่นเป็นเหตุผลที่ผมคิดว่าเรื่องนี้จะทำให้ความรู้สึกภายใน CCA ได้เป็นอย่างดี ...
Tamas Ferenci

@Glen_b คุณพูดถูก แน่นอนว่าสหสัมพันธ์อันดับนั้นมีไว้สำหรับความน่าเบื่อหน่ายใด ๆ ไม่ว่าจะเป็นข้อมูลเชิงลำดับหรือต่อเนื่อง ฉันประหลาดใจมากที่ความคิดเห็นของฉันเองด้านบนว่าฉันลบมัน
ttnphns

คุณสามารถลองใช้ Kernel CCA ซึ่งเฉพาะเมื่อใช้กับฟังก์ชั่นพื้นฐานตามแนวรัศมีช่วยให้เราสามารถฉายข้อมูลลงในพื้นที่ย่อยมิติที่ไม่มีที่สิ้นสุด
roni

คำตอบ:


6

ฉันใช้การขยายคิวบ์แบบ จำกัด เมื่อคำนวณตัวแปรที่บัญญัติ คุณกำลังเพิ่มฟังก์ชั่นพื้นฐานแบบไม่เชิงเส้นในการวิเคราะห์เหมือนกับที่คุณจะเพิ่มคุณสมบัติใหม่ ซึ่งส่งผลในการวิเคราะห์องค์ประกอบหลักที่ไม่เชิงเส้น ดูฟังก์ชันของHmiscแพ็คเกจ R transcanสำหรับตัวอย่าง homalsแพ็คเกจ R ใช้เวลานานกว่านี้มาก


1
ขอขอบคุณ! วิธีที่อธิบายไว้ใน homals เป็นนวนิยายสำหรับฉัน แต่น่าสนใจอย่างแน่นอน
Tamas Ferenci

4

วิธีมาตรฐานของ CCA ทำงานร่วมกับเมทริกซ์สัมประสิทธิ์สหสัมพันธ์ของผลิตภัณฑ์ สำหรับ mgnitude CC ที่ใหญ่ที่สุดมันสร้างสองตัวแปรคอมโพสิต z1 (n) และ z2 (n) โดยการรวมกันเชิงเส้นของสอง matixes (กับ n แถวและตัวแปร m1 และ m2) ซึ่ง abs (correlation (z1, z2)) จะถูกขยายให้ใหญ่สุด ฟังก์ชั่นวัตถุประสงค์นี้อาจถูกขยายให้ใหญ่ที่สุดโดยตรงแม้ว่าความสัมพันธ์ (z1, z2) ไม่ใช่ช่วงเวลาของผลิตภัณฑ์ แต่กำหนดไว้แตกต่างกัน

Mishra, SK (2009) "หมายเหตุเกี่ยวกับการวิเคราะห์ความสัมพันธ์ตามแบบบัญญัติสามัญของคะแนนสองชุด"

http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.