นี่เป็นวิธีการสามแบบที่แตกต่างกันและไม่มีใครสามารถมองว่าเป็นกรณีพิเศษของวิธีอื่น
อย่างเป็นทางการถ้าชุดข้อมูลและYเป็นตัวทำนายกึ่งกลาง ( n × p ) และชุดคำตอบ ( n × q ) และถ้าเรามองหาคู่แรกของแกนw ∈ R pสำหรับXและv ∈ R qสำหรับYดังนั้นวิธีการเหล่านี้ เพิ่มปริมาณต่อไปนี้:XYn×pn×qw∈RpXv∈RqY
P C A :R R R :P L S :C C A :var( X w )var( X w ) ⋅Corr2( X w , Y v ) ⋅ Var( Y v )var( X w ) ⋅ Corr2( X w , Y v ) ⋅ Var( Y v ) = Cov2(Xw,Yv)Var(Xw)⋅Corr2(Xw,Yv)
(ฉันเพิ่มการวิเคราะห์ความสัมพันธ์แบบบัญญัติ (CCA) ในรายการนี้)
ฉันสงสัยว่าความสับสนอาจเป็นเพราะใน SAS ทั้งสามวิธีนั้นดูเหมือนว่าจะมีการใช้งานผ่านฟังก์ชั่นเดียวกันPROC PLS
กับพารามิเตอร์ที่แตกต่างกัน ดังนั้นจึงอาจดูเหมือนว่าทั้งสามวิธีเป็นกรณีพิเศษของ PLS เพราะนั่นคือวิธีการตั้งชื่อฟังก์ชั่น SAS อย่างไรก็ตามนี่เป็นเพียงการตั้งชื่อที่โชคร้าย ในความเป็นจริง PLS, RRR และ PCR สามวิธีที่แตกต่างกันที่เพิ่งเกิดขึ้นที่จะดำเนินการใน SAS PLS
ในหนึ่งฟังก์ชั่นที่มีเหตุผลบางอย่างที่เรียกว่า
บทเรียนทั้งสองที่คุณเชื่อมโยงนั้นชัดเจนมากเกี่ยวกับเรื่องนั้น หน้า 6 ของบทช่วยสอนการนำเสนอระบุวัตถุประสงค์ของทั้งสามวิธีและไม่ได้บอกว่า PLS "กลายเป็น" RRR หรือ PCR ตรงกันข้ามกับสิ่งที่คุณอ้างในคำถามของคุณ ในทำนองเดียวกันเอกสาร SAS อธิบายว่าสามวิธีแตกต่างกันโดยให้สูตรและปรีชา:
[P] การถดถอยส่วนประกอบ rincipal เลือกปัจจัยที่อธิบายความแปรปรวนของตัวทำนายมากที่สุดลดการถดถอยอันดับเลือกปัจจัยที่อธิบายความแปรปรวนของการตอบสนองมากที่สุดเท่าที่จะเป็นไปได้และบางส่วนกำลังสองน้อยที่สุดสมดุลทั้งสองวัตถุประสงค์ .
x1x2YXYX
หนึ่งสามารถเพิ่มบทลงโทษริดจ์ใน RRR ฟังก์ชั่นที่หายไปรับริดจ์ลดอันดับการถดถอยหรือ RRRR สิ่งนี้จะดึงแกนการถดถอยไปยังทิศทาง PC1 ซึ่งคล้ายกับสิ่งที่ PLS กำลังทำอยู่ อย่างไรก็ตามฟังก์ชั่นต้นทุนสำหรับ RRRR ไม่สามารถเขียนในรูปแบบ PLS ดังนั้นจึงยังคงแตกต่างกัน
Y