การเชื่อมต่อระหว่างกำลังสองน้อยที่สุดบางส่วนการถดถอยอันดับลดลงและการถดถอยองค์ประกอบหลักคืออะไร


16

การถดถอยอันดับที่ลดลงและการถดถอยส่วนประกอบหลักเป็นเพียงกรณีพิเศษที่มีกำลังสองน้อยที่สุดหรือไม่?

บทช่วยสอนนี้ (หน้า 6, "การเปรียบเทียบวัตถุประสงค์") ระบุว่าเมื่อเราทำบางส่วนกำลังสองน้อยที่สุดโดยไม่ต้องฉาย X หรือ Y (เช่น "ไม่ใช่บางส่วน") มันจะกลายเป็นการลดอันดับการถดถอยหรือการถดถอยองค์ประกอบหลักตามลำดับ

ข้อความที่คล้ายกันนี้จัดทำขึ้นในหน้าเอกสารของ SAS นี้หัวข้อ "การลดอันดับการถดถอย" และ "ความสัมพันธ์ระหว่างวิธีการ"

คำถามติดตามพื้นฐานที่สำคัญกว่าคือมีแบบจำลองความน่าจะเป็นพื้นฐานที่คล้ายคลึงกันหรือไม่


นี่เป็นปัญหาที่สำคัญจริงๆ
Steve

@ Steve ขอบคุณ ดูความคิดเห็นของฉันด้านบนสำหรับการแนะนำรายละเอียดเพิ่มเติม
Minkov

คำตอบ:


15

นี่เป็นวิธีการสามแบบที่แตกต่างกันและไม่มีใครสามารถมองว่าเป็นกรณีพิเศษของวิธีอื่น

อย่างเป็นทางการถ้าชุดข้อมูลและYเป็นตัวทำนายกึ่งกลาง ( n × p ) และชุดคำตอบ ( n × q ) และถ้าเรามองหาคู่แรกของแกนwR pสำหรับXและvR qสำหรับYดังนั้นวิธีการเหล่านี้ เพิ่มปริมาณต่อไปนี้:XYn×pn×qwRpXvRqY

PCA:Var(Xw)RRR:Var(Xw)Corr2(Xw,Yv)Var(Yv)PLS:Var(Xw)Corr2(Xw,Yv)Var(Yv)=Cov2(Xw,Yv)CCA:Var(Xw)Corr2(Xw,Yv)

(ฉันเพิ่มการวิเคราะห์ความสัมพันธ์แบบบัญญัติ (CCA) ในรายการนี้)


ฉันสงสัยว่าความสับสนอาจเป็นเพราะใน SAS ทั้งสามวิธีนั้นดูเหมือนว่าจะมีการใช้งานผ่านฟังก์ชั่นเดียวกันPROC PLSกับพารามิเตอร์ที่แตกต่างกัน ดังนั้นจึงอาจดูเหมือนว่าทั้งสามวิธีเป็นกรณีพิเศษของ PLS เพราะนั่นคือวิธีการตั้งชื่อฟังก์ชั่น SAS อย่างไรก็ตามนี่เป็นเพียงการตั้งชื่อที่โชคร้าย ในความเป็นจริง PLS, RRR และ PCR สามวิธีที่แตกต่างกันที่เพิ่งเกิดขึ้นที่จะดำเนินการใน SAS PLSในหนึ่งฟังก์ชั่นที่มีเหตุผลบางอย่างที่เรียกว่า

บทเรียนทั้งสองที่คุณเชื่อมโยงนั้นชัดเจนมากเกี่ยวกับเรื่องนั้น หน้า 6 ของบทช่วยสอนการนำเสนอระบุวัตถุประสงค์ของทั้งสามวิธีและไม่ได้บอกว่า PLS "กลายเป็น" RRR หรือ PCR ตรงกันข้ามกับสิ่งที่คุณอ้างในคำถามของคุณ ในทำนองเดียวกันเอกสาร SAS อธิบายว่าสามวิธีแตกต่างกันโดยให้สูตรและปรีชา:

[P] การถดถอยส่วนประกอบ rincipal เลือกปัจจัยที่อธิบายความแปรปรวนของตัวทำนายมากที่สุดลดการถดถอยอันดับเลือกปัจจัยที่อธิบายความแปรปรวนของการตอบสนองมากที่สุดเท่าที่จะเป็นไปได้และบางส่วนกำลังสองน้อยที่สุดสมดุลทั้งสองวัตถุประสงค์ .

x1x2YXYX

PCR, PLS, RRR

หนึ่งสามารถเพิ่มบทลงโทษริดจ์ใน RRR ฟังก์ชั่นที่หายไปรับริดจ์ลดอันดับการถดถอยหรือ RRRR สิ่งนี้จะดึงแกนการถดถอยไปยังทิศทาง PC1 ซึ่งคล้ายกับสิ่งที่ PLS กำลังทำอยู่ อย่างไรก็ตามฟังก์ชั่นต้นทุนสำหรับ RRRR ไม่สามารถเขียนในรูปแบบ PLS ดังนั้นจึงยังคงแตกต่างกัน

Y


4
ตารางท้ายสุดมีประโยชน์มาก จากตารางนั้นอาจพิจารณา PCA, RRR และ CCA เป็น "กรณีพิเศษ" ของ PLS หากคุณคิดว่าจักรยานและ unicycles เป็นกรณีพิเศษของรถสามล้อ ฉันไม่คิดว่าจะเป็นอย่างนั้น
EdM

2
@EdM ฉันคิดว่าเราสามารถพูดได้ว่าวิธีการเหล่านี้ทั้งหมดเป็นกรณีพิเศษของวิธีการรวมกันบางอย่างที่ไม่มีชื่อจริง ๆ (แต่มีใครสามารถประดิษฐ์มันได้!) แต่ชื่อ "PLS" มีความหมายที่สร้างไว้แล้วและความหมายนี้ไม่รวมถึงเทคนิคอื่นใดเหล่านี้
อะมีบาพูดว่า Reinstate Monica

1
และขอบคุณ! ฉันตัดสินใจในขณะนี้ที่จะย้ายตารางเพื่อจุดเริ่มต้นของคำตอบ :)
อะมีบากล่าวว่าคืนสถานะโมนิกา

2
XYVaR(XW)αโอRR(XW,Yโวลต์)βVaR(Yโวลต์)γ
อะมีบาพูดว่า Reinstate Monica

1
@Moskowitz: โดยทั่วไปเมื่อผู้คนพูดถึงวิธีการ A เป็น "กรณีพิเศษ" ของวิธี B พวกเขาหมายความว่า B นั้นกว้างกว่าและ A เทียบเท่ากับ B พร้อมพารามิเตอร์เฉพาะบางอย่าง พวกเขาไม่ได้หมายความว่า A ให้ผลลัพธ์เหมือนกับ B ภายใต้เงื่อนไขพิเศษบางอย่างบนชุดข้อมูล ดังนั้นคำตอบของฉันสำหรับคำถามของคุณ
อะมีบาพูดว่า Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.