1. การลดระดับการถดถอย (RRR) คืออะไร?
พิจารณาหลายตัวแปรการถดถอยเชิงเส้นหลายเช่นการถดถอยกับตัวแปรอิสระและQตัวแปรตาม ปล่อยให้XและYเป็นชุดข้อมูลกึ่งกลาง ( n × p ) และชุดข้อมูลการตอบสนอง ( n × q ) จากนั้นสามารถกำหนดสูตรการถดถอยปกติธรรมดากำลังสองน้อยที่สุด (OLS) เป็นการลดฟังก์ชันต้นทุนต่อไปนี้:pqXYn×pn×q
L=∥Y−XB∥2,
ที่เป็นP × Qเมทริกซ์น้ำหนักถดถอย วิธีการแก้ปัญหาของตนจะได้รับจากบีโอL S = ( X ⊤ X ) - 1 X ⊤ Y ,และมันเป็นเรื่องง่ายที่จะเห็นว่ามันจะเทียบเท่ากับการทำคิวแยกต่างหากถดถอย OLS หนึ่งสำหรับแต่ละตัวแปรตามBp×q
B^OLS=(X⊤X)−1X⊤Y,
q
การลดอันดับความถดถอยแนะนำข้อ จำกัด ในตำแหน่งคือLควรจะลดลงด้วยยศ( B ) ≤ Rที่Rเป็นสูงสุดที่ได้รับอนุญาตยศBBLrank(B)≤rrB
2. วิธีการขอรับโซลูชัน RRR
ปรากฎว่า RRR สามารถถูกโยนเป็นปัญหาไอเก็นนักแสดง อันที่จริงโดยใช้ความจริงที่ว่า OLS เป็นหลักฉายฉากบนพื้นที่คอลัมน์ของเราสามารถเขียนLเป็นL = ‖ Y - X B O L S ‖ 2 + ‖ X B O L S - X B ‖ 2 ในระยะแรกไม่ขึ้นอยู่กับBและระยะที่สองจะลดลงโดย SVD / PCA ของค่าติดตั้งY = X BXL
L = ∥ Y - X B^OLS∥2+∥XB^OLS−XB∥2.
B S
Y^=XB^OLS
โดยเฉพาะถ้าเป็นครั้งแรกที่อาร์แกนหลักของYแล้วB R R R = B O L S U R U ⊤ RUrrY^
B^RRR=B^OLSUrU⊤r.
3. RRR เหมาะสำหรับอะไร?
อาจมีเหตุผลสองประการในการใช้ RRR
Br
ประการที่สองเราสามารถใช้เป็นวิธีการลดขนาด / การสำรวจข้อมูล หากเรามีตัวแปรตัวทำนายจำนวนมากและตัวแปรตามจำนวนมากมาย RRR จะสร้าง "ปัจจัยแฝง" ในพื้นที่ตัวทำนายที่ทำงานได้ดีที่สุดในการอธิบายความแปรปรวนของ DV จากนั้นเราสามารถลองตีความปัจจัยแฝงเหล่านี้พล็อตพวกมัน ฯลฯ เท่าที่ฉันรู้นี่เป็นเรื่องปกติในระบบนิเวศน์ที่ RRR เป็นที่รู้จักกันในชื่อการวิเคราะห์ความซ้ำซ้อนและเป็นตัวอย่างของสิ่งที่พวกเขาเรียกวิธีการบวช ( ดู @ GavinSimpson )
4. ความสัมพันธ์กับวิธีการลดขนาดอื่น ๆ
RRR เชื่อมต่ออย่างใกล้ชิดกับวิธีการลดขนาดอื่น ๆ เช่น CCA และ PLS ฉันพูดถึงมันเล็กน้อยในคำตอบของฉันในการเชื่อมต่อระหว่างกำลังสองน้อยที่สุดบางส่วนการลดอันดับการถดถอยและการถดถอยองค์ประกอบหลักคืออะไร
XYn×pn×qw∈RpXv∈RqY
PCA:RRR:PLS:CCA:Var(Xw)Var(Xw)⋅Corr2(Xw,Yv)⋅Var(Yv)Var(Xw)⋅Corr2(Xw,Yv)⋅Var(Yv)=Cov2(Xw,Yv)Var(Xw)⋅Corr2(Xw,Yv)
ดูรายละเอียดเพิ่มเติมได้จากที่นั่น
ดูTorre, 2009, Least-Squares Framework สำหรับการวิเคราะห์องค์ประกอบโดยละเอียดสำหรับวิธีการวิเคราะห์เชิงเส้นแบบหลายตัวแปร (เช่น PCA, CCA, LDA - แต่ไม่ใช่ PLS!) โดยละเอียด
5. ทำไมส่วนนี้ใน Hastie et al สับสนงั้นเหรอ?
L=∥Y−XB∥2,
L=∥(Y−XB)(Y⊤Y)−1/2∥2,
YYเป็นสีขาวแล้วความแตกต่างจะหายไป ดังนั้นสิ่งที่ Hastie และคณะ การโทร RRR นั้นจริง ๆ แล้วเป็น CCA ปลอมตัว (และแน่นอนดูที่ 3.69)
ไม่มีสิ่งใดที่อธิบายอย่างถูกต้องในส่วนนี้ดังนั้นจึงเกิดความสับสน
ดูคำตอบของฉันเกี่ยวกับการสอนที่เป็นมิตรหรือรู้เบื้องต้นเกี่ยวกับการถดถอยแบบลดอันดับเพื่อการอ่านเพิ่มเติม