“ การถดถอยอันดับที่ลดลง” คืออะไรเกี่ยวกับ?


22

ฉันได้อ่านองค์ประกอบของการเรียนรู้ทางสถิติแล้วและฉันไม่สามารถเข้าใจได้ว่าส่วนที่ 3.7 "การหดตัวและการเลือกหลายผลลัพธ์" นั้นเกี่ยวกับอะไร มันพูดเกี่ยวกับ RRR (การถดถอยลดอันดับ) และฉันสามารถเข้าใจได้ว่าหลักฐานเป็นเรื่องเกี่ยวกับโมเดลเชิงเส้นหลายตัวแปรแบบทั่วไปที่ไม่ทราบค่าสัมประสิทธิ์ นั่นเป็นสิ่งเดียวที่ฉันเข้าใจ

คณิตศาสตร์ที่เหลืออยู่นั้นเกินกว่าฉัน มันไม่ได้ช่วยให้ผู้เขียนพูดว่า 'ใคร ๆ ก็สามารถแสดง' และทิ้งสิ่งต่าง ๆ ไว้เป็นแบบฝึกหัดได้

ใครช่วยกรุณาอธิบายสิ่งที่เกิดขึ้นที่นี่อย่างสังหรณ์ใจ? บทนี้ควรพูดถึงวิธีการใหม่ ๆ หรือไม่? หรืออะไร?


1
ดูเหมือนว่าจะให้วิธีการถดถอยที่ใช้ประโยชน์จากรูปแบบผลหลายในบริบทของการหดตัวและการเลือกตัวแปร ไม่มีผลลัพธ์ Y เดี่ยว แต่มีผลลัพธ์ Y มากกว่าหนึ่งรายการ สมมติว่าคุณมีผลลัพธ์ 5 Y จากนั้นส่วนนี้อธิบายวิธีการรวมการประมาณค่าของวิธีการแทนที่จะสร้างแบบจำลอง 5 แบบแยกกัน
spdrnl

1
เซนต์น้อยของฉัน: การสันนิษฐานของเมทริกซ์อันดับต่ำทำให้สิ่งต่าง ๆ ง่ายขึ้น โชคดีที่สมมติฐานนี้มีไว้สำหรับแหล่งข้อมูลในโลกแห่งความเป็นจริงจำนวนมาก
Vladislavs Dovgalecs

1
ดูเหมือนว่าสมมติฐานนี้เกี่ยวกับการมีข้อ จำกัด ในการแก้ปัญหา บทความนี้อธิบายว่าทำไมstatprob.com/encyclopedia/ ......
Vladislavs Dovgalecs

คำตอบ:


42

1. การลดระดับการถดถอย (RRR) คืออะไร?

พิจารณาหลายตัวแปรการถดถอยเชิงเส้นหลายเช่นการถดถอยกับตัวแปรอิสระและQตัวแปรตาม ปล่อยให้XและYเป็นชุดข้อมูลกึ่งกลาง ( n × p ) และชุดข้อมูลการตอบสนอง ( n × q ) จากนั้นสามารถกำหนดสูตรการถดถอยปกติธรรมดากำลังสองน้อยที่สุด (OLS) เป็นการลดฟังก์ชันต้นทุนต่อไปนี้:pqXYn×pn×q

L=YXB2,

ที่เป็นP × Qเมทริกซ์น้ำหนักถดถอย วิธีการแก้ปัญหาของตนจะได้รับจากบีโอL S = ( XX ) - 1 XY ,และมันเป็นเรื่องง่ายที่จะเห็นว่ามันจะเทียบเท่ากับการทำคิวแยกต่างหากถดถอย OLS หนึ่งสำหรับแต่ละตัวแปรตามBp×q

B^OLS=(XX)1XY,
q

การลดอันดับความถดถอยแนะนำข้อ จำกัด ในตำแหน่งคือLควรจะลดลงด้วยยศ( B ) Rที่Rเป็นสูงสุดที่ได้รับอนุญาตยศBBLrank(B)rrB

2. วิธีการขอรับโซลูชัน RRR

ปรากฎว่า RRR สามารถถูกโยนเป็นปัญหาไอเก็นนักแสดง อันที่จริงโดยใช้ความจริงที่ว่า OLS เป็นหลักฉายฉากบนพื้นที่คอลัมน์ของเราสามารถเขียนLเป็นL = Y - X B O L S2 + X B O L S - X B 2 ในระยะแรกไม่ขึ้นอยู่กับBและระยะที่สองจะลดลงโดย SVD / PCA ของค่าติดตั้งY = X BXL

L=YXB^OLS2+XB^OLSXB2.
B SY^=XB^OLS

โดยเฉพาะถ้าเป็นครั้งแรกที่อาร์แกนหลักของYแล้วB R R R = B O L S U R U RUrrY^

B^RRR=B^OLSUrUr.

3. RRR เหมาะสำหรับอะไร?

อาจมีเหตุผลสองประการในการใช้ RRR

Br

ประการที่สองเราสามารถใช้เป็นวิธีการลดขนาด / การสำรวจข้อมูล หากเรามีตัวแปรตัวทำนายจำนวนมากและตัวแปรตามจำนวนมากมาย RRR จะสร้าง "ปัจจัยแฝง" ในพื้นที่ตัวทำนายที่ทำงานได้ดีที่สุดในการอธิบายความแปรปรวนของ DV จากนั้นเราสามารถลองตีความปัจจัยแฝงเหล่านี้พล็อตพวกมัน ฯลฯ เท่าที่ฉันรู้นี่เป็นเรื่องปกติในระบบนิเวศน์ที่ RRR เป็นที่รู้จักกันในชื่อการวิเคราะห์ความซ้ำซ้อนและเป็นตัวอย่างของสิ่งที่พวกเขาเรียกวิธีการบวช ( ดู @ GavinSimpson )

4. ความสัมพันธ์กับวิธีการลดขนาดอื่น ๆ

RRR เชื่อมต่ออย่างใกล้ชิดกับวิธีการลดขนาดอื่น ๆ เช่น CCA และ PLS ฉันพูดถึงมันเล็กน้อยในคำตอบของฉันในการเชื่อมต่อระหว่างกำลังสองน้อยที่สุดบางส่วนการลดอันดับการถดถอยและการถดถอยองค์ประกอบหลักคืออะไร

XYn×pn×qwRpXvRqY

PCA:Var(Xw)RRR:Var(Xw)Corr2(Xw,Yv)Var(Yv)PLS:Var(Xw)Corr2(Xw,Yv)Var(Yv)=Cov2(Xw,Yv)CCA:Var(Xw)Corr2(Xw,Yv)

ดูรายละเอียดเพิ่มเติมได้จากที่นั่น

ดูTorre, 2009, Least-Squares Framework สำหรับการวิเคราะห์องค์ประกอบโดยละเอียดสำหรับวิธีการวิเคราะห์เชิงเส้นแบบหลายตัวแปร (เช่น PCA, CCA, LDA - แต่ไม่ใช่ PLS!) โดยละเอียด

5. ทำไมส่วนนี้ใน Hastie et al สับสนงั้นเหรอ?

L=YXB2,
L=(YXB)(YY)1/22,
YYเป็นสีขาวแล้วความแตกต่างจะหายไป ดังนั้นสิ่งที่ Hastie และคณะ การโทร RRR นั้นจริง ๆ แล้วเป็น CCA ปลอมตัว (และแน่นอนดูที่ 3.69)

ไม่มีสิ่งใดที่อธิบายอย่างถูกต้องในส่วนนี้ดังนั้นจึงเกิดความสับสน


ดูคำตอบของฉันเกี่ยวกับการสอนที่เป็นมิตรหรือรู้เบื้องต้นเกี่ยวกับการถดถอยแบบลดอันดับเพื่อการอ่านเพิ่มเติม


นี่เป็นคำอธิบายโดยละเอียดที่เขียนไว้อย่างดีมาก ขอบคุณฉันขอบคุณมัน
cgo

rB

1
YBBLBL

1
rrdf^(r)=pq(pr)(qr)+"a small correction term"pqrYY^RRRR(r)Fro2(nqdf^(r))2


3

Reduced Rank Regression เป็นโมเดลที่ไม่มีผลลัพธ์ Y เดี่ยว แต่เป็นผลลัพธ์ Y หลายรายการ แน่นอนว่าคุณสามารถใส่การถดถอยเชิงเส้นหลายตัวแปรแบบแยกต่างหากสำหรับการตอบสนองแต่ละครั้ง แต่สิ่งนี้ดูเหมือนว่าไม่มีประสิทธิภาพเมื่อความสัมพันธ์ในหน้าที่การทำงานระหว่างตัวทำนายและการตอบสนองแต่ละอย่างชัดเจนคล้ายกัน ดูแบบฝึกหัดตัวต่อนี้สำหรับสถานการณ์ที่ฉันเชื่อว่าเรื่องนี้ชัดเจน

https://www.kaggle.com/c/bike-sharing-demand/data

มีเทคนิคต่าง ๆ ที่เกี่ยวข้องสำหรับการเข้าถึงปัญหานี้ที่สร้าง "ปัจจัย" หรือ "ส่วนประกอบ" ออกจากตัวแปร X ที่ใช้สำหรับการทำนาย Ys หน้าเอกสารนี้จาก SAS ช่วยแก้ไขความแตกต่างให้ฉัน Reduced Rank Regression ดูเหมือนว่าจะเกี่ยวกับการแยกส่วนประกอบที่มีการเปลี่ยนแปลงในการตอบสนองมากที่สุดซึ่งตรงกันข้ามกับ Partial Least Squares ซึ่งแยกส่วนประกอบที่มีการเปลี่ยนแปลงมากที่สุดทั้งในการตอบสนองและตัวทำนาย

https://support.sas.com/documentation/cdl/en/statug/63347/HTML/default/viewer.htm#statug_pls_sect014.htm


+1 ถูกต้อง. ฉันพูดถึงหน้าเอกสารประกอบของ SAS นี้และโดยเฉพาะอย่างยิ่งรูปของพวกเขาในคำตอบของฉันใน stats.stackexchange.com/questions/206587
อะมีบาพูดว่า Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.