ภายใต้เงื่อนไขอะไรคือการถดถอยสันสามารถให้การปรับปรุงมากกว่าการถดถอยกำลังสองน้อยที่สุดธรรมดาได้?


16

สันเขาถดถอยประมาณการพารามิเตอร์ในแบบจำลองเชิงเส้นโดย\ hat {\ boldsymbol \ beta} _ \ lambda = (\ mathbf X ^ \ top \ mathbf X + \ lambda \ mathbf I) ^ {- 1} \ mathbf X ^ \ top \ mathbf y โดยที่\ lambdaเป็นพารามิเตอร์การทำให้เป็นมาตรฐาน เป็นที่ทราบกันดีว่ามันมักจะทำงานได้ดีกว่าการถดถอย OLS (ด้วย\ lambda = 0 ) เมื่อมีตัวทำนายที่สัมพันธ์กันจำนวนมากβy=Xβ

β^λ=(XX+λI)1Xy,
λλ=0

ทฤษฎีการดำรงอยู่ของสันเขาถดถอยบอกว่ามีพารามิเตอร์\ lambda ^ *> 0อยู่เสมอนั่นหมายความว่า - กำลังสอง - ข้อผิดพลาดของ\ hat {\ boldsymbol \ beta} _ \ lambdaเล็กกว่าค่าเฉลี่ย - ข้อผิดพลาดของ OLS เคร่งครัด การประมาณค่า\ hat {\ boldsymbol \ เบต้า} _ \ mathrm {OLS} = \ hat {\ boldsymbol \ กล่าวอีกนัยหนึ่งค่าที่ดีที่สุดของ\ lambdaนั้นไม่ใช่ศูนย์เสมอ เห็นได้ชัดว่านี่เป็นครั้งแรกที่ได้รับการพิสูจน์ในHoerl และ Kennard ปี 1970และมีการทำซ้ำในบันทึกการบรรยายหลายครั้งที่ฉันพบทางออนไลน์ (เช่นที่นี่และที่นี่ ) คำถามของฉันเกี่ยวกับสมมติฐานของทฤษฎีบทนี้:λ>0β^λβ^OLS=β^0λ

  1. มีสมมติฐานเกี่ยวกับเมทริกซ์ความแปรปรวนร่วมXXหรือไม่?

  2. มีสมมติฐานเกี่ยวกับมิติของXหรือไม่?

โดยเฉพาะคือทฤษฎีบทยังคงเป็นจริงหากทำนายเป็น orthogonal (เช่นXXเป็นแนวทแยงมุม) หรือแม้ว่าXX=I ? และมันยังคงเป็นจริงหากมีเพียงหนึ่งหรือสองตัวทำนาย (พูดตัวทำนายหนึ่งตัวและการสกัดกั้น)?

หากทฤษฎีบทไม่มีข้อสมมติฐานดังกล่าวและยังคงเป็นจริงแม้ในกรณีเหล่านี้แล้วเหตุใดจึงแนะนำให้ใช้การถดถอยแบบสันในกรณีของตัวพยากรณ์ที่สัมพันธ์กันเท่านั้นและไม่เคยแนะนำ (สำหรับการถดถอยแบบง่าย)


สิ่งนี้เกี่ยวข้องกับคำถามของฉันเกี่ยวกับมุมมองแบบรวมเกี่ยวกับการหดตัว: ความสัมพันธ์ (ถ้ามี) ระหว่างความขัดแย้งของสไตน์การถดถอยของสันเขาและผลกระทบแบบสุ่มในรูปแบบผสมคืออะไร แต่ไม่มีคำตอบใดที่จะชี้แจงประเด็นนี้จนถึงขณะนี้


1
มันปรากฏขึ้นทั้งหมด แต่คำถามสุดท้ายได้รับการกล่าวถึงโดยตรงในกระดาษ Hoerl & Kennard โดยเฉพาะอย่างยิ่งในประโยคแรกของบทนำและประโยคแรกของบทสรุป คำถามสุดท้ายสามารถตอบได้โดยการสังเกตความแปรปรวนร่วมระหว่างเวกเตอร์คงที่และตัวทำนายเดี่ยวใด ๆ จะเป็นศูนย์เสมอซึ่งจะช่วยให้หนึ่ง (ในวิธีมาตรฐาน) เพื่อลดเป็นเมทริกซ์XX1×1
whuber

1
ขอบคุณ @whuber ฉันเชื่อว่ากระดาษของ Hoerl & Kennard ตอบคำถามของฉัน (อย่างน้อยก็บทความทางเทคนิค) - ฉันควรทำตามหลักฐานและตรวจสอบสมมติฐาน (ฉันยังไม่ได้ทำ) แต่ฉันไม่มั่นใจอย่างเต็มที่จากประโยคที่คุณอ้างถึง ประโยคแรกของอินโทรเกี่ยวข้องกับคำถามของฉันอย่างไร ประโยคแรกของบทสรุปจะแนะนำว่าถ้ามีสเปกตรัมแบบสม่ำเสมอ (เช่นเท่ากับ ) จากนั้นทฤษฎีบทจะไม่ใช้ แต่ฉันไม่แน่ใจ 100% เนื่องจากฉันไม่เห็นข้อสมมติฐานนี้ชัดเจนก่อนการพิสูจน์ IXXI
อะมีบาพูดว่า Reinstate Monica

ดูสิ่งที่ชนิดของคำถามจะถามโดยผู้ใช้ตัวแทนสูง (ซึ่งมักจะตอบพวกเขา) (และเช่นเดียวกันสำหรับคำถามที่เชื่อมโยงอื่น ๆ ที่ส่งมาให้ผมที่นี่stats.stackexchange.com/questions/122062/... !
javadba

คำตอบ:


11

คำตอบของทั้ง 1 และ 2 ไม่ใช่ แต่จำเป็นต้องใช้ความระมัดระวังในการตีความทฤษฎีการดำรงอยู่

ความแปรปรวนของตัวประมาณสัน

Letเป็นประมาณการสันภายใต้บทลงโทษและให้เป็นพารามิเตอร์ที่เป็นจริงสำหรับรูปแบบ\ Letเป็นลักษณะเฉพาะของX จาก Hoerl & Kennard สมการ 4.2-4.5 ความเสี่ยง (ในแง่ของค่าปกติของข้อผิดพลาด) คือ kβY=Xβ+ϵλ1,,λpXTXL2β^kβY=Xβ+ϵλ1,,λpXTX
L2

( X T X+kฉันพี) -2= ( X T X+kฉันพี) -1 ( X T X+kฉันพี) -1 γ1 ^ β * -βγ2

E([β^β]T[β^β])=σ2j=1pλj/(λj+k)2+k2βT(XTX+kIp)2β=γ1(k)+γ2(k)=R(k)
เท่าที่ฉันสามารถบอกได้ พวกเขาตั้งข้อสังเกตว่ามีการตีความความแปรปรวนของผลิตภัณฑ์ภายในของในขณะที่เป็นผลิตภัณฑ์ด้านในของอคติ(XTX+kIp)2=(XTX+kIp)1(XTX+kIp)1.γ1β^βγ2

หากว่าจากนั้น ให้ เป็นที่มาของความเสี่ยง w / R / T kเนื่องจาก เราสรุปได้ว่ามีเช่นนั้น0) R ( k ) = p σ 2 + k 2 β T βXTX=Ip R(k)=2k(1+k)βTβ-(pσ2+k2βTβ)

R(k)=pσ2+k2βTβ(1+k)2.
R(k)=2k(1+k)βTβ(pσ2+k2βTβ)(1+k)3
klimk0+R(k)=2pσ2<0k>0R(k)<R(0)

ผู้เขียนตั้งข้อสังเกตว่า orthogonality เป็นสิ่งที่ดีที่สุดที่คุณสามารถหวังในแง่ของความเสี่ยงที่และนั่นคือเมื่อจำนวนเงื่อนไขของเพิ่มขึ้นวิธีการ\k=0XTXlimk0+R(k)

คิดเห็น

ดูเหมือนว่าจะมีความขัดแย้งในที่นี้ถ้าและเป็นค่าคงที่เราก็แค่ประมาณค่าเฉลี่ยของตัวแปรNormalและเรารู้การประมาณวานิลลาที่ไม่เอนเอียง ยอมรับได้ในกรณีนี้ นี้ได้รับการแก้ไขโดยการสังเกตว่าข้างต้นเหตุผลเพียงแสดงให้เห็นว่าการลดค่าของที่มีอยู่สำหรับการแก้ไข\ แต่สำหรับใด ๆเราสามารถสร้างความเสี่ยงได้ด้วยการทำให้มีขนาดใหญ่ดังนั้นอาร์กิวเมนต์นี้เพียงอย่างเดียวไม่ได้แสดงการยอมรับสำหรับการประเมินสันp=1X(β,σ2)kβTβkβTβ

เหตุใดจึงแนะนำให้ใช้การถดถอยแบบสันในกรณีของตัวพยากรณ์ที่สัมพันธ์กันเท่านั้น?

ความเสี่ยงที่ได้รับมาจาก H & K แสดงให้เห็นว่าถ้าเราคิดว่านั้นมีขนาดเล็กและหากการออกแบบนั้นเกือบจะเป็นเอกเทศเราก็จะสามารถลดความเสี่ยงในการประมาณการได้มาก ฉันคิดว่าการถดถอยของสันเขาไม่ได้ใช้กันอย่างแพร่หลายเพราะการประมาณค่า OLS เป็นค่าเริ่มต้นที่ปลอดภัยและคุณสมบัติความไม่แน่นอนและความไม่เอนเอียงเป็นสิ่งที่น่าดึงดูด เมื่อมันล้มเหลวมันล้มเหลวโดยสุจริต - เมทริกซ์ความแปรปรวนร่วมของคุณจะระเบิด นอกจากนี้ยังอาจมีประเด็นทางปรัชญา / จุดอ้างอิงว่าหากการออกแบบของคุณเกือบจะเป็นเอกเทศและคุณมีข้อมูลเชิงสังเกตจากนั้นการตีความของเป็นการให้การเปลี่ยนแปลงในสำหรับการเปลี่ยนแปลงหน่วยในเป็นที่สงสัย - เมทริกซ์ความแปรปรวนร่วมขนาดใหญ่ อาการที่เกิดขึ้นนั้น βTβXTXβEYX

แต่หากเป้าหมายของคุณเป็นการคาดการณ์ แต่เพียงผู้เดียวความกังวลเชิงอนุมานก็ไม่ได้อยู่อีกต่อไปและคุณก็มีเหตุผลที่ดีในการใช้ตัวประมาณค่าการหดตัวบางประเภท


2
ว้าวขอบคุณ! ให้ฉันตรวจสอบความเข้าใจของฉันในส่วน "ความคิดเห็น" ของคุณ: สำหรับใดก็ตามดีที่สุดนั้นไม่ใช่ศูนย์ แต่ค่าของมันแตกต่างกันสำหรับ betas ที่แตกต่างกันและไม่มีคงที่ที่สามารถเอาชนะสำหรับ betas ทั้งหมด สิ่งที่จำเป็นสำหรับการยอมรับ แก้ไข? นอกเหนือจากนั้นคุณสามารถแสดงความคิดเห็นในคำถามทั่วไปของฉัน: [หากทฤษฎีบทไม่ได้ตั้งสมมติฐานดังกล่าว] เหตุใดจึงแนะนำให้ใช้การถดถอยแบบสันเขาสำหรับนักทำนายที่มีความสัมพันธ์เท่านั้นและไม่เคยแนะนำการถดถอยแบบง่าย ๆ มันเป็นเพราะผลเชิงบวกเป็นที่รู้จักกันโดยสังเกตุว่าเล็กเกินไปที่จะรบกวนหรือไม่? βkkk=0
อะมีบาพูดว่า Reinstate Monica

2
H&K สันนิษฐานว่าอย่างต่อเนื่องอยู่ในอันดับเต็ม โดยระบุว่าคำตอบที่ # 1 คือ "ไม่" คุณอ้างว่าผลลัพธ์ของพวกเขายังคงเป็นจริงเมื่อมันไม่ได้? XX
whuber

3
@whuber: ศูนย์กลางของความเสี่ยงมาจากการที่สันประมาณโดยที่เป็นค่าประมาณ OLS และ1} สิ่งนี้ไม่สามารถถือได้อย่างชัดเจนเมื่อขาดอันดับ แต่การประมาณค่า OLS ไม่มีอยู่ - ดังนั้นบางทีการประมาณการใด ๆ ที่มีความเสี่ยง จำกัด (ให้ค่ามากพอและคุณจะได้ , กับความเสี่ยง ) จะดีกว่า กว่าตัวประมาณที่ไม่มีอยู่? ตราบใดที่ความเสี่ยงนั้นยังคงมีอยู่ฉันไม่แน่ใจ หลักฐานที่แตกต่างกันจะต้อง β^=Zβ^β^Z=((XTX)1+kIp)1XTXkβ^0βTβ
Andrew M

3
@ amoeba: ใช่การคืนค่าของคุณดูเหมือนถูกต้อง ในการครอบครองตัวประมาณ OLS เราจำเป็นต้องมีขั้นตอนการปรับตัวซึ่งเป็นหน้าที่ของข้อมูล ในหัวข้ออื่นของคุณซีอานมีความคิดเห็นเกี่ยวกับการประเมินสันสันปรับเพื่อที่จะได้เป็นสถานที่ที่จะมอง RE: การประมาณสันเขาสำหรับการออกแบบฉาก - ฉันได้เพิ่มความคิดเห็นอีกเท่าที่คำแนะนำที่ฉันใช้จากหลักฐานของพวกเขา λ
Andrew M
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.