ทำความเข้าใจกับการถดถอยเชิงลบ


12

ฉันกำลังมองหาวรรณกรรมเกี่ยวกับการถดถอยเชิงลบสันเขา

ในระยะสั้นมันเป็นลักษณะทั่วไปของการถดถอยเชิงเส้นโดยใช้เชิงลบในสูตรตัวประมาณ:กรณีในเชิงบวกมีทฤษฎีที่ดี: เป็นฟังก์ชั่นการสูญเสียเป็นข้อ จำกัด เป็น Bayes ก่อน ... แต่ฉันรู้สึกหายไปกับรุ่นเชิงลบที่มีเพียงสูตรข้างต้น มันจะมีประโยชน์สำหรับสิ่งที่ฉันทำ แต่ฉันไม่สามารถตีความได้อย่างชัดเจนบีตา = ( X X + λ ฉัน) - 1 X Yλ

β^=(XX+λI)1Xy.

คุณรู้ข้อความเบื้องต้นเกี่ยวกับสันเขาเชิงลบหรือไม่? จะตีความได้อย่างไร?


1
ฉันไม่รู้เกี่ยวกับข้อความเกริ่นนำใด ๆ ที่พูดถึงมัน แต่ที่มานี้อาจเป็นความสว่างโดยเฉพาะอย่างยิ่งการสนทนาที่ด้านล่างของหน้า 18: jstor.org/stable/4616538?seq=1#page_scan_tab_contents
Ryan Simmons

1
ในกรณีที่ลิงก์ตายในอนาคตการอ้างอิงแบบเต็มคือ: Björkström, A. & Sundberg, R. "ภาพรวมทั่วไปเกี่ยวกับการถดถอยแบบต่อเนื่อง" สแกนดิเนเวียนวารสารสถิติ 26: 1 (1999): pp.17-30
Ryan Simmons

2
ขอบคุณมาก. นี่เป็นการตีความสันเขาที่ชัดเจนผ่านทาง CR เมื่อ . (ค่าลักษณะเฉพาะที่ใหญ่ที่สุดของเมทริกซ์ความแปรปรวนร่วม) ยังคงมองหาการตีความกับ ... λ > - λ 1λ<λ1λ>λ1
เบอนัวต์ซานเชซ

หมายเหตุในการพัฒนาสันเขาถดถอยจาก Tikhonov normalization นี้ Tikhonov normalizationกลายเป็นสำหรับสันเขาถดถอย ต่อจากนั้นมักจะถูกแทนที่ด้วย\วิธีเดียวที่จะทำให้เชิงลบนี้สำหรับที่จะจินตนาการคือหลาย{-1} ตกลงอะไร คุณต้องการไปกับมันที่ไหน? α 2ผมα 2 λ α ฉัน= ΓTΓα2Iα2λαi=1
Carl

สันเชิงลบกล่าวถึงที่นี่: stats.stackexchange.com/questions/328630/… พร้อมลิงก์บางลิงก์
kjetil b halvorsen

คำตอบ:


12

นี่คือภาพประกอบทางเรขาคณิตของสิ่งที่เกิดขึ้นกับสันเขาด้านลบ

ฉันจะพิจารณาตัวประมาณของรูปแบบที่เกิดจากการสูญเสียฟังก์ชันนี่เป็นภาพที่ค่อนข้างมาตรฐานของสิ่งที่เกิดขึ้นในกรณีที่สองมิติกับinfty) ศูนย์แลมบ์ดาสอดคล้องกับโซลูชัน OLS แลมบ์ดาอนันต์จะลดขนาดเบต้าโดยประมาณเป็นศูนย์:

β^λ=(XX+λI)1Xy
λ[0,)
Lλ=yXβ2+λβ2.
λ[0,)

ป้อนคำอธิบายรูปภาพที่นี่

ตอนนี้พิจารณาสิ่งที่เกิดขึ้นเมื่อที่เป็นค่าเอกพจน์ที่ใหญ่ที่สุดของX สำหรับ lambdas เชิงลบที่มีขนาดใหญ่มากนั้นใกล้เคียงกับศูนย์ เมื่อแลมบ์ดาเข้าใกล้คำศัพท์จะได้รับค่าเอกพจน์ใกล้ศูนย์หนึ่งหมายความว่าค่าผกผันมีค่าเอกพจน์หนึ่งลบด้วยอนันต์ ค่าเอกพจน์นี้สอดคล้องกับองค์ประกอบหลักตัวแรกของดังนั้นในขีด จำกัด หนึ่งจะได้รับชี้ไปในทิศทางของ PC1 แต่ด้วยค่าสัมบูรณ์ที่เพิ่มขึ้นจนไม่มีที่สิ้นสุดs เมตรx X บีตา λ - s 2 สูงสุด ( XX + λ ฉัน ) X บีตา λλ(,smax2)smaxXβ^λsmax2(XX+λI)Xβ^λ

สิ่งที่ดีจริงๆคือมีใครสามารถวาดมันลงบนรูปแบบเดียวกันในแบบเดียวกัน: มีการให้ betas โดยจุดที่วงกลมสัมผัสกับรูปไข่จากภายใน :

ป้อนคำอธิบายรูปภาพที่นี่

เมื่อจะใช้ตรรกะที่คล้ายกันทำให้สามารถดำเนินการต่อไปตามเส้นทางของสันเขาในอีกด้านหนึ่งของเครื่องมือประมาณค่า OLS ได้ตอนนี้วงกลมจะสัมผัสกับจุดไข่ปลาจากด้านนอก ขีด จำกัด betas เข้าใกล้ทิศทาง PC2 (แต่มันเกิดขึ้นนอกร่างนี้):λ(smin2,0]

ป้อนคำอธิบายรูปภาพที่นี่

ช่วงเป็นสิ่งที่มีช่องว่างพลังงาน : ตัวประมาณที่ไม่มีอยู่บนเส้นโค้งเดียวกัน(smax2,smin2)

UPDATE:ในคอมเม้นต์ @MartinL อธิบายว่าสำหรับการสูญเสียไม่มีค่าขั้นต่ำ แต่มีค่าสูงสุด และสูงสุดนี้จะได้รับโดย\นี่คือเหตุผลที่โครงสร้างทางเรขาคณิตเดียวกันกับการสัมผัสวงกลม / วงรียังคงทำงาน: เรายังคงมองหาจุดศูนย์การไล่ระดับสี เมื่อการสูญเสียมีค่าต่ำสุดและมอบให้โดยเหมือนกับในปกติเรื่องλ<smax2Lλβ^λsmin2<λ0Lλβ^λλ>0

แต่เมื่อการสูญเสียไม่มีค่าสูงสุดหรือต่ำสุด; จะสอดคล้องกับจุดอาน สิ่งนี้อธิบายถึง "ช่องว่างพลังงาน"smax2<λ<smin2Lλβ^λ


เกิดขึ้นตามธรรมชาติจากการถดถอยโดยเฉพาะอย่างยิ่งสัน จำกัด ดูขีด จำกัด ของ "หน่วยความแปรปรวน" สันเขาถดถอยประมาณการเมื่อ \สิ่งนี้เกี่ยวข้องกับสิ่งที่เป็นที่รู้จักในวรรณกรรมเคมีว่า "การถดถอยอย่างต่อเนื่อง" ดูคำตอบของฉันในหัวข้อที่เชื่อมโยงλ(,smax2)λ

สามารถรับการรักษาในทางเดียวกันว่าเป็นคือการเข้าพักฟังก์ชั่นการสูญเสียเหมือนกันและประมาณการสันให้ต่ำสุดλ > 0λ(smin2,0]λ>0


1
ขอบคุณสำหรับกราฟที่น่าสนใจ เมื่อโซลูชันที่คุณได้กราฟคือจำนวนสูงสุดของฟังก์ชั่นต้นทุนไม่ใช่ระดับต่ำสุดทั่วโลก ในทำนองเดียวกันเมื่อจุดที่คุณได้กราฟควรเป็นจุดอานของฟังก์ชันต้นทุน - s 2 max < λ < 0λ<smax2smax2<λ<0
มาร์ติน L

1
พิจารณาเฉพาะคำกำลังสองในฟังก์ชั่นค่าใช้จ่าย พวกเขาสามารถเขียนเป็น ให้แล้วเมทริกซ์ในวงเล็บมีค่าลักษณะเฉพาะเชิงลบเท่านั้น อนุญาตให้ , และเมทริกซ์มีทั้งค่าบวกและลบ ค่าลักษณะเฉพาะเหล่านี้มีผลต่อจุดที่เป็นจุดอานต่ำสุดหรือสูงสุดของฟังก์ชันต้นทุน λ < - s 2 max - s 2 max < λ < 0
βT(XTX+λI)β.
λ<smax2smax2<λ<0
มาร์ติน L

1
มันมีประโยชน์มากขอบคุณมาก ฉันอัปเดตคำตอบแล้ว
อะมีบา

1
ขอบคุณ. โดยเฉพาะอย่างยิ่งสำหรับการตระหนักว่าจุดอานเท่านั้นถือเมื่อ 2 เมื่อการแก้ปัญหายังคงเป็นระดับต่ำสุดทั่วโลกตั้งแต่นั้นมาเป็นค่าบวกแน่นอน ความคิดเห็นก่อนหน้าของฉันจึงไม่ถูกต้องบางส่วน λ > - s 2 min X T X + λ Ismax2<λ<smin2λ>smin2XTX+λI
Martin L
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.