การได้มาของสารละลายบาศกัมมันตรังสีแบบปิด


52

minβ(YXβ)T(YXβ)β1t

βjlasso=sgn(βjLS)(|βjLS|γ)+
X

ดูเหมือนว่าจะสับสนเล็กน้อย ที่จุดเริ่มต้นที่คุณถือว่าเป็นข้อ จำกัดtและในการแก้ปัญหาที่คุณแนะนำพารามิเตอร์\γฉันคาดเดาว่าคุณต้องการให้ทั้งสองคนมีความเกี่ยวข้องผ่านปัญหาสองทาง แต่บางทีคุณสามารถระบุสิ่งที่คุณต้องการได้อย่างชัดเจน
พระคาร์ดินัล

2
ตอบสนองต่อ @cardinal บางส่วนการค้นหาβที่ย่อเล็กสุด(YXβ)(YXβ)ภายใต้β1tเทียบเท่ากับการค้นหาβที่ย่อเล็กสุด(YXβ)(YXβ)+γj|βj|. มีความสัมพันธ์ระหว่าง 1-1 เป็นtและ\γหากต้องการ 'ง่าย' เพื่อดูว่าเหตุใดผลการค้นหาที่อ่อนนุ่มจึงควรแนะนำให้แก้ไขนิพจน์ที่สอง (ในความคิดเห็นของฉัน)

2
หมายเหตุอื่นเมื่อค้นหาβที่ย่อเล็กสุด(YXβ)(YXβ)+γj|βj|แบ่งปัญหาขึ้นเป็นกรณีβj>0 , βj<0และβ=0 0

2
@cardinal Ah ใช่ 1-1 ไม่ถูกต้อง การแก้ไข: ทุกt0คุณสามารถหาγ00

3
ขอบคุณสำหรับการสนทนาที่ยอดเยี่ยม! ฉันเจอวิดีโอนี้ในหลักสูตร - ได้รับการอัพเดตโคตรของพิกัดแบบ lassoซึ่งเกี่ยวข้องกับการสนทนานี้และเดินผ่านทางแก้ปัญหาอย่างสง่างามมาก อาจมีประโยชน์สำหรับผู้เข้าชมในอนาคต :-)
zorbar

คำตอบ:


63

นี้สามารถโจมตีในหลาย ๆ ด้านรวมทั้งวิธีการประหยัดเป็นธรรมผ่านเงื่อนไข Karush-Kuhn-ทักเกอร์

ด้านล่างเป็นอาร์กิวเมนต์ทางเลือกที่ค่อนข้างง่าย

วิธีกำลังสองน้อยที่สุดสำหรับการออกแบบฉาก

สมมติว่าประกอบด้วยคอลัมน์มุมฉาก จากนั้นวิธีแก้ปัญหากำลังสองน้อยที่สุดคือ X

β^LS=(XTX)1XTy=XTy.

ปัญหาที่เทียบเท่ากันบ้าง

ผ่านรูปแบบลากรองจ์มันเป็นเรื่องง่ายที่จะเห็นว่าปัญหาที่เทียบเท่ากับที่พิจารณาในคำถามคือ

minβ12yXβ22+γβ1.

ขยายเทอมแรกออกไปเราได้และเนื่องจากไม่มี ของตัวแปรที่น่าสนใจเราสามารถละทิ้งมันและพิจารณาปัญหาอื่นที่เทียบเท่า 12yTyyTXβ+12βTβyTy

minβ(yTXβ+12β2)+γβ1.

สังเกตว่าปัญหาก่อนหน้านี้สามารถเขียนใหม่เป็น β^LS=XTy

minβi=1pβ^iLSβi+12βi2+γ|βi|.

ฟังก์ชั่นวัตถุประสงค์ของเราตอนนี้เป็นผลรวมของวัตถุประสงค์ซึ่งแต่ละคนมีความสอดคล้องกับตัวแปรแยกดังนั้นพวกเขาแต่ละคนอาจได้รับการแก้ไขเป็นรายบุคคลβi

ทั้งหมดเท่ากับผลรวมของชิ้นส่วน

แก้ไขแน่นอน จากนั้นเราต้องการลด i

Li=β^iLSβi+12βi2+γ|βi|.

หากดังนั้นเราต้องมีมิฉะนั้นเราสามารถพลิกเครื่องหมายและรับค่าที่ต่ำกว่าสำหรับฟังก์ชันวัตถุประสงค์ ในทำนองเดียวกันถ้าแล้วเราจะต้องเลือก0β^iLS>0βi0β^iLS<0βi0

กรณีที่ 1 :0 ตั้งแต่ , และสร้างความแตกต่างนี้ด้วยความเคารพและการตั้งค่าเท่ากับศูนย์ เราจะได้และนี่เป็นไปได้ก็ต่อเมื่อทางด้านขวามือไม่ใช่ค่าลบดังนั้นในกรณีนี้ทางออกที่แท้จริงคือ β^iLS>0βi0

Li=β^iLSβi+12βi2+γβi,
βiβi=β^iLSγ
β^ilasso=(β^iLSγ)+=sgn(β^iLS)(|β^iLS|γ)+.

กรณีที่ 2 :0 นี่หมายความว่าเราต้องมีและดังนั้น ความแตกต่างด้วยความเคารพและการตั้งค่าเท่ากับศูนย์เราได้รับแกมมา) แต่อีกครั้งเพื่อให้แน่ใจว่าเป็นไปได้เราต้องซึ่งทำได้โดยการ β^iLS0βi0

Li=β^iLSβi+12βi2γβi.
βiβi=β^iLS+γ=sgn(β^iLS)(|β^iLS|γ)βi0
β^ilasso=sgn(β^iLS)(|β^iLS|γ)+.

ในทั้งสองกรณีเราได้รับแบบฟอร์มที่ต้องการและเสร็จแล้ว

หมายเหตุสุดท้าย

โปรดทราบว่าเมื่อเพิ่มขึ้นจากนั้นแต่ละจำเป็นต้องลดลงด้วยเหตุนี้จึงไม่\เมื่อเรากู้คืนโซลูชัน OLS และสำหรับเราได้รับสำหรับทุกฉันγ|β^ilasso|β^lasso1γ=0γ>maxi|β^iLS|β^ilasso=0i


2
เขียนดี @ cardinal!
Gary

9
+1 สามารถแทนที่ครึ่งหลังทั้งหมดด้วยการสังเกตอย่างง่าย ๆ ว่าฟังก์ชันวัตถุประสงค์คือ การรวมกันของชิ้นส่วนของพาราโบลานูนสองอันที่มีจุดยอดซึ่งมีเครื่องหมายลบสำหรับและค่าบวก สูตรเป็นเพียงวิธีแฟนซีในการเลือกจุดสุดยอดที่ต่ำกว่า β12β2+(±γβ^)β±γβ^β<0
whuber

ถ้าเป็นไปได้ฉันอยากจะเห็นการดัดแปลงโดยใช้เงื่อนไขการปรับให้เหมาะสม KKT มีวิธีอื่นใดอีกที่จะได้ผลลัพธ์นี้?
user1137731

5
@ สำคัญ: ขอบคุณสำหรับการสืบที่ดี หนึ่งการสังเกต ถ้าฉันจำได้ว่าเมทริกซ์ที่มีคอลัมน์มุมฉากไม่เหมือนกับเมทริกซ์มุมฉาก (อาคา orthonormal) จากนั้นสำหรับบางเส้นทแยงมุมเมทริกซ์ (ไม่จำเป็นต้องเมทริกซ์เอกลักษณ์) ด้วยสมมติฐานเมทริกซ์มุมฉาก (ตามที่อยู่ในคำถามเดิม) เราจะมีและทุกลักษณะดี :)XX=DDXX=I
โอเล็ก Melnikov

@cardinal ฉันไม่เข้าใจว่าทำไมคุณถึงพูดว่า "ไม่เช่นนั้นเราสามารถพลิกเครื่องหมายและรับค่าที่ต่ำกว่าสำหรับฟังก์ชันวัตถุประสงค์" เรากำลังหาอนุพันธ์ของฟังก์ชันวัตถุประสงค์ แล้วถ้าฟังก์ชันวัตถุประสงค์สูงหรือต่ำกว่าใครจะสนใจ สิ่งที่เราสนใจคืออนุพันธ์ถูกตั้งค่าเป็นศูนย์เราใส่ใจเรื่อง extrema ไม่ว่าจะสูงหรือต่ำกว่าค่าคงที่จะไม่ส่งผลกระทบต่ออาร์กิวเมนต์
user13985

7

สมมติว่าตัวแปรคอลัมน์ของ , มีมาตรฐานนอกจากนี้ยังเพื่อให้ฉัน นี่เป็นเพียงเพื่อความสะดวกในภายหลัง: หากไม่มีสัญลักษณ์จะหนักขึ้นเนื่องจากเป็นเส้นทแยงมุมเท่านั้น นอกจากนี้สมมติว่าพี นี่เป็นข้อสมมติฐานที่จำเป็นสำหรับผลลัพธ์ที่จะถือ กำหนดอย่างน้อยสี่เหลี่ยมประมาณการ 2 จากนั้นตัวประมาณค่าแบบเชือก (รูปแบบลากรองจ์ของ) xjXRn×pXTX=IXTXnpβ^OLS=argminβyXβ22

(defn.)β^λ=argminβ12nyXβ22+λβ1(OLS is projection)=argminβ12nXβ^OLSXβ22+λβ1(XTX=I)=argminβ12nβ^OLSβ22+λβ1(algebra)=argminβ12β^OLSβ22+nλβ1(defn.)=proxnλ1(β^OLS)(takes some work)=Snλ(β^OLS),
\ end {align *} โดยที่เป็นโอเปอเรเตอร์ proximal ของฟังก์ชันและ soft thresholds ตามจำนวนproxffSαα.

นี่คือการสืบทอดที่ข้ามการรับรายละเอียดของตัวดำเนินการใกล้เคียงที่ Cardinal ใช้งานได้ แต่ฉันหวังว่าจะอธิบายขั้นตอนหลักที่ทำให้เป็นรูปแบบปิด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.