สามารถ


11

ถ้า β=argminβyXβ22+λβ1สามารถ β2 เพิ่มขึ้นเมื่อ λ เพิ่มขึ้น?

ฉันคิดว่ามันเป็นไปได้ แม้ว่าβ* * * *1 ไม่เพิ่มขึ้นเมื่อ λเพิ่มขึ้น ( หลักฐานของฉัน)β* * * *2สามารถเพิ่ม รูปด้านล่างแสดงความเป็นไปได้ เมื่อไหร่λ เพิ่มขึ้นหาก β* * * * เดินทาง (เชิงเส้น) จาก P ถึง Qจากนั้น β* * * *2 เพิ่มขึ้นในขณะที่ β* * * *1ลดลง แต่ฉันไม่ทราบวิธีการสร้างตัวอย่างที่เป็นรูปธรรม (เช่นการสร้างX และ Y) เพื่อให้โปรไฟล์ของ β* * * *แสดงให้เห็นถึงพฤติกรรมนี้ ความคิดใด ๆ ขอบคุณ.

ป้อนคำอธิบายรูปภาพที่นี่

คำตอบ:


10

คำตอบคือใช่และคุณมีหลักฐานกราฟิกมา 2 ตรงนั้น.

ค้นหาคำจำกัดความของความเท่าเทียมของเวกเตอร์บรรทัดฐาน คุณจะพบว่า

x2x1nx2,
ที่ไหน n เป็นมิติของเวกเตอร์ x. ดังนั้นมีบางห้องเลื้อยสำหรับ2 บรรทัดฐานเมื่อเทียบกับ 1 บรรทัดฐาน

ในความเป็นจริงปัญหาที่คุณต้องการแก้ไขสามารถระบุได้ว่า:

หา d ดังนั้น

x+d2>x2
ในขณะเดียวกัน
x+d1<x1.

สแควร์ความไม่เท่าเทียมกันแรกขยายและดูว่า

2ixidi>idi2
และโดยสมมติว่า xi0 และ xi+di0เราได้มาจากความไม่เท่าเทียมที่สองที่เราต้องมี
idi<0.
ใด d ที่เติมเต็มข้อ จำกัด เหล่านี้จะเพิ่ม 2 บรรทัดฐานในขณะที่ลด 1 บรรทัดฐาน

ในตัวอย่างของคุณ d[-0.4,0.3]T, x:=P[0.5,0.6]Tและ

idi0.1<0,
และ
2iPidi0.04>0.25-Σผมdผม2.

แต่มันเกี่ยวข้องกับการก่อสร้างอย่างไร X และ Y?
ziyuang

3

ขอบคุณสำหรับคำตอบของ @ TommyL แต่คำตอบของเขาไม่ตรงกับการสร้าง X และ Y. ฉันแก้ปัญหาด้วยตัวเอง ครั้งแรกเมื่อλ เพิ่มขึ้น β* * * *2 จะไม่เพิ่มขึ้นเมื่อละ βผม* * * *ลดลงอย่างน่าเบื่อ สิ่งนี้จะเกิดขึ้นเมื่อX เป็น orthonormal ซึ่งเรามี

βผม* * * *=sผมก.n(βผมLS)(βผมLS-λ)+

เรขาคณิตในสถานการณ์เช่นนี้ β* * * * เคลื่อนที่ตั้งฉากกับรูปร่างของ 1 บรรทัดฐานดังนั้น β* * * *2 ไม่สามารถเพิ่มได้

จริงๆแล้ว Hastie และคณะ กล่าวถึงในกระดาษถดถอยไปข้างหน้า stagewise และ monotone lasso , เงื่อนไขที่จำเป็นและเพียงพอของ monotonicity ของเส้นทางโปรไฟล์:

ป้อนคำอธิบายรูปภาพที่นี่

ในส่วนที่ 6 ของกระดาษพวกเขาสร้างชุดข้อมูลเทียมขึ้นอยู่กับฟังก์ชั่นพื้นฐานเชิงเส้นเป็นชิ้น ๆ ซึ่งละเมิดเงื่อนไขดังกล่าวข้างต้นแสดงให้เห็นว่าไม่ใช่ monotonicity แต่ถ้าเรามีโชคเราสามารถสร้างชุดข้อมูลแบบสุ่มที่แสดงพฤติกรรมที่คล้ายกัน แต่ในวิธีที่ง่ายกว่า นี่คือรหัส R ของฉัน:

library(glmnet)
set.seed(0)
N <- 10
p <- 15
x1 <- rnorm(N)
X <- mat.or.vec(N, p)
X[, 1] <- x1
for (i in 2:p) {X[, i] <- x1 + rnorm(N, sd=0.2)}
beta <- rnorm(p, sd=10)
y <- X %*% beta + rnorm(N, sd=0.01)
model <- glmnet(X, y, family="gaussian", alpha=1, intercept=FALSE)

ฉันจงใจปล่อยให้ Xคอลัมน์มีความสัมพันธ์สูง (ห่างจากกรณี orthonormal) และคอลัมน์จริง βมีทั้งรายการบวกและลบที่มีขนาดใหญ่ ที่นี่คือβ* * * *โปรไฟล์ของ (ไม่เปิดใช้งานตัวแปรที่น่าแปลกใจเพียง 5 ตัวเท่านั้น):

ป้อนคำอธิบายรูปภาพที่นี่

และความสัมพันธ์ระหว่าง λ และ β* * * *2:

ป้อนคำอธิบายรูปภาพที่นี่

ดังนั้นเราจะเห็นว่าในช่วงเวลาหนึ่งของ λ, β* * * *2 เพิ่มขึ้นเป็น λ เพิ่มขึ้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.