การทำให้เป็นมาตรฐานของ Tikhonov เหมือนกับการถดถอยของสันเขาหรือไม่?


32

การทำให้เป็นมาตรฐาน Tikhonov และการถดถอยสันเป็นคำที่มักใช้ราวกับว่าพวกเขาเหมือนกัน เป็นไปได้หรือไม่ที่จะระบุอย่างชัดเจนว่าความแตกต่างคืออะไร?

คำตอบ:


46

Tikhonov regularizarization เป็นชุดใหญ่กว่าสันเขาถดถอย นี่คือความพยายามของฉันที่จะสะกดความแตกต่างอย่างชัดเจน

สมมติว่าสำหรับเมทริกซ์และเวกเตอร์รู้จักกันเราต้องการหาเวกเตอร์นั้น:b xAbx

Ax=b{ข}

วิธีมาตรฐานเป็นวิธีการถดถอยเชิงเส้นกำลังสองน้อยที่สุด อย่างไรก็ตามถ้าไม่มีเป็นไปตามสมการหรือมากกว่าหนึ่ง - นั่นคือวิธีการแก้ปัญหานั้นไม่ซ้ำกัน - ปัญหาถูกกล่าวว่าไม่ถูกต้อง สี่เหลี่ยมจัตุรัสขั้นต่ำสุดสามัญพยายามที่จะลดผลรวมของส่วนที่เหลือกำลังสองซึ่งสามารถเขียนเป็นดาน:xxx

Axb2

โดยที่เป็นบรรทัดฐานแบบยุคลิด ในสัญกรณ์เมทริกซ์การแก้ปัญหาแสดงโดยx^ได้รับจาก:

x^=(ATA)1ATb

การทำให้เป็นมาตรฐาน Tikhonovลดลง

Axb2+Γx2

สำหรับบางคนได้รับการแต่งตั้งอย่างเหมาะสม Tikhonov เมทริกซ์\โซลูชันฟอร์มเมทริกซ์ที่ชัดเจนซึ่งแสดงโดยได้รับจาก:xΓx^

x^=(ATA+ΓTΓ)1ATb

ผลของกูอาจจะแตกต่างกันผ่านทางขนาดของเมทริกซ์\สำหรับสิ่งนี้จะลดการแก้ปัญหากำลังสองน้อยที่สุดที่ไม่สม่ำเสมอซึ่งมี(A T A) −1อยู่แกมมา= 0ΓΓ=0

โดยทั่วไปแล้วสำหรับการถดถอยสันเขาสองขาออกจากการทำให้เป็นระเบียบ Tikhonov จะอธิบาย ก่อนอื่นเมทริกซ์ Tikhonov จะถูกแทนที่ด้วยเมทริกซ์เอกลักษณ์หลายตัว

Γ=αI ,

ให้ความพึงพอใจกับการแก้ปัญหาที่มีบรรทัดฐานที่มีขนาดเล็กเช่นมาตรฐานจากนั้น จะกลายเป็นนำไปสู่Γ T Γ อัลฟ่า2ฉันL2ΓTΓα2ผม

x^=(ATA+α2ผม)-1AT

ในที่สุดสำหรับการถดถอยสันมันมักจะสันนิษฐานว่าตัวแปรจะถูกปรับอัตราส่วนเพื่อให้มีรูปแบบของเมทริกซ์สหสัมพันธ์ และเป็นเวกเตอร์สหสัมพันธ์ระหว่างตัวแปรและนำไปสู่X T X X T b x bAXTXXTx

x^=(XTX+α2ผม)-1XT

หมายเหตุในรูปแบบนี้ตัวคูณ Lagrangeมักจะถูกแทนที่ด้วย ,หรือสัญลักษณ์อื่น ๆ แต่ยังคงคุณสมบัติ k λ λ 0α2kλλ0

ในการกำหนดคำตอบนี้ฉันรับทราบการยืมอย่างเสรีจากWikipediaและจากการประมาณค่าน้ำหนักการถ่ายโอนของสันเขา


9
(+1) เพื่อความสมบูรณ์มันเป็นสิ่งที่ควรค่าแก่การกล่าวถึงว่าในการใช้งานจริงระบบปกติจะถูกเขียนในรูปแบบซึ่งสามารถแก้ไขได้ในฐานะที่เป็นปัญหากำลังสองน้อยที่สุดเชิงเส้นมาตรฐาน (เช่นผ่าน QR / SVD บนโดยไม่ต้องสร้างสมการปกติอย่างชัดเจน) [AαΓ]x[0]A^x^A^
GeoMatt22

จุดดี. ฉันจะเพิ่มในภายหลัง
Carl

เส้นโค้งที่ราบเรียบและวิธีการขยายแบบพื้นฐานที่คล้ายคลึงกันเป็นส่วนหนึ่งของการทำให้เป็นมาตรฐานของ Tikhonov หรือไม่?
Sycorax พูดว่า Reinstate Monica

@Sycorax ฉันไม่ได้คาดหวังเช่นนั้น ตัวอย่างเช่น B-spline จะตั้งค่าอนุพันธ์ที่ศูนย์ที่จุดสิ้นสุดและจับคู่อนุพันธ์และขนาดของเส้นโค้งไปยังข้อมูลในระหว่างจุดสิ้นสุด การทำให้เป็นมาตรฐาน Tikhonov จะลดข้อผิดพลาดของพารามิเตอร์ที่คุณบอกไว้ด้วยการเปลี่ยนความชัน ดังนั้นสิ่งต่าง ๆ
คาร์ล

นอกจากนี้การทำให้เป็นมาตรฐานของ Tychonov มีการกำหนดขนาดโดยพลการสำหรับช่องว่าง (แยกได้หรือไม่) ช่องว่างของ Hilbert
AIM_BLB

23

คาร์ลได้ให้คำตอบอย่างละเอียดซึ่งอธิบายความแตกต่างทางคณิตศาสตร์ระหว่างการทำให้เป็นมาตรฐาน Tikhonov กับการถดถอยของสันเขา แรงบันดาลใจจากการสนทนาทางประวัติศาสตร์ที่นี่ฉันคิดว่ามันอาจจะมีประโยชน์ในการเพิ่มตัวอย่างสั้น ๆ ที่แสดงให้เห็นว่ากรอบ Tikhonov ทั่วไปมากขึ้นจะมีประโยชน์

ก่อนอื่นทราบสั้น ๆ เกี่ยวกับบริบท การถดถอยของสันเขาเกิดขึ้นในสถิติและในขณะที่การทำให้เป็นระเบียบเป็นที่แพร่หลายในสถิติและการเรียนรู้ของเครื่องวิธีการของ Tikhonov นั้นได้รับแรงบันดาลใจมาจากปัญหาผกผันที่เกิดขึ้นในการดูดกลืนข้อมูลตามแบบจำลอง(โดยเฉพาะในธรณีฟิสิกส์ ) ตัวอย่างแบบง่ายด้านล่างนี้อยู่ในหมวดหมู่นี้ (มีการใช้เวอร์ชันที่ซับซ้อนมากขึ้นสำหรับการสร้างไทพาซิลิเมท )


ลองนึกภาพที่เราต้องการที่จะสร้างอุณหภูมิในอดีตที่ผ่านมาขึ้นอยู่กับการตรวจวัดวันปัจจุบันT] ในรูปแบบที่เรียบง่ายของเราที่เราจะสมมติว่าวิวัฒนาการอุณหภูมิตามสมการความร้อน ใน 1D กับเงื่อนไขขอบเขตระยะ ง่าย (อย่างชัดเจน) จำกัด แตกต่างวิธี นำไปสู่รูปแบบที่ไม่ต่อเนื่อง ทางคณิตศาสตร์วิวัฒนาการเมทริกซ์กลับด้านดังนั้นเราจึงมี อย่างไรก็ตามตัวเลขu [ x , t = T ] u t = u x x u [ x + L , t ] = u [ x , t ] Δ uยู[x,เสื้อ=0]ยู[x,เสื้อ=T]

ยูเสื้อ=ยูxx
ยู[x+L,เสื้อ]=ยู[x,เสื้อ]
A u t = A - 1 u t + 1 T
ΔยูΔเสื้อ=LยูΔx2ยูเสื้อ+1=Aยูเสื้อ
A
ยูเสื้อ=A-1ยูเสื้อ+1
ความยากลำบากจะเกิดขึ้นหากช่วงเวลายาวเกินไปT

การทำให้เป็นมาตรฐาน Tikhonov สามารถแก้ปัญหานี้ได้โดยการแก้ ซึ่งจะเพิ่มขนาดเล็กโทษบนความหยาบ{xx} ω2«1Uxx

Aยูเสื้อยูเสื้อ+1ωLยูเสื้อ0
ω2«1ยูxx

ด้านล่างเป็นการเปรียบเทียบผลลัพธ์:

Tikhonov vs. Checkerboard

เราจะเห็นได้ว่าอุณหภูมิเดิมมีรายละเอียดเรียบซึ่งเป็นที่เรียบยังคงต่อไปโดยการแพร่เพื่อให้{} การผกผันโดยตรงไม่สามารถกู้คืนและโซลูชันแสดงสิ่งประดิษฐ์"หมากฮอส" ที่แข็งแกร่ง อย่างไรก็ตามโซลูชัน Tikhonovสามารถกู้คืนด้วยความแม่นยำที่ค่อนข้างดีu f w d u 0 u ฉันn v u r e g u 0ยู0ยูWdยู0ยูผมnโวลต์ยูRอีgยู0

โปรดทราบว่าในตัวอย่างนี้การถดถอยของสันเขาจะผลักดันโซลูชันของเราไปสู่ ​​"ยุคน้ำแข็ง" (เช่นอุณหภูมิที่เป็นศูนย์) Tikhonov ถดถอยช่วยให้เรามีความยืดหยุ่นมากขึ้นร่างกายจำกัด ก่อนชั่น: ที่นี่โทษของเราเป็นหลักว่าการฟื้นฟูควรจะค่อย ๆ พัฒนาคือ{0}ยูที0ยูยูเสื้อ0


ตัวอย่างรหัส Matlab ด้านล่าง (สามารถเรียกใช้ออนไลน์ได้ที่นี่ )

% Tikhonov Regularization Example: Inverse Heat Equation
n=15; t=2e1; w=1e-2; % grid size, # time steps, regularization
L=toeplitz(sparse([-2,1,zeros(1,n-3),1]/2)); % laplacian (periodic BCs)
A=(speye(n)+L)^t; % forward operator (diffusion)
x=(0:n-1)'; u0=sin(2*pi*x/n); % initial condition (periodic & smooth)
ufwd=A*u0; % forward model
uinv=A\ufwd; % inverse model
ureg=[A;w*L]\[ufwd;zeros(n,1)]; % regularized inverse
plot(x,u0,'k.-',x,ufwd,'k:',x,uinv,'r.:',x,ureg,'ro');
set(legend('u_0','u_{fwd}','u_{inv}','u_{reg}'),'box','off');

คำชมทั้งหมดได้รับอย่างอบอุ่น มันเป็นสิ่งที่คุ้มค่าที่จะกล่าวถึงแม้ว่าจะเป็นเรื่องเล็กน้อยก็ตามทั้ง Tikhonov normalization และridge regressionสามารถใช้สำหรับการกำหนดเป้าหมายการถดถอยทางกายภาพ (+1)
Carl

2
@Carl นี้เป็นจริงอย่างแน่นอน เราสามารถใช้มันได้ที่นี่โดยการเปลี่ยนตัวแปรเป็น ! (โดยทั่วไปปัญหา Tikhonov ใด ๆ ที่มีเมทริกซ์ Tikhonov invertible สามารถเปลี่ยนเป็นการถดถอยแบบสันได้)โวลต์=Lยู
GeoMatt22
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.