เหตุผลของฟังก์ชันความแปรปรวนMatérnคืออะไร?


19

ฟังก์ชันความแปรปรวนร่วมMatérnมักใช้เป็นฟังก์ชันเคอร์เนลในกระบวนการแบบเกาส์เซียน มันถูกกำหนดเช่นนี้

Cν(d)=σ221νΓ(ν)(2νdρ)νKν(2νdρ)

โดยที่dคือฟังก์ชันระยะทาง (เช่น Euclidean distance), Γคือฟังก์ชันแกมม่า, Kνคือฟังก์ชัน Bessel ที่แก้ไขของชนิดที่สอง, ρและνเป็นพารามิเตอร์เชิงบวก νใช้เวลานานมากในการเลือกเป็น32หรือ52ในทางปฏิบัติ

หลายครั้งที่เคอร์เนลนี้ทำงานได้ดีกว่าเคอร์เนล Gaussian มาตรฐานเนื่องจาก 'ราบรื่นน้อย' แต่ยกเว้นว่ามีเหตุผลอื่นอีกไหมทำไมจึงเลือกใช้เคอร์เนลนี้ สัญชาตญาณทางเรขาคณิตบางอย่างเกี่ยวกับวิธีการทำงานหรือคำอธิบายของสูตรลับที่ดูเหมือนจะได้รับการชื่นชมอย่างมาก

คำตอบ:


18

นอกจากคำตอบที่ดีของ @DahnJahn ฉันคิดว่าฉันจะพยายามพูดเพิ่มเติมเกี่ยวกับหน้าที่ของ Bessel และแกมม่าที่มาจาก จุดเริ่มต้นหนึ่งสำหรับการมาถึงฟังก์ชั่นความแปรปรวนร่วมคือทฤษฎีบทของ Bochner

ทฤษฎีบท (Bochner)ฟังก์ชั่นนิ่งต่อเนื่องk(x,y)=k~(|xy|)เป็นบวกแน่นอนถ้าหาก k~คือการแปลงฟูริเยร์ของการวัดเชิงบวกอัน จำกัด :

k~(t)=Reiωtdµ(ω)

จากนี้คุณสามารถอนุมานได้ว่าเมทริกซ์ความแปรปรวนร่วมMatérnนั้นได้มาจากการแปลงฟูริเยร์ (ที่มา)1(1+ω2)p ทั้งหมดนี้เป็นสิ่งที่ดี แต่มันไม่ได้บอกเราว่าคุณมาถึงมาตรการเชิงบวกอัน จำกัด นี้โดย1(1+ω2)pพี มันคือความหนาแน่นสเปกตรัม (กำลัง) ของกระบวนการสุ่มf(x) )

ซึ่งกระบวนการสุ่ม? เป็นที่รู้จักกันว่าเป็นกระบวนการที่สุ่มRdกับฟังก์ชั่นความแปรปรวน Matern เป็นวิธีการแก้สมการเชิงอนุพันธ์สุ่มบางส่วน (SPDE)

(κ2)α/2X(s)=φW(s),
ที่W(s)คือเสียงรบกวนแบบเกาส์เซียนที่มีความแปรปรวนของหน่วย,
Δ=i=1d2xi2
เป็นโอเปอเรเตอร์ Laplace และα=ν+d/2(ฉันคิดว่านี่เป็นCressie และ Wikle )

ทำไมต้องเลือก SPDE / กระบวนการสุ่มนี้ ต้นกำเนิดอยู่ในสถิติเชิงพื้นที่ซึ่งเป็นที่ถกเถียงกันอยู่ว่าเป็นความแปรปรวนที่ง่ายที่สุดและเป็นธรรมชาติซึ่งทำงานได้ดีในR2 :

ฟังก์ชันความสัมพันธ์แบบเอ็กซ์โปเนนเชียลเป็นความสัมพันธ์ตามธรรมชาติในหนึ่งมิติเนื่องจากสอดคล้องกับกระบวนการมาร์คอฟ ในสองมิติสิ่งนี้จะไม่เป็นเช่นนั้นอีกต่อไปแม้ว่าฟังก์ชันเลขชี้กำลังเป็นฟังก์ชันสหสัมพันธ์ทั่วไปในงานธรณีศาสตร์ Whittle (1954) กำหนดความสัมพันธ์ที่สอดคล้องกับสมการเชิงอนุพันธ์สุ่มของ Laplace type:

โดยที่ϵเป็นเสียงสีขาว กระบวนการขัดแตะโดยสิ้นเชิงที่สอดคล้องกันเป็น autoregression ลำดับที่สอง (ที่มา)

[(t1)2+(t2)2κ2]X(t1,t2)=ϵ(t1,t2)
ϵ

ตระกูลของกระบวนการที่รวมอยู่ใน SDE ที่เกี่ยวข้องกับสมการของแม่ ได้แก่โมเดล Ornstein-Uhlenbeck ของความเร็วของอนุภาคที่เคลื่อนไหวภายใต้การเคลื่อนที่แบบบราวเนียน โดยทั่วไปคุณสามารถกำหนดสเปกตรัมพลังงานสำหรับกระบวนการA R ( p )สำหรับทุกๆจำนวนเต็มpซึ่งมีค่าความแปรปรวนร่วมของครอบครัวMatérnด้วย นี่คือภาคผนวกของ Rasmussen และ WilliamsAR(1)AR(p)p

ฟังก์ชันความแปรปรวนร่วมนี้ไม่เกี่ยวข้องกับกระบวนการคลัสเตอร์Matérn

อ้างอิง

Cressie, Noel และ Christopher K. Wikle สถิติสำหรับข้อมูลเชิงพื้นที่ John Wiley & Sons ปี 2015

Guttorp, Peter และ Tilmann Gneiting "การศึกษาในประวัติศาสตร์ของความน่าจะเป็นและสถิติ XLIX ในตระกูลสหสัมพันธ์แม่" Biometrika 93.4 (2549): 989-995

Rasmussen, CE และ Williams, กระบวนการ CKI Gaussian สำหรับการเรียนรู้ของเครื่อง สำนักพิมพ์ MIT, 2006


2
ในกรณีหนึ่งมิติที่แปรปรวน Matern มีรูปร่างกับพีจำนวนเต็มบวกเป็นที่ของเวลาอย่างต่อเนื่องกระบวนการอัตCAR ( พี)ของการสั่งซื้อหน้า อย่างไรก็ตามไม่ใช่รุ่นCAR ( p ) ทั้งหมดที่มีความแปรปรวนร่วมของแม่ ν=p1/2pCAR(p)pCAR(p)
Yves

นั่นเป็นความเข้าใจผิดที่ชัดเจนในส่วนของฉันฉันจะอัปเดตคำตอบ ขอขอบคุณ!
MachineEpsilon

16

ฉันไม่รู้ แต่ฉันพบว่าคำถามนี้น่าสนใจมากและนี่คือสิ่งที่ฉันได้รับหลังจากอ่านหนังสือเล็กน้อย

สำหรับค่าบางอย่างของฟังก์ชันMatérn covariance สามารถแสดงเป็นผลิตภัณฑ์ของเลขชี้กำลังและพหุนาม เช่นสำหรับν = 5 / 2 : C 5 / 2 ( d ) = σ 2 ( 1 + νν=5/2 แล้วมันเป็นไม่มากเกินไปน่าแปลกใจว่าเป็นν→การ,Cร่างกาย *จริงลู่ไปGaussian RBF: Limν→การCν(d)=σ2ประสบการณ์(-d2

C5/2(d)=σ2(1+5dρ+5d23ρ2)exp(5dρ)
νCν สำหรับν=1/2, ฟังก์ชั่นความแปรปรวน Matern ให้แน่นอนชี้แจงเคอร์เนล C1/2(d)=σ2ประสบการณ์(-d
limνCν(d)=σ2exp(d22ρ2)
ν=1/2
C1/2(d)=σ2exp(dρ)

νν1อนุพันธ์

นี่เป็นภาพที่แสดงให้เห็นอย่างชัดเจนจากRasmussen & Williams (2006) C. E. Rasmussen & C. K. I. Williams, Gaussian Processes for Machine Learning, the MIT Press, 2006,ISBN 026218253X. c 2006 Massachusetts Institute of Technology. www.GaussianProcess.org/gpml

ในการแก้ไขข้อมูลเชิงพื้นที่สไตน์ (ผู้เสนอชื่อจริงของฟังก์ชันความแปรปรวนMatérn) ระบุ (หน้า 30) ว่าความแตกต่างที่ไม่สิ้นสุดของฟังก์ชันความแปรปรวนแบบเกาส์ทำให้เกิดผลลัพธ์ที่ไม่สมจริงเนื่องจากกระบวนการทางกายภาพเพียงเล็กน้อย ตามทฤษฎีอวกาศ / เวลาควรทำหน้าที่ทั้งหมด ดังนั้นเขาจึงเสนอรุ่นMatérnเป็นลักษณะทั่วไปที่สามารถจับคู่กระบวนการทางกายภาพได้สมจริงยิ่งขึ้น

สรุป

ν )

ν


1
(+1) ฉันอยากรู้ว่ามีคำอธิบายหรือความเป็นมาของฟังก์ชันความแปรปรวนร่วมนี้ในหนังสือของMatérn pub.epsilon.slu.se/10033/1/หรือไม่? ฉันไม่สามารถค้นหาได้จนถึงตอนนี้ ฟังก์ชั่นความแปรปรวนร่วมนี้ดูเหมือนว่าจะมีสถานที่ที่โดดเด่นมากในหนังสือของสไตน์ดังนั้นฉันอยากรู้มากกว่านี้
MachineEpsilon

@Machineepsilon Matérnทุกคนพูดถึงจริง ๆ / กำหนดฟังก์ชั่นหรือไม่? ฉันได้รับความรู้สึกจากหนังสือของสไตน์ว่าเขาเป็นคนหนึ่งที่ได้มากับหนังสือเล่มนี้และตั้งชื่อตามMatérn
Dahn

ฉันไม่แน่ใจว่าเป็นสิ่งที่ฉันต้องการค้นหา! ฉันจะลองดูสิเพราะรัสมุสเซนอ้างอิงหนังสือด้วย
MachineEpsilon
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.