ฉันจะนำหน้าสิ่งนี้โดยบอกว่ามันไม่ชัดเจนเสมอไปว่า "nonparametric" หรือ "semiparametric" หมายถึงอะไรในความคิดเห็นดูเหมือนว่า whuber มีคำจำกัดความที่เป็นทางการอยู่ในใจจากบางครอบครัว { M θ : θ ∈ θ }ที่ θเป็นอนันต์มิติ) แต่ฉันจะเป็นทางการสวย บางคนอาจแย้งว่าวิธีที่ไม่ใช่พารามิเตอร์นั้นเป็นวิธีที่จำนวนพารามิเตอร์ที่มีประสิทธิภาพที่คุณใช้เพิ่มขึ้นกับข้อมูล ฉันคิดว่ามีวิดีโอใน videolectures.net ซึ่ง (ฉันคิดว่า) ปีเตอร์ออร์แบนซ์ให้เวลาสี่หรือห้าวิธีในการกำหนด "nonparametric"Mθ{Mθ:θ∈Θ}Θ
เนื่องจากฉันคิดว่าฉันรู้ว่าสิ่งที่คุณมีอยู่ในใจสำหรับความเรียบง่ายฉันจะสมมติว่าคุณกำลังพูดถึงการใช้กระบวนการแบบเกาส์สำหรับการถดถอยโดยทั่วไป: เรามีข้อมูลการฝึกอบรมและเรามีความสนใจในการสร้างแบบจำลองเงื่อนไขเฉลี่ยE ( Y | X = x ) : = F ( x ) เราเขียน
Y i = f ( X i )(Yi,Xi),i=1,...,nE(Y|X=x):=f(x)
และบางทีเราก็กล้าที่จะสมมติว่า ϵ iเป็น iid และกระจายแบบปกติ, ϵ
Yi=f(Xi)+ϵi
ϵi )
X iจะเป็นหนึ่งมิติ แต่ทุกอย่างจะนำไปสู่มิติที่สูงกว่า
ϵi∼N(0,σ2)Xi
ถ้าเราสามารถใช้ค่าในความต่อเนื่องแล้วf ( ⋅ )อาจจะคิดว่าเป็นพารามิเตอร์ของ (uncountably) มิติอนันต์ ดังนั้นในแง่ที่ว่าเรากำลังประเมินพารามิเตอร์ของมิติที่ไม่มีที่สิ้นสุดปัญหาของเราคือหนึ่งที่ไม่ใช่พารามิเตอร์ มันเป็นความจริงที่ว่าวิธีการแบบเบย์มีพารามิเตอร์บางอย่างลอยอยู่ที่นี่และที่นั่น แต่จริงๆแล้วมันเรียกว่า nonparametric เพราะเราประมาณบางอย่างของมิติที่ไม่มีที่สิ้นสุด GP ระดับสูงที่เราใช้กำหนดมวลให้กับทุกย่านของทุกฟังก์ชั่นต่อเนื่องเพื่อให้พวกเขาสามารถประเมินฟังก์ชันต่อเนื่องใด ๆ ก็ได้ตามอำเภอใจXif(⋅)
สิ่งที่อยู่ในฟังก์ชั่นความแปรปรวนร่วมนั้นมีบทบาทคล้ายกับพารามิเตอร์การปรับให้เรียบในตัวประมาณความถี่แบบปกติ - เพื่อให้ปัญหาไม่สิ้นหวังอย่างแท้จริงเราต้องสมมติว่ามีโครงสร้างบางอย่างที่เราคาดว่าจะเห็นจัดแสดง f Bayesians ทำสิ่งนี้ให้สำเร็จโดยใช้ก่อนบนพื้นที่ของฟังก์ชันต่อเนื่องในรูปแบบของกระบวนการ Gaussian จากมุมมองแบบเบย์เรากำลังเข้ารหัสความเชื่อเกี่ยวกับ fโดยสมมติว่า fถูกดึงมาจาก GP ด้วยฟังก์ชันความแปรปรวนร่วมเช่นนั้น ก่อนหน้านี้ได้อย่างมีประสิทธิภาพลงโทษประมาณการของ fที่ซับซ้อนเกินไปffff
แก้ไขสำหรับปัญหาการคำนวณ
ส่วนใหญ่ (ทั้งหมด?) ของสิ่งนี้อยู่ในหนังสือ Gaussian Process โดย Rasmussen และ Williams
ปัญหาการคำนวณเป็นเรื่องยุ่งยากสำหรับจีพีเอส หากเราดำเนินการอย่างไม่เร่งรีบเราจะต้องใช้หน่วยความจำขนาดเพียงเพื่อเก็บเมทริกซ์ความแปรปรวนร่วมและ (ปรากฎ)การดำเนินการO ( N 3 )เพื่อกลับด้าน มีบางสิ่งที่เราสามารถทำได้เพื่อทำให้สิ่งต่าง ๆ เป็นไปได้มากขึ้น ทางเลือกหนึ่งคือการสังเกตว่าผู้ชายที่เราต้องการจริงๆคือvวิธีแก้ปัญหา( K + σ 2 I ) v = Yโดยที่Kคือเมทริกซ์ความแปรปรวนร่วม วิธีการไล่ระดับสีคอนจูเกตจะแก้ปัญหานี้ในO ( N 3 )O(N2)O(N3)v(K+σ2I)v=YKO(N3)kO(kN2)K
O(N3)O(kN2)Nmm×mYNของสิ่งที่อยู่ห่างออกไปและเราลงไปที่การคำนวณ O ( m 2 N )mO(m2N)
มีตัวเลือกอื่น ๆ ให้เลือกสองตัว เราสามารถสร้างการประมาณระดับต่ำให้กับและตั้งค่าK = Q Q Tโดยที่Qคือn × qและอันดับq ; มันกลับกลายเป็นK + σ 2 Iในกรณีนี้สามารถทำได้โดยการกลับไปทำQ T Q + σ 2 Iแทน อีกทางเลือกหนึ่งคือการเลือกฟังก์ชั่นความแปรปรวนร่วมที่จะกระจัดกระจายและใช้วิธีการไล่ระดับสีแบบคอนจูเกต - หากเมทริกซ์ความแปรปรวนร่วมมีความเบาบางมากดังนั้นสิ่งนี้สามารถเพิ่มความเร็วในการคำนวณได้อย่างมากKK=QQTQn×qqK+σ2IQTQ+σ2I