ทำไมแบบจำลองกระบวนการเกาส์เซียนเรียกว่าไม่ใช่พารามิเตอร์?


26

ฉันสับสนเล็กน้อย ทำไมกระบวนการแบบเกาส์ที่เรียกว่าตัวแบบไม่ใช่พารามิเตอร์?

พวกเขาคิดว่าค่าการทำงานหรือส่วนย่อยของพวกเขามีเกาส์ก่อนหน้าด้วยค่าเฉลี่ย 0 และฟังก์ชันความแปรปรวนร่วมที่กำหนดให้เป็นฟังก์ชั่นเคอร์เนล ฟังก์ชั่นเคอร์เนลเหล่านี้มีพารามิเตอร์บางตัว (เช่นไฮเปอร์พารามิเตอร์)

เหตุใดพวกเขาจึงเรียกว่าแบบจำลองที่ไม่ใช่พารามิเตอร์


1
ฉันรู้ถึงคำจำกัดความหลายประการของ "กระบวนการแบบเกาส์เซียน" ดังนั้นจึงไม่ชัดเจนว่าคำถามของคุณถามมาอย่างไร แต่เมื่อคุณพิจารณาวิธีการทำให้กระจ่างแจ้งให้ถามตัวคุณเองว่า: คุณจะทำให้กระบวนการของเกาส์เซียนเป็นไปได้อย่างไร หากคุณไม่สามารถทำได้ด้วยวิธีที่เป็นธรรมชาติโดยมีจำนวนพารามิเตอร์ที่แน่นอนจำนวน จำกัด ก็ควรได้รับการพิจารณาว่าไม่ใช่พารามิเตอร์
whuber

@whuber AFAIK พารามิเตอร์หลักของกระบวนการแบบเกาส์คือค่าเฉลี่ยและฟังก์ชันความแปรปรวนร่วม แต่เมื่อเราเพิ่มจุดข้อมูลต่อไป ดังนั้นมันจึงเพิ่มขึ้นเรื่อย ๆ นั่นเป็นเหตุผลที่กระบวนการเกาส์เซียนถูกเรียกว่าไม่ใช่พารามิเตอร์?
user34790

@ โฮเบอร์ถ้าฉันมีคะแนนข้อมูลการฝึกนับล้านจุดดังนั้น GP ของฉัน ~ ~ ~ ~ ~ ~ ~ ~ (m, k) จะเป็นการแจกแจงแบบเกาส์หลายมิติหลายมิติ มันไม่ใหญ่เกินไปใช่ไหม ฉันหมายความว่าเมื่อข้อมูลการฝึกอบรมใหม่มามากขึ้นเรื่อย ๆ มันไม่ก่อให้เกิดปัญหาการคำนวณหรือไม่?
user34790

1
"Parametric" กับ "non-parametric" เป็นคำศัพท์ที่ไม่ได้ใช้กับกระบวนการเฉพาะ: มันใช้กับทั้งตระกูลของกระบวนการที่อาจเหมาะสมกับข้อมูล แม้ว่าฉันจะยังไม่ทราบว่าคุณมีครอบครัวอยู่ในใจ แต่ดูเหมือนว่าจำนวนพารามิเตอร์อาจมี จำกัด ในทุกสถานการณ์ แต่ไม่มีการ จำกัด จำนวนพารามิเตอร์ที่อาจปรากฏระหว่างสมาชิกในครอบครัว : เออร์โกปัญหา ไม่ใช่แบบพารามิเตอร์
whuber

คำตอบ:


20

ฉันจะนำหน้าสิ่งนี้โดยบอกว่ามันไม่ชัดเจนเสมอไปว่า "nonparametric" หรือ "semiparametric" หมายถึงอะไรในความคิดเห็นดูเหมือนว่า whuber มีคำจำกัดความที่เป็นทางการอยู่ในใจจากบางครอบครัว { M θ : θ θ }ที่ θเป็นอนันต์มิติ) แต่ฉันจะเป็นทางการสวย บางคนอาจแย้งว่าวิธีที่ไม่ใช่พารามิเตอร์นั้นเป็นวิธีที่จำนวนพารามิเตอร์ที่มีประสิทธิภาพที่คุณใช้เพิ่มขึ้นกับข้อมูล ฉันคิดว่ามีวิดีโอใน videolectures.net ซึ่ง (ฉันคิดว่า) ปีเตอร์ออร์แบนซ์ให้เวลาสี่หรือห้าวิธีในการกำหนด "nonparametric"Mθ{Mθ:θΘ}Θ

เนื่องจากฉันคิดว่าฉันรู้ว่าสิ่งที่คุณมีอยู่ในใจสำหรับความเรียบง่ายฉันจะสมมติว่าคุณกำลังพูดถึงการใช้กระบวนการแบบเกาส์สำหรับการถดถอยโดยทั่วไป: เรามีข้อมูลการฝึกอบรมและเรามีความสนใจในการสร้างแบบจำลองเงื่อนไขเฉลี่ยE ( Y | X = x ) : = F ( x ) เราเขียน Y i = f ( X i )(Yi,Xi),i=1,...,nE(Y|X=x):=f(x) และบางทีเราก็กล้าที่จะสมมติว่า ϵ iเป็น iid และกระจายแบบปกติ, ϵ

Yi=f(Xi)+ϵi
ϵผม ) X iจะเป็นหนึ่งมิติ แต่ทุกอย่างจะนำไปสู่มิติที่สูงกว่าϵiN(0,σ2)Xi

ถ้าเราสามารถใช้ค่าในความต่อเนื่องแล้วf ( )อาจจะคิดว่าเป็นพารามิเตอร์ของ (uncountably) มิติอนันต์ ดังนั้นในแง่ที่ว่าเรากำลังประเมินพารามิเตอร์ของมิติที่ไม่มีที่สิ้นสุดปัญหาของเราคือหนึ่งที่ไม่ใช่พารามิเตอร์ มันเป็นความจริงที่ว่าวิธีการแบบเบย์มีพารามิเตอร์บางอย่างลอยอยู่ที่นี่และที่นั่น แต่จริงๆแล้วมันเรียกว่า nonparametric เพราะเราประมาณบางอย่างของมิติที่ไม่มีที่สิ้นสุด GP ระดับสูงที่เราใช้กำหนดมวลให้กับทุกย่านของทุกฟังก์ชั่นต่อเนื่องเพื่อให้พวกเขาสามารถประเมินฟังก์ชันต่อเนื่องใด ๆ ก็ได้ตามอำเภอใจXif()

สิ่งที่อยู่ในฟังก์ชั่นความแปรปรวนร่วมนั้นมีบทบาทคล้ายกับพารามิเตอร์การปรับให้เรียบในตัวประมาณความถี่แบบปกติ - เพื่อให้ปัญหาไม่สิ้นหวังอย่างแท้จริงเราต้องสมมติว่ามีโครงสร้างบางอย่างที่เราคาดว่าจะเห็นจัดแสดง f Bayesians ทำสิ่งนี้ให้สำเร็จโดยใช้ก่อนบนพื้นที่ของฟังก์ชันต่อเนื่องในรูปแบบของกระบวนการ Gaussian จากมุมมองแบบเบย์เรากำลังเข้ารหัสความเชื่อเกี่ยวกับ fโดยสมมติว่า fถูกดึงมาจาก GP ด้วยฟังก์ชันความแปรปรวนร่วมเช่นนั้น ก่อนหน้านี้ได้อย่างมีประสิทธิภาพลงโทษประมาณการของ fที่ซับซ้อนเกินไปffff

แก้ไขสำหรับปัญหาการคำนวณ

ส่วนใหญ่ (ทั้งหมด?) ของสิ่งนี้อยู่ในหนังสือ Gaussian Process โดย Rasmussen และ Williams

ปัญหาการคำนวณเป็นเรื่องยุ่งยากสำหรับจีพีเอส หากเราดำเนินการอย่างไม่เร่งรีบเราจะต้องใช้หน่วยความจำขนาดเพียงเพื่อเก็บเมทริกซ์ความแปรปรวนร่วมและ (ปรากฎ)การดำเนินการO ( N 3 )เพื่อกลับด้าน มีบางสิ่งที่เราสามารถทำได้เพื่อทำให้สิ่งต่าง ๆ เป็นไปได้มากขึ้น ทางเลือกหนึ่งคือการสังเกตว่าผู้ชายที่เราต้องการจริงๆคือvวิธีแก้ปัญหา( K + σ 2 I ) v = Yโดยที่Kคือเมทริกซ์ความแปรปรวนร่วม วิธีการไล่ระดับสีคอนจูเกตจะแก้ปัญหานี้ในO ( N 3 )O(N2)O(N3)v(K+σ2I)v=YKO(N3)kO(kN2)K

O(N3)O(kN2)Nmm×mYNของสิ่งที่อยู่ห่างออกไปและเราลงไปที่การคำนวณ O ( m 2 N )mO(m2N)

มีตัวเลือกอื่น ๆ ให้เลือกสองตัว เราสามารถสร้างการประมาณระดับต่ำให้กับและตั้งค่าK = Q Q Tโดยที่Qคือn × qและอันดับq ; มันกลับกลายเป็นK + σ 2 Iในกรณีนี้สามารถทำได้โดยการกลับไปทำQ T Q + σ 2 Iแทน อีกทางเลือกหนึ่งคือการเลือกฟังก์ชั่นความแปรปรวนร่วมที่จะกระจัดกระจายและใช้วิธีการไล่ระดับสีแบบคอนจูเกต - หากเมทริกซ์ความแปรปรวนร่วมมีความเบาบางมากดังนั้นสิ่งนี้สามารถเพิ่มความเร็วในการคำนวณได้อย่างมากKK=QQTQn×qqK+σ2IQTQ+σ2I


8

โดยทั่วไปแล้ว "nonparametric" ใน nonesametrics แบบเบย์หมายถึงโมเดลที่มีพารามิเตอร์ (ที่มีศักยภาพ) จำนวนนับไม่ถ้วน มีบทเรียนและการบรรยายที่ดีมากมายเกี่ยวกับ videolectures.net ( เช่นนี้ ) ซึ่งให้ภาพรวมที่ดีของโมเดลรุ่นนี้

โดยเฉพาะกระบวนการเกาส์เซียน (GP) ถือเป็นแบบไม่พารามิเตอร์เนื่องจาก GP หมายถึงฟังก์ชั่น (เช่นเวกเตอร์ขนาดอนันต์) เมื่อจำนวนจุดข้อมูลเพิ่มขึ้น ((x, f (x)) คู่) ดังนั้นจำนวนของพารามิเตอร์ 'พารามิเตอร์' (จำกัด รูปร่างของฟังก์ชัน) ซึ่งแตกต่างจากตัวแบบพารามิเตอร์ซึ่งจำนวนพารามิเตอร์ยังคงได้รับการแก้ไขตามขนาดของข้อมูลในตัวแบบที่ไม่ใช่พารามิเตอร์จำนวนพารามิเตอร์จะเพิ่มขึ้นตามจำนวนจุดข้อมูล


นี่คือสิ่งที่ฉันคิดเอาไว้ ดังนั้นสมมติฐานของฉันถูกต้องฉันเดา แต่คำถามของฉันคือถ้าฉันมีล้านคะแนน (ข้อมูลที่สังเกต) จากนั้น f ของฉันจะเป็นล้านส่วนด้วย ดังนั้นฉันจะไม่มีปัญหาการคำนวณ เมทริกซ์ความแปรปรวนร่วมของฉันต่อไปจะมีขนาด 1 ล้านล้าน x 1 ล้านล้าน แล้วฉันควรทำอย่างไรในกรณีนี้?
user34790

@ user34790 ใช่คุณจะมีปัญหาการคำนวณ ความท้าทายในการคำนวณนั้นเป็นเรื่องใหญ่สำหรับจีพีเอส Rasmussen และ Williams มีหนังสือเกี่ยวกับ GP ที่มีทั้งบทที่เกี่ยวกับเรื่องนี้และถ้าคุณ google ยากพอที่คุณจะหาหนังสือออนไลน์ได้ฟรี ดูโพสต์ที่อัปเดตของฉันสำหรับรายละเอียดเล็กน้อย
คนที่แต่งตัวประหลาด

1

พารามิเตอร์ที่คุณเรียกว่าพารามิเตอร์ไฮเปอร์พารามิเตอร์ไม่ได้เป็นแรงจูงใจทางร่างกายและดังนั้นชื่อ พวกเขาจะใช้พารามิเตอร์ของฟังก์ชันเคอร์เนล ตัวอย่างในเคอร์เนลเกาส์เซียน:

K(xi,xj)=h2exp((xixj)2λ2)

hλ

ปัญหานี้ได้รับการแก้ไขในการบรรยายครั้งนี้เช่นกันอาจช่วยให้เข้าใจมากขึ้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.