การกระจายตัวของฟังก์ชั่นคืออะไร?


15

ฉันกำลังอ่านตำราGaussian Process สำหรับการเรียนรู้ของเครื่องโดย CE Rasmussen และ CKI Williams และฉันมีปัญหาในการทำความเข้าใจว่าการกระจายตัวของฟังก์ชั่นนั้นมีความหมายว่าอย่างไร ในหนังสือเรียนยกตัวอย่างให้ใครคิดว่าฟังก์ชั่นเป็นเวกเตอร์ที่ยาวมาก ๆ (อันที่จริงแล้วมันควรจะยาวไม่สิ้นสุด?) ดังนั้นผมจึงจินตนาการว่าการกระจายตัวของฟังก์ชันจะเป็นการแจกแจงความน่าจะเป็นแบบ "เหนือ" ค่าเวกเตอร์เช่นนั้น มันจะเป็นความน่าจะเป็นที่ฟังก์ชันจะใช้ค่านี้หรือไม่? หรือเป็นความน่าจะเป็นที่ฟังก์ชันจะใช้ค่าที่อยู่ในช่วงที่กำหนดหรือไม่? หรือการกระจายตัวของฟังก์ชั่นคือความน่าจะเป็นที่กำหนดให้กับทั้งฟังก์ชัน?

คำพูดจากตำราเรียน:

บทที่ 1: บทนำหน้า 2

กระบวนการเกาส์เซียนเป็นการแจกแจงความน่าจะเป็นแบบเกาส์ ในขณะที่การแจกแจงความน่าจะเป็นอธิบายตัวแปรสุ่มซึ่งเป็นสเกลาร์หรือเวกเตอร์ (สำหรับการแจกแจงหลายตัวแปร) กระบวนการสโทคาสติกจะควบคุมคุณสมบัติของฟังก์ชัน ออกจากความซับซ้อนทางคณิตศาสตร์กันเราสามารถคิดฟังก์ชั่นเป็นเวกเตอร์ที่ยาวมาก ๆ อย่างอิสระแต่ละรายการในเวกเตอร์ที่ระบุค่าฟังก์ชัน f (x) ที่อินพุตเฉพาะ x ปรากฎว่าแม้ว่าความคิดนี้จะไร้เดียงสาเพียงเล็กน้อย แต่ก็ใกล้เคียงกับสิ่งที่เราต้องการ อันที่จริงคำถามของวิธีที่เราจัดการกับวัตถุมิติที่ไม่มีที่สิ้นสุดเหล่านี้มีความละเอียดที่น่าพอใจมากที่สุดเท่าที่จะเป็นไปได้: ถ้าคุณถามคุณสมบัติของฟังก์ชั่นที่มีจำนวน จำกัด เท่านั้น

บทที่ 2: การถดถอยหน้า 7

มีหลายวิธีในการตีความโมเดลการถดถอยแบบเกาส์กระบวนการ (GP) เราสามารถคิดถึงกระบวนการเกาส์เซียนในการกำหนดการกระจายผ่านฟังก์ชั่นและการอนุมานที่เกิดขึ้นโดยตรงในพื้นที่ของฟังก์ชั่นมุมมองพื้นที่ฟังก์ชั่น


จากคำถามแรก:

ฉันทำภาพแนวคิดนี้เพื่อลองนึกภาพสิ่งนี้ด้วยตัวเอง ฉันไม่แน่ใจว่าคำอธิบายที่ฉันทำเพื่อตัวเองนั้นถูกต้องหรือไม่

ป้อนคำอธิบายรูปภาพที่นี่


หลังจากการอัพเดต:

หลังจากคำตอบของGijsฉันได้อัปเดตรูปภาพให้เป็นแนวคิดมากกว่านี้:

ป้อนคำอธิบายรูปภาพที่นี่


3
ตรวจสอบสิ่งนี้เพื่อคำอธิบายที่เข้าใจง่ายjgoertler.com/visual-exploration-gaussian-processes
bicepjai

คำตอบ:


11

แนวคิดนี้มีความเป็นนามธรรมมากกว่าการแจกแจงแบบปกติ ปัญหาคือเราคุ้นเคยกับแนวคิดของการแจกแจงRโดยทั่วไปแล้วจะแสดงเป็นเส้นแล้วขยายมันไปยังพื้นผิวR2และอื่น ๆ เพื่อการกระจายตัวRn n แต่ไม่สามารถแสดงพื้นที่ของฟังก์ชันเป็นรูปสี่เหลี่ยมจัตุรัสหรือเส้นหรือเวกเตอร์ได้ มันไม่ได้เป็นความผิดทางอาญาที่จะคิดว่ามันเป็นอย่างนั้นเหมือนที่คุณทำ แต่ทฤษฎีที่ทำงานในRn , ต้องทำอย่างไรกับระยะละแวกใกล้เคียงและเช่น (ซึ่งเป็นที่รู้จักกันเป็นโครงสร้างของพื้นที่) จะไม่เหมือนกันใน พื้นที่ของฟังก์ชั่น ดังนั้นการวาดมันเป็นรูปสี่เหลี่ยมจัตุรัสสามารถให้ความรู้ผิดเกี่ยวกับพื้นที่นั้นได้

คุณสามารถนึกถึงพื้นที่ของฟังก์ชั่นเป็นชุดใหญ่ของฟังก์ชั่นอาจจะเป็นสิ่งที่ถ้าคุณจะ การกระจายที่นี่จะให้ความน่าจะเป็นในการวาดเซตย่อยของสิ่งเหล่านั้น การกระจายจะบอกว่า: ความน่าจะเป็นที่การวาดครั้งถัดไป (ของฟังก์ชัน) ของคุณอยู่ในชุดย่อยนี้ตัวอย่างเช่น 10% ในกรณีของกระบวนการ Gaussian เกี่ยวกับฟังก์ชั่นในสองมิติคุณอาจถามรับx-coordinate และช่วงเวลาของy- ค่านี่คือส่วนของเส้นแนวตั้งขนาดเล็กความน่าจะเป็นที่ฟังก์ชัน (สุ่ม) จะผ่านเส้นเล็ก ๆ นี้เป็นเท่าใด นั่นจะเป็นความน่าจะเป็นในเชิงบวก ดังนั้นกระบวนการแบบเกาส์ระบุการแจกแจง (ของความน่าจะเป็น) เหนือช่องว่างของฟังก์ชัน ในตัวอย่างนี้ชุดย่อยของพื้นที่ของฟังก์ชั่นเป็นชุดย่อยที่ผ่านส่วนของเส้น

คอนแวนต์การตั้งชื่อที่น่าสับสนอีกอย่างที่นี่ก็คือการกระจายตัวR


1
ขอบคุณที่จะอธิบายให้ชัดเจนว่านี่ไม่ใช่การกระจายตัวของค่าหนึ่งฟังก์ชั่น แต่เป็นการกระจายไปยังการรวบรวมฟังก์ชั่นใช่ไหม? ฉันมีคำถามอีกหนึ่งข้อ: คุณบอกว่านี่น่าจะเป็นความน่าจะเป็นที่ฟังก์ชันสุ่มจะผ่านช่วงเวลาหนึ่งดังนั้นในตัวอย่างของ GPR มันจะเป็นฟังก์ชั่นสุ่ม แต่มาจากฟังก์ชัน "ครอบครัว" ที่กำหนดโดย เคอร์เนลความแปรปรวนร่วม?
camillejr

2
ใช่มันเป็นการกระจายตัวของฟังก์ชั่น ตัวอย่างของการผ่านช่วงเวลานำไปใช้ถ้าคุณมีกระบวนการแบบเกาส์เซียน เคอร์เนลความแปรปรวนร่วมจริงจะระบุกระบวนการเสียน ดังนั้นหากคุณรู้จักเคอร์เนลความแปรปรวนร่วมคุณสามารถคำนวณความน่าจะเป็นของฟังก์ชันสุ่มที่ส่งผ่านช่วงเวลาเฉพาะ
Gijs

@Gijs คุณช่วยโปรดดูที่นี่ฉันกำลังมองหาปรีชาในเมทริกซ์ความแปรปรวนร่วมและวิธีการที่ความสัมพันธ์ที่แตกต่างกันยังคงส่งผลให้ผลลัพธ์ที่คล้ายกันจาก GP
GENIVI-LEARNER

14

คำถามของคุณถูกถามและตอบอย่างสวยงามในเว็บไซต์ Mathematics SE:

/math/2297424/extending-a-distribution-over-samples-to-a-distribution-over-functions

ดูเหมือนคุณจะไม่คุ้นเคยกับแนวคิดของการวัดแบบเกาส์เกี่ยวกับช่องว่างแบบไม่ จำกัด มิติฟังก์ชันเชิงเส้นการวัดแบบผลักดันเป็นต้นดังนั้นฉันจะพยายามทำให้มันง่ายที่สุดเท่าที่จะทำได้

L2([0,1])I=[0,1]RRnL2

อย่างไรก็ตามยังมี "เคล็ดลับ" อย่างง่ายที่อิงตามทฤษฎีบทการขยาย Kolmogorovซึ่งโดยพื้นฐานแล้วจะมีการนำวิธีการสโทแคสติกมาใช้ในหลักสูตรความน่าจะเป็นส่วนใหญ่ซึ่งไม่ได้วัดตามทฤษฎีอย่างหนัก ตอนนี้ฉันกำลังจะเป็นมากมือหยักและไม่เข้มงวดและ จำกัด ตัวเองกับกรณีของกระบวนการเกาส์ หากคุณต้องการคำจำกัดความทั่วไปคุณสามารถอ่านคำตอบข้างต้นหรือค้นหาลิงก์ Wikipedia ทฤษฎีบทส่วนขยายของ Kolmogorov นำไปใช้กับกรณีการใช้งานเฉพาะของคุณระบุมากหรือน้อยดังต่อไปนี้:

  • Sn={t1,,tn}Ixn=(x(t1),,x(tn))มีการกระจายแบบเกาส์หลายตัวแปร
  • Sn,Sm,SnSmfSn(x1,,xn)fSm(x1,,xn,xn+1,,xm)fSmSmSnfSn

Rnm+1fSm(x1,,xn,xn+1,,xm)dxn+1dxm=fSn(x1,,xn)

  • XL2Snn

ทฤษฎีบททั่วไปนั้นกว้างกว่า แต่ฉันคิดว่านี่คือสิ่งที่คุณกำลังมองหา

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.