ฉันใช้กระบวนการ Gaussian (GP) สำหรับการถดถอย
ในปัญหาของฉันมันเป็นเรื่องธรรมดาสำหรับจุดข้อมูลสองจุดหรือมากกว่าเพื่อให้ใกล้ชิดกันมากกว่าความยาวของปัญหา นอกจากนี้การสังเกตอาจมีเสียงดังมาก เพื่อเพิ่มความเร็วในการคำนวณและปรับปรุงความแม่นยำในการวัดดูเหมือนว่าเป็นธรรมชาติที่จะรวม / รวมกลุ่มของจุดที่อยู่ใกล้กันตราบใดที่ฉันสนใจการคาดการณ์ในระดับความยาวที่มากขึ้น
ฉันสงสัยว่าอะไรคือวิธีที่รวดเร็ว แต่มีหลักการครึ่งหนึ่งในการทำสิ่งนี้
ถ้าสองจุดข้อมูลที่ดีที่สุดที่ทับซ้อนกันและเสียงการสังเกต (เช่นความน่าจะเป็น) เป็น Gaussian อาจ heteroskedastic แต่ที่รู้จักกัน , วิธีธรรมชาติของการดำเนินการต่อดูเหมือนจะรวมไว้ในจุดข้อมูลเดียวด้วย:
สำหรับk
ค่าที่สังเกตซึ่งเป็นค่าเฉลี่ยของค่าที่สังเกตได้ถ่วงน้ำหนักด้วยความแม่นยำสัมพัทธ์:{(2)} y(1),y(2) ˉ y =σ 2 y ( → x ( 2 ) )
เสียงรบกวนที่เกี่ยวข้องกับการสังเกตเท่ากับ:{(2)})}
อย่างไรก็ตามฉันควรผสานสองจุดที่อยู่ใกล้กัน แต่ไม่ทับซ้อนกันได้อย่างไร
ฉันคิดว่าควรยังคงเป็นค่าเฉลี่ยถ่วงน้ำหนักของสองตำแหน่งอีกครั้งโดยใช้ความน่าเชื่อถือแบบสัมพัทธ์ เหตุผลเป็นข้อโต้แย้งที่ศูนย์กลางของมวล (เช่นคิดว่าการสังเกตที่แม่นยำมากเป็นสแต็คของการสังเกตที่แม่นยำน้อยกว่า)
สำหรับสูตรเดียวกับข้างต้น
สำหรับเสียงที่เกี่ยวข้องกับการสังเกตฉันสงสัยว่านอกเหนือจากสูตรข้างต้นฉันควรเพิ่มคำแก้ไขลงในเสียงเพราะฉันกำลังย้ายจุดข้อมูลไปรอบ ๆ โดยพื้นฐานแล้วฉันจะได้รับความไม่แน่นอนเพิ่มขึ้นที่เกี่ยวข้องกับและ (ตามลำดับความแปรปรวนของสัญญาณและระดับความยาวของฟังก์ชันความแปรปรวนร่วม) ฉันไม่แน่ใจเกี่ยวกับรูปแบบของคำนี้ แต่ฉันมีความคิดเบื้องต้นเกี่ยวกับวิธีการคำนวณให้ฟังก์ชั่นความแปรปรวนร่วม
ก่อนดำเนินการต่อฉันสงสัยว่ามีบางสิ่งบางอย่างอยู่ที่นั่นแล้วหรือไม่ และหากสิ่งนี้ดูเหมือนจะเป็นวิธีที่เหมาะสมในการดำเนินการหรือมีวิธีการที่รวดเร็วกว่า
สิ่งที่ใกล้เคียงที่สุดที่ฉันสามารถพบได้ในวรรณกรรมคือกระดาษนี้: E. Snelson และ Z. Ghahramani, กระบวนการแบบเกาส์กระจัดกระจายโดยใช้ Pseudo-inputs , NIPS '05; แต่วิธีการของพวกเขาคือ (ค่อนข้าง) มีส่วนเกี่ยวข้องต้องมีการปรับให้เหมาะสมเพื่อค้นหาอินพุทหลอก