แบบจำลองของ P (Y | X) สามารถฝึกผ่านการไล่ระดับสีแบบสุ่มจากตัวอย่างที่ไม่ใช่ iid ของ P (X) และตัวอย่าง iid ของ P (Y | X) ได้หรือไม่?


10

เมื่อการฝึกอบรมแบบจำลองพารามิเตอร์ (เช่นเพื่อเพิ่มโอกาส) ผ่านการไล่ระดับสีแบบสุ่มในชุดข้อมูลบางอย่างก็มักจะสันนิษฐานว่าตัวอย่างการฝึกอบรมจะถูกดึงออกมาจากการกระจายข้อมูลการฝึกอบรม ดังนั้นหากเป้าหมายคือการสร้างแบบจำลองการแจกแจงร่วมดังนั้นตัวอย่างการฝึกอบรมแต่ละตัวอย่างควรถูกดึงออกมาจากการกระจายนั้น( x i , y i )P(X,Y)(xi,yi)

หากเป้าหมายคือการจำลองแบบการแจกแจงแบบมีเงื่อนไขดังนั้นความต้องการของ iid จะเปลี่ยนไปอย่างไรถ้าหากทั้งหมดP(Y|X)

  1. เราจะต้องดึงตัวอย่างแต่ละตัวอย่าง iid จากการกระจายข้อต่อหรือไม่?(xi,yi)
  2. เราควรจะวาด IID จากแล้ววาด IID จาก ? P ( X ) y i P ( Y | X )xiP(X)yiP(Y|X)
  3. เราสามารถวาดไม่ IID จาก (เช่นความสัมพันธ์ในช่วงเวลา) แล้ววาด IID จาก ? P ( X ) y i P ( Y | X )xiP(X)yiP(Y|X)

คุณสามารถแสดงความคิดเห็นเกี่ยวกับความถูกต้องของวิธีการทั้งสามนี้สำหรับการไล่ระดับสีแบบลาดสุ่ม (หรือช่วยฉันเรียบเรียงคำถามใหม่หากจำเป็น)

ฉันอยากจะทำ # 3 ถ้าเป็นไปได้ แอปพลิเคชันของฉันอยู่ในการเรียนรู้การเสริมแรงโดยที่ฉันใช้โมเดลเงื่อนไขที่มีพารามิเตอร์เป็นนโยบายการควบคุม ลำดับของสถานะนั้นมีความสัมพันธ์กันสูง แต่การกระทำถูกสุ่มตัวอย่าง iid จากนโยบายสุ่มที่กำหนดไว้ในรัฐ ตัวอย่างผลลัพธ์ (หรือส่วนย่อยของพวกเขา) ถูกใช้เพื่อฝึกอบรมนโยบาย (กล่าวอีกนัยหนึ่งลองนึกภาพการใช้นโยบายการควบคุมเป็นเวลานานในบางสภาพแวดล้อมรวบรวมชุดข้อมูลของรัฐ / ตัวอย่างการกระทำจากนั้นแม้ว่ารัฐจะมีความสัมพันธ์กันเมื่อเวลาผ่านไป นี่ค่อนข้างคล้ายกับสถานการณ์ในบทความนี้y i i ( x i , y i )xiyi(xi,yi)

ฉันพบกระดาษ Ryabko, 2006, " การจดจำรูปแบบสำหรับข้อมูลที่มีเงื่อนไขแบบอิสระ " ซึ่งตอนแรกดูเหมือนจะมีความเกี่ยวข้อง อย่างไรก็ตามมีสถานการณ์ที่ตรงกันข้ามจากสิ่งที่ฉันต้องการโดยที่ (เลเบล / หมวดหมู่ / แอ็คชั่น) สามารถวาดได้ไม่ใช่ iid จากและ (วัตถุ / รูปแบบ / สถานะ) ถูกดึงจาก iidY) P ( Y ) x i P ( X | Y )yiP(Y)xiP(X|Y)

อัปเดต:เอกสารสองฉบับ ( ที่นี่และที่นี่ ) ที่กล่าวถึงในกระดาษ Ryabko ดูเหมือนจะเกี่ยวข้องกันที่นี่ พวกเขาคิดว่ามาจากกระบวนการที่กำหนดเอง (เช่นไม่ใช่ iid, อาจเป็นไปได้ที่จะไม่ใช่) พวกเขาแสดงให้เห็นว่าการประมาณค่าเพื่อนบ้านและเคอร์เนลใกล้เคียงกันนั้นในกรณีนี้ แต่ฉันสนใจมากขึ้นว่าการประมาณค่าโดยใช้การไล่ระดับสีแบบสุ่มนั้นมีผลในสถานการณ์นี้หรือไม่xi


1
บางทีฉันหายไปบางสิ่งบางอย่างและฉันไม่ได้อ่านกระดาษ แต่: คุณกำลังวาดภาพไม่ใช่ IID จากP ( X )และจากนั้นสุ่มตัวอย่างY ฉัน IID จากP ( Y | X ) Ryabko (2006) เป็นรูปวาดY ฉันไม่ใช่ IID จากP ( Y )และจากนั้นสุ่มตัวอย่างx ฉัน IID จากP ( X | Y ) สิ่งเหล่านี้ดูเหมือนจะเป็นการเปลี่ยนชื่อใหม่ มีบางสิ่งที่แตกต่างกันโดยพื้นฐานเกี่ยวกับวัตถุxและyxiP(X)yiP(YX)yiP(Y)xiP(XY)xyที่ทำให้สิ่งนี้ไม่ใช่สถานการณ์เดียวกัน
Dougal

@Dougal: ความแตกต่างคือแบบจำลองการแจกแจงแบบมีเงื่อนไขเช่นเขตข้อมูลสุ่มตามเงื่อนไขให้ถือว่าและY ("อินพุต" และ "เอาท์พุท") แตกต่างกัน ... พวกมันจำลองทิศทางเดียวเท่านั้น ( P ( Y | X )แต่ไม่ใช่P ( X | Y ) ) XYP(Y|X)P(X|Y)
Tyler Streeter

2
ฉันจะพิจารณาการเปรียบเทียบต่อไปนี้ในกรณีนี้ สมมติว่าและX ฉันมีสองชุดเวลาที่มีความสัมพันธ์ (ความสัมพันธ์ในเวลา) เราอยากจะคิดออกฟังก์ชั่นY ฉัน = F ( X ฉัน ; θ )ซึ่งเทียบเท่ากับการหาP ( Y ฉัน| X ฉัน ; θ ) ถ้าP ( Y i | X i ; θ )YiXiYi=f(Xi;θ)P(Yi|Xi;θ)P(Yi|Xi;θ)ซึ่งเป็นสิ่งที่เหลืออยู่คือ IID (ดังนั้นจึงอยู่กับที่และไม่เกี่ยวข้อง) จากนั้นขั้นตอนการประมาณค่าจะมาบรรจบกันโดยไม่มีอคติ โดยทั่วไปการประมวลผลอนุกรมเวลาตามลำดับเวลาหรือคำสั่งสุ่มใด ๆ ไม่ควรมีความสำคัญในขั้นตอน MLE ตราบใดที่มีการระบุความเป็นไปได้ตามเงื่อนไขอย่างถูกต้องและส่วนที่เหลือเป็น IID
Cagdas Ozgenc

คำตอบ:


1

ฉันคิดว่าคุณสามารถทำอย่างใดอย่างหนึ่ง 2 หรือ 3 อย่างไรก็ตามปัญหาของ 3 คือการอนุญาตให้มีการแจกแจงโดยพลการสำหรับ X คุณรวมถึงการแจกแจงที่น่าจะมีความน่าจะเป็นทั้งหมดหรือเกือบทั้งหมดคือช่วงเวลาเล็ก ๆ ใน x-space สิ่งนี้จะส่งผลเสียหายต่อการประเมินโดยรวมของ P (Y | X) เนื่องจากคุณจะมีข้อมูลเพียงเล็กน้อยหรือไม่มีเลยสำหรับค่า X ที่แน่นอน


คุณกำลังบอกว่าด้วยวิธีการ # 3 ฉันจะได้ผลลัพธ์ที่เป็นกลางโดยมีความแปรปรวนสูง
Tyler Streeter

หากไม่มีข้อมูลอยู่ที่หรือใกล้จุด x 1คุณจะไม่สามารถประมาณ P (Y | X = x 1 ) ได้และหากมีเพียงไม่กี่จุดความแปรปรวนของการประมาณจะมีขนาดใหญ่ 11
Michael R. Chernick

ใช่นั่นทำให้รู้สึกว่าความแปรปรวนอาจมีขนาดใหญ่ ฉันเดาว่าความกังวลหลักของฉันคือการประมาณว่า P (Y | X) จะมีอคติหรือไม่
Tyler Streeter

เราไม่ได้หารือเกี่ยวกับการประเมินจุด หากคุณมีค่าประมาณที่เป็นกลางสำหรับ P (X), P (Y) และ P (X | Y) และเสียบเข้ากับสูตร P (Y | X) = P (X | Y) P (Y) / P (X) คุณจะได้รับการประเมินแบบเอนเอียง
Michael R. Chernick

ฉันควรเน้นว่าฉันกำลังพูดถึงการประมาณ P (Y | X) ผ่านการไล่ระดับสีแบบสุ่มในกรณีนี้ลำดับของตัวอย่างการฝึกอบรมสามารถมีอิทธิพลต่อความรวดเร็วหรือไม่ว่ามันจะมาบรรจบกับแบบจำลองที่ถูกต้องหรือไม่ ฉันไม่เพียงแค่ใช้ค่าเฉลี่ยตัวอย่างซึ่งลำดับของตัวอย่างนั้นไม่สำคัญ
Tyler Streeter
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.