ฉันพยายามทำความเข้าใจกับเอกสารของ Mark van der Laan เขาเป็นนักสถิติเชิงทฤษฎีที่ Berkeley ที่ทำงานกับปัญหาที่ทับซ้อนกันอย่างมีนัยสำคัญกับการเรียนรู้ของเครื่อง ปัญหาหนึ่งสำหรับฉัน (นอกเหนือจากคณิตศาสตร์ลึก) คือเขามักจะอธิบายวิธีการเรียนรู้ของเครื่องที่คุ้นเคยโดยใช้คำศัพท์ที่แตกต่างกันโดยสิ้นเชิง หนึ่งในแนวคิดหลักของเขาคือ "ความคาดหวังสูงสุดตามเป้าหมาย"
TMLE ใช้ในการวิเคราะห์ข้อมูลเชิงการเซ็นเซอร์จากการทดลองที่ไม่มีการควบคุมในลักษณะที่ช่วยให้การประเมินผลกระทบแม้ในที่ที่มีปัจจัยรบกวน ฉันสงสัยอย่างยิ่งว่ามีแนวคิดแบบเดียวกันหลายอย่างอยู่ภายใต้ชื่ออื่นในสาขาอื่น แต่ฉันยังไม่เข้าใจดีพอที่จะจับคู่มันกับอะไรก็ได้โดยตรง
ความพยายามในการเชื่อมช่องว่างกับ "การวิเคราะห์ข้อมูลเชิงคำนวณ" อยู่ที่นี่:
และการแนะนำสำหรับนักสถิติอยู่ที่นี่:
การอนุมานสาเหตุเชิงสาเหตุสูงสุดตามเป้าหมาย: ส่วนที่ 1
จากวินาที:
ในบทความนี้เราพัฒนาตัวประมาณความน่าจะเป็นเป้าหมายสูงสุดเฉพาะของผลกระทบเชิงสาเหตุของการแทรกแซงจุดเวลาหลายจุด สิ่งนี้เกี่ยวข้องกับการใช้การสูญเสียการเรียนรู้ระดับสูงเพื่อรับการประเมินเบื้องต้นของปัจจัยที่ไม่ทราบของสูตรการคำนวณ G และต่อมาใช้ฟังก์ชันพารามิเตอร์ความผันผวนที่เหมาะสมที่สุดที่เป็นเป้าหมายเฉพาะพารามิเตอร์ การประมาณค่าพารามิเตอร์ความผันผวนด้วยการประมาณค่าความน่าจะเป็นสูงสุดและวนซ้ำขั้นตอนการอัปเดตของปัจจัยเริ่มต้นจนถึงการลู่เข้า ขั้นตอนการอัพเดทโอกาสสูงสุดที่เป็นเป้าหมายซ้ำ ๆ นี้ทำให้ตัวประมาณค่าผลลัพธ์ของผลลัพธ์เชิงสาเหตุมีความแข็งแกร่งเป็นสองเท่าในแง่ที่ว่ามีความสอดคล้องกันหากตัวประมาณค่าเริ่มต้นสอดคล้องกัน หรือตัวประมาณของฟังก์ชันความผันผวนที่เหมาะสมนั้นสอดคล้องกัน ฟังก์ชั่นความผันผวนที่ดีที่สุดจะถูกระบุอย่างถูกต้องหากการแจกแจงแบบมีเงื่อนไขของโหนดในกราฟเชิงสาเหตุระบุการแทรกแซงอย่างใดอย่างหนึ่ง
ในคำศัพท์ของเขา "การเรียนรู้ขั้นสูง" คือการเรียนรู้ทั้งมวลด้วยทฤษฎีที่มีน้ำหนักที่ไม่เป็นลบ แต่สิ่งที่เขาหมายถึงโดย "การใช้ฟังก์ชั่นความผันผวนที่ดีที่สุดเฉพาะพารามิเตอร์เป้าหมายพารามิเตอร์
หรือแบ่งเป็นสามคำถามที่แตกต่างกัน TMLE มีการเรียนรู้แบบขนานในเครื่องเรียนรู้ว่าอะไรคือ "รูปแบบพารามิเตอร์ที่มีประโยชน์น้อยที่สุด" และ "ฟังก์ชันความผันผวน" ในสาขาอื่นคืออะไร