จากสิ่งที่ฉันได้อ่าน:
A Distant supervision algorithm usually has the following steps:
1] It may have some labeled training data
2] It "has" access to a pool of unlabeled data
3] It has an operator that allows it to sample from this unlabeled
data and label them and this operator is expected to be noisy in its labels
4] The algorithm then collectively utilizes the original labeled training data
if it had and this new noisily labeled data to give the final output.
การเรียนรู้ด้วยตนเอง ( Yates, Alexander, et al. "Textrunner: การดึงข้อมูลแบบเปิดบนเว็บ" การดำเนินการของเทคโนโลยีภาษามนุษย์: การประชุมประจำปีของสมาคมบทภาษาศาสตร์คอมพิวเตอร์: การสาธิตในอเมริกาเหนือสมาคมสาธิตภาษาศาสตร์เชิงคำนวณ 2550 ):
ผู้เรียนดำเนินการในสองขั้นตอน ก่อนอื่นจะติดป้ายกำกับข้อมูลการฝึกอบรมของตัวเองโดยอัตโนมัติว่าเป็นบวกหรือลบ ประการที่สองมันใช้ข้อมูลที่มีป้ายกำกับนี้เพื่อฝึกอบรมตัวจําแนก Naive Bayes
การกำกับดูแลที่อ่อนแอ (Hoffmann, Raphael, et al. "การควบคุมที่อ่อนแอตามความรู้สำหรับการดึงข้อมูลของความสัมพันธ์ที่ทับซ้อนกัน" การประชุมวิชาการประจำปีครั้งที่ 49 ของสมาคมภาษาศาสตร์คอมพิวเตอร์: ภาษาเทคโนโลยีเล่ม 1 สมาคมภาษาศาสตร์คอมพิวเตอร์ 2011 .)
แนวทางที่มีแนวโน้มมากขึ้นซึ่งมักเรียกว่าการควบคุมแบบ "อ่อนแอ" หรือ "ไกล" สร้างข้อมูลการฝึกอบรมของตนเองโดยการจับคู่เนื้อหาของฐานข้อมูลกับข้อความที่ตรงกัน
มันฟังดูเหมือนกันกับฉันยกเว้นว่าการฝึกอบรมด้วยตนเองดูเหมือนว่าจะแตกต่างกันเล็กน้อยว่าฮิวริสติกการติดฉลากเป็นลักษณนามที่ผ่านการฝึกอบรมและมีห่วงระหว่างขั้นตอนการติดฉลากและขั้นตอนการฝึกอบรมลักษณนาม อย่างไรก็ตามYao, Limin, Sebastian Riedel และ Andrew McCallum "การรวมความสัมพันธ์ข้ามเอกสารโดยรวมโดยไม่มีข้อมูลที่มีป้ายกำกับ " การประชุมวิชาการวิธีการเชิงประจักษ์ในการประมวลผลภาษาธรรมชาติปี 2010 สมาคมภาษาศาสตร์คอมพิวเตอร์, 2010อ้างว่าการกำกับดูแลที่ห่างไกล == การฝึกอบรมด้วยตนเอง == การกำกับดูแลที่อ่อนแอ
นอกจากนี้จะมีคำพ้องความหมายอื่น ๆ ?