การระบุการเสียดสีถือเป็นปัญหาปลายเปิดที่ยากที่สุดในโดเมนของ ML และ NLP
ดังนั้นมีการวิจัยจำนวนมากที่ทำในหน้านั้น? ถ้าใช่แล้วความแม่นยำเป็นอย่างไร โปรดอธิบายโมเดล NLP โดยย่อด้วย
การระบุการเสียดสีถือเป็นปัญหาปลายเปิดที่ยากที่สุดในโดเมนของ ML และ NLP
ดังนั้นมีการวิจัยจำนวนมากที่ทำในหน้านั้น? ถ้าใช่แล้วความแม่นยำเป็นอย่างไร โปรดอธิบายโมเดล NLP โดยย่อด้วย
คำตอบ:
บทความต่อไปนี้การสำรวจโดยนักวิจัยจากไอไอทีบอมเบย์สรุปความก้าวหน้าล่าสุดในการตรวจสอบถ้อยคำ: การเชื่อมโยง arXiv
ในการอ้างอิงถึงคำถามของคุณฉันไม่คิดว่าเป็นเรื่องยากพิเศษหรือปลายเปิด ในขณะที่มันนำเสนอความคลุมเครือที่คอมพิวเตอร์ยังไม่สามารถจัดการได้มนุษย์สามารถเข้าใจถึงการเสียดสีได้ง่ายและสามารถติดป้ายชื่อชุดข้อมูลสำหรับการตรวจจับการเสียดสี
มีการทำงานล่าสุดในโดเมนเดียวกันซึ่งมีการใช้เครือข่ายประสาท (CNNs เพื่อความถูกต้อง) เพื่อจุดประสงค์เดียวกัน ข้อมูลบางอย่าง เกี่ยวกับการวิจัยคือ:
ในการเรียนรู้บริบทนั้นกระดาษจะอธิบายวิธีการที่เครือข่ายประสาทพบผู้ใช้ "embeddings" - คือตัวชี้นำเชิงบริบทเช่นเนื้อหาของทวีตก่อนหน้าความสนใจและบัญชีและอื่น ๆ มันใช้ปัจจัยต่าง ๆ เหล่านี้เพื่อพล็อตผู้ใช้กับผู้อื่นและ (นึกคิด) พบว่าพวกเขาอยู่ในกลุ่มที่ค่อนข้างชัดเจน
ดังนั้นกระดาษจึงใช้ CNNs คำและผู้ใช้งานแต่งงานในการตรวจสอบการเสียดสีในข้อความ นอกจากนี้ยังมีบทความ Techcrunchเกี่ยวกับเรื่องนั้น
กระดาษใช้ความรู้สึกของทวีตและเปรียบเทียบกับทวีตที่คล้ายกันอื่น ๆ :
หากความเชื่อมั่นของทวีตดูเหมือนจะไม่เห็นด้วยกับสิ่งที่แสดงออกโดยผู้ใช้ที่คล้ายกันแสดงว่ามีการใช้ถ้อยคำที่เป็นโอกาสที่ดี