มีการวิจัยอะไรในโดเมนของ“ การระบุการเสียดสีในข้อความ”?


17

การระบุการเสียดสีถือเป็นปัญหาปลายเปิดที่ยากที่สุดในโดเมนของ ML และ NLP

ดังนั้นมีการวิจัยจำนวนมากที่ทำในหน้านั้น? ถ้าใช่แล้วความแม่นยำเป็นอย่างไร โปรดอธิบายโมเดล NLP โดยย่อด้วย



Aah คำถามที่น่าสนใจ (!)
ABcDexter

คำตอบ:


5

บทความต่อไปนี้การสำรวจโดยนักวิจัยจากไอไอทีบอมเบย์สรุปความก้าวหน้าล่าสุดในการตรวจสอบถ้อยคำ: การเชื่อมโยง arXiv

ในการอ้างอิงถึงคำถามของคุณฉันไม่คิดว่าเป็นเรื่องยากพิเศษหรือปลายเปิด ในขณะที่มันนำเสนอความคลุมเครือที่คอมพิวเตอร์ยังไม่สามารถจัดการได้มนุษย์สามารถเข้าใจถึงการเสียดสีได้ง่ายและสามารถติดป้ายชื่อชุดข้อมูลสำหรับการตรวจจับการเสียดสี


2

มีการทำงานล่าสุดในโดเมนเดียวกันซึ่งมีการใช้เครือข่ายประสาท (CNNs เพื่อความถูกต้อง) เพื่อจุดประสงค์เดียวกัน ข้อมูลบางอย่าง เกี่ยวกับการวิจัยคือ:

ในการเรียนรู้บริบทนั้นกระดาษจะอธิบายวิธีการที่เครือข่ายประสาทพบผู้ใช้ "embeddings" - คือตัวชี้นำเชิงบริบทเช่นเนื้อหาของทวีตก่อนหน้าความสนใจและบัญชีและอื่น ๆ มันใช้ปัจจัยต่าง ๆ เหล่านี้เพื่อพล็อตผู้ใช้กับผู้อื่นและ (นึกคิด) พบว่าพวกเขาอยู่ในกลุ่มที่ค่อนข้างชัดเจน

ดังนั้นกระดาษจึงใช้ CNNs คำและผู้ใช้งานแต่งงานในการตรวจสอบการเสียดสีในข้อความ นอกจากนี้ยังมีบทความ Techcrunchเกี่ยวกับเรื่องนั้น

กระดาษใช้ความรู้สึกของทวีตและเปรียบเทียบกับทวีตที่คล้ายกันอื่น ๆ :

หากความเชื่อมั่นของทวีตดูเหมือนจะไม่เห็นด้วยกับสิ่งที่แสดงออกโดยผู้ใช้ที่คล้ายกันแสดงว่ามีการใช้ถ้อยคำที่เป็นโอกาสที่ดี

เชื่อมโยงไปยังกระดาษ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.