ข้อมูลความเชื่อมั่นสำหรับ Emoji

สำหรับการทดลองเราต้องการใช้Emoji ที่ฝังอยู่ในทวีตจำนวนมากเพื่อเป็นข้อมูลจริง / การฝึกอบรมสำหรับการวิเคราะห์เชิงปริมาณอย่างง่าย ทวีตมักจะไม่มีโครงสร้างเกินกว่าที่ NLP จะทำงานได้ดี

อย่างไรก็ตามมี 722 Emoji ใน Unicode 6.0 และอาจเพิ่ม 250 อีกอันใน Unicode 7.0

มีฐานข้อมูล (เช่น SentiWordNet) ที่มีหมายเหตุประกอบไว้สำหรับพวกเขาหรือไม่?

(โปรดทราบว่า SentiWordNet อนุญาตสำหรับความหมายที่ไม่ชัดเจนเช่นกันพิจารณาเช่นตลกซึ่งไม่เพียง แต่เป็นบวก: "รสชาตินี้ตลก" อาจไม่เป็นบวก ... เช่นเดียวกันจะถือ;-)เป็นตัวอย่าง แต่ฉันไม่คิดว่ามันยากกว่า สำหรับ Emoji มากกว่าสำหรับคำปกติ ... )

นอกจากนี้หากคุณมีประสบการณ์ในการใช้พวกเขาสำหรับการวิเคราะห์ความเชื่อมั่นฉันก็อยากจะได้ยิน

machine-learning classification parsing

— Erich Schubert
แหล่งที่มา

อย่าเชื่อว่าปัจจุบันนี้มีบางสิ่งบางอย่างอยู่เช่นนี้ แต่จะรักถ้าคุณรวบรวมบางสิ่งเข้าไว้ด้วยกัน!

— indico

Erich Schubert ฉันกำลังมองหาสิ่งเดียวกัน! คุณมีโอกาสที่จะหาแหล่งข้อมูลที่เป็นประโยชน์หรือไม่?

— saeed mehrabi

อีโมจิทั้งหมด 972 คนนั้นไม่ได้ใหญ่ขนาดนั้นที่จะไม่สามารถติดป้ายด้วยตนเองได้ แต่ฉันสงสัยว่าพวกเขาจะทำงานได้ดีจริง แหล่งที่มาเช่น Twitter เต็มไปด้วยการประชดประชดประชันและการตั้งค่าที่ยุ่งยากอื่น ๆ ซึ่งสัญลักษณ์ทางอารมณ์ (เช่นอิโมจิหรืออิโมติคอน) หมายถึงสิ่งที่แตกต่างจากการตีความปกติ ตัวอย่างเช่นบางคนอาจเขียน "xxx โกงลูกค้าของพวกเขาและตอนนี้พวกเขาถูกโกงตัวเอง! ha ha ha!: D" นี่เป็นความคิดเห็นเชิงลบแน่นอน แต่ผู้เขียนดีใจที่เห็น บริษัท xxx มีปัญหาและเพิ่มอิโมติคอนที่เป็นบวก กรณีเหล่านี้ไม่ได้เกิดขึ้นบ่อยครั้ง แต่ไม่เหมาะสำหรับความจริงพื้นฐาน

มากวิธีการร่วมกันมากขึ้นคือการใช้อีโมติคอนเป็นเมล็ดพันธุ์สำหรับการเก็บรวบรวมชุดข้อมูลที่เกิดขึ้นจริง ตัวอย่างเช่นในบทความนี้ผู้เขียนใช้อิโมติคอนและแท็กแฮชอารมณ์เพื่อจับศัพท์ของคำที่มีประโยชน์สำหรับการจำแนกต่อไป

— ffriend
แหล่งที่มา

ที่จริงฉันไม่เห็นด้วย เนื่องจากผู้เขียนชอบพวกเขากำลังมีปัญหามันเป็นความรู้สึกเชิงบวกที่นั่น มันเป็นความคิดเห็นเชิงลบเกี่ยวกับ บริษัท แต่อย่างไรก็ตามความเชื่อมั่นในเชิงบวกโดยผู้เขียน ในสถานการณ์ที่ง่ายกว่านี้ (ฉันไม่ได้บอกว่านี่คือเป้าหมายที่สมบูรณ์) การทำนายว่าอีโมจิใดที่ผู้ใช้จะเพิ่มลงในโพสต์ของเขาฟังดูเหมือนเป็นงานที่สมเหตุสมผลสำหรับฉัน ในความเป็นจริงคุณสามารถสร้างหลายกรณีที่อิโมจิจะมีความสำคัญ .. พิจารณา "Got f_cked :-)" ซึ่งตรงข้ามกับ "Got f_cked. :-("

— Erich Schubert

ในกรณีที่คุณพยายามประเมินอารมณ์ความรู้สึกของคน ๆ นั้นเมื่อเทียบกับทัศนคติของบุคคลที่มีต่อเรื่องแล้วใช่ตัวอย่างนี้จะไม่ทำงาน แต่มีคนอื่นอีกมากมาย Sarcasm เป็นกรณีทั่วไป พิจารณาประโยค "โอใช่คุณเป็น 'อาจารย์' จริง ๆ )" มนุษย์สามารถจับบริบทเชิงลบ แต่อิโมติคอนเชิงบวกจะชี้ไปที่อารมณ์เชิงบวก แต่ฉันไม่ได้รับจริง: คุณต้องการดึงข้อมูลส่วนตัวจากทวีตหรือเพียงแค่คาดเดาอิโมจิที่เป็นไปได้หรือไม่? ถึงแม้ว่าพวกเขาจะฟังดูคล้ายกัน แต่งานที่สองไม่ใช่การวิเคราะห์ความเชื่อมั่น ไม่อย่างน้อยโดยตรง

— แฟน

"วิ้ง" ยิ้มมักจะไม่ถือว่าเป็น "บวก" แต่ "แดกดัน" ... ซึ่งเป็นเหตุผลที่พจนานุกรมที่ดีเช่น SentiWordNet ทำให้รู้สึก หากคุณดูตลกใน SentiWordNet ก็มีความหมายมากกว่าหนึ่งเช่นกัน! sentiwordnet.isti.cnr.it/search.php?q=funny (ดังนั้นจึงเป็นไม่น่ารำคาญอธิบายให้พวกเขาด้วยตัวเองเพราะมันไม่ได้เป็นง่ายๆเป็นบวก / ลบ; แต่คุณควรจะทำในการตรวจสอบข้อตกลง interrater ปกติ ฯลฯ )

— Erich Schubert

ตอนนี้ฉันเห็นความคิดของคุณ แต่ฉันไม่คิดว่ามันจะใช้งานได้เพียงเพราะอิโมจิ (ส่วนใหญ่) ไม่ฟังดูเหมือนนักทำนายที่ดีสำหรับฉันและคุณไม่ต้องการใช้คุณสมบัติอื่น ๆ อย่างชัดเจน อย่างไรก็ตามนี่เป็นเพียงความเห็นจากประสบการณ์ของฉันมีเพียงข้อมูลเท่านั้นที่สามารถให้คำตอบที่แท้จริง โชคดี!

— แฟน

ใครบอกว่าฉันไม่ต้องการใช้คุณสมบัติอื่น ๆ แต่สำหรับเหล่านี้ที่ฉันได้เห็นฐานข้อมูล ...

— ริชชูเบิร์ต

ฉันพบว่า repo Github นี้มีประโยชน์ (เริ่มต้นดี): https://github.com/wooorm/emoji-emotion รายชื่อ emoji ที่ได้รับการจัดอันดับสำหรับความจุที่มีจำนวนเต็มระหว่างลบห้า (ลบ) และบวกห้า (บวก)

ดูรายการ unicode-emojis ที่รองรับ: https://github.com/wooorm/emoji-emotion/blob/master/Support.md

โปรดทราบว่าอีโมจิบางคนอาจได้รับกระแสไฟฟ้าที่ทำให้เกิดความสับสนเช่นติดขัด ____tongue_closed_eyes (0) เนื่องจากถูกใช้ทั้งอารมณ์เชิงบวกและลบ

— Tal ไวส์
แหล่งที่มา