ฉันต้องการทราบว่าภาษาโปรแกรมใดดีกว่าสำหรับการประมวลผลภาษาธรรมชาติ JavaหรือPython ? ฉันพบคำถามและคำตอบมากมายเกี่ยวกับเรื่องนี้ แต่ฉันยังคงหลงเลือกว่าจะใช้อันไหนดี
และฉันต้องการทราบว่าไลบรารี NLP ใดที่จะใช้สำหรับ Java เนื่องจากมีไลบรารีจำนวนมาก (LingPipe, GATE, OpenNLP, StandfordNLP) สำหรับ Python โปรแกรมเมอร์ส่วนใหญ่แนะนำ NLTK
แต่ถ้าฉันต้องการประมวลผลข้อความหรือดึงข้อมูลจากข้อมูลที่ไม่มีโครงสร้าง (เพียงแค่สร้างข้อความภาษาอังกฤษธรรมดาที่ไม่เสียค่าใช้จ่าย) เพื่อให้ได้ข้อมูลที่เป็นประโยชน์ตัวเลือกที่ดีที่สุดคืออะไร? Java หรือ Python? ห้องสมุดที่เหมาะสม?
Updated
สิ่งที่ฉันต้องการทำคือดึงข้อมูลผลิตภัณฑ์ที่เป็นประโยชน์จากข้อมูลที่ไม่มีโครงสร้าง (เช่นผู้ใช้สร้างโฆษณาในรูปแบบต่างๆเกี่ยวกับโทรศัพท์มือถือหรือแล็ปท็อปที่มีภาษาอังกฤษไม่ได้มาตรฐาน)