มีห้องสมุดประมวลผลภาษาธรรมชาติที่ดีไหม [ปิด]


90

ฉันต้องการใช้ NLP บางอย่างในโมดูลปัจจุบันของฉัน ฉันกำลังมองหาห้องสมุดดีๆที่สามารถช่วยฉันได้ที่นี่ ฉันเจอ 'LingPipe' แต่ไม่สามารถติดตามวิธีการใช้งานได้อย่างสมบูรณ์
โดยพื้นฐานแล้วเราจำเป็นต้องใช้คุณลักษณะที่แอปพลิเคชันสามารถถอดรหัสคำแนะนำของลูกค้า (คำแนะนำในการจัดส่ง) ที่พิมพ์เป็นภาษาอังกฤษล้วน เช่น:

  • จะมารับเวลา 12.00 น. วันพรุ่งนี้
  • ขอจัดส่งหลังวันที่ 10 มิถุนายน
  • กรุณาอย่าส่งก่อนวันพุธ
  • เพิ่ม XYZ อีก 10 หน่วยในคำสั่งซื้อ

คำตอบ:


79

LingPipeนั้นดีมากและมีการบันทึกไว้อย่างดี คุณยังสามารถดู:

อันสุดท้ายอาจเป็นที่สนใจของคุณโดยเฉพาะแม้ว่าฉันจะไม่รู้ว่ามีการใช้งาน Java ที่พร้อมใช้งานหรือไม่ (และอาจจะใหญ่เกินไปสำหรับปัญหาของคุณ :-)

แนวคิดของ Paul ในการใช้ DSL นั้นน่าจะง่ายกว่าและเร็วกว่าในการนำไปใช้และเชื่อถือได้มากขึ้นสำหรับลูกค้าของคุณ ฉันก็ขอแนะนำให้พิจารณาก่อน


1
ฉันนำเสนอรายงานของฉันตามข้อมูลที่ฉันรวบรวมจากฟอรัมนี้และที่อื่น ๆ ในเน็ต ฉันยังแนะนำตัวเลือกอื่น ๆ ที่คุณแนะนำและ Biz ได้ตัดสินใจที่จะระงับสิ่งนี้ไว้ (ตอนนี้เริ่ม R&D เพื่อค้นหาผู้สมัครที่ดีที่สุดเท่าที่จะเป็นไปได้)
Vini

1
หากคุณเปรียบเทียบ LingPipe กับรายการอื่น ๆ ที่คุณระบุไว้คุณต้องการอะไร ฉันถามสิ่งนี้ไม่เฉพาะเจาะจงสำหรับคำถามของ @ Winnie ฉันถามเพื่อวัตถุประสงค์ทั่วไป
kamaci

1
ตรวจสอบ MALLET: mallet.cs.umass.edu
Samik R

11

ฉันคิดว่าคุณเลือกใช้ NLP หรือไม่อาจขึ้นอยู่กับข้อกำหนดเฉพาะสำหรับระบบของคุณ เป็นข้อกำหนดที่ควรยอมรับภาษาอังกฤษรูปแบบอิสระหรือจะยอมรับเฉพาะชุดคำสั่งบางชุดเท่านั้น? อาจจะง่ายกว่าในการสร้างภาษาเฉพาะโดเมนที่รองรับสิ่งที่ผู้ใช้ของคุณต้องการสื่อมากกว่าการวิเคราะห์ข้อความอิสระแบบเต็มรูปแบบ

ในพื้นที่ชวา Groovy มีการสนับสนุนบางอย่างสำหรับการสร้าง DSLs


ต่อไปนี้เป็นสองสามบรรทัดจากเอกสารข้อกำหนด: '.. และผู้ใช้ควรจะสามารถป้อนบันทึกหรือคำสั่งพิเศษเป็นภาษาอังกฤษธรรมดาได้ จากนั้นระบบควรแยกวิเคราะห์คำสั่งผู้ใช้และเติมข้อมูลในฟิลด์ที่เกี่ยวข้อง (ถ้ามี) ของคำสั่งด้วยค่าที่ถูกต้อง "
Vini

10
นั่นเป็นข้อกำหนดที่ค่อนข้างคลุมเครือ เช่นโน้ตต้องถูกต้องตามหลักไวยากรณ์หรือไม่? ฉันไม่แน่ใจว่าฝ่ายต่างๆที่มาพร้อมกับข้อกำหนดนั้นคุ้นเคยกับสถานะของ NLP หรือไม่ แต่ปัญหาที่พวกเขาอธิบายคือความเข้าใจในการอ่านเป็นหลักหรือความเข้าใจภาษาตามธรรมชาติซึ่งเป็นปัญหาหนึ่งที่อธิบายว่าเป็น 'ผู้ศักดิ์สิทธิ์ จอก 'ของ NLP เป็นที่น่าสงสัยสำหรับฉันที่คุณจะพบแพ็คเกจที่สามารถ 'ทำสิ่งนี้' ให้คุณได้ซึ่งอาจเป็นจริงมากกว่าที่จะให้ UI แก่ผู้ใช้ซึ่งพวกเขาสามารถระบุคำแนะนำพิเศษได้ในจำนวน จำกัด
Paul Morie

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.