ฉันเพิ่งอ่านหนังสือสี่เล่มในสาขานี้:
เฟลด์แมน, อาร์และเจมส์แซงเจอร์, J. (2006) คู่มือการขุดข้อความ: แนวทางขั้นสูงในการวิเคราะห์ข้อมูลที่ไม่มีโครงสร้าง สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์
อันนี้มุ่งเน้นไปที่ตัวอย่างที่ใช้งานได้จริงซอฟต์แวร์และการขุดข้อความประยุกต์ มันให้หลายตัวอย่างของการใช้งานจริงของ text-mining มันอาจเป็นที่สนใจถ้าคุณต้องการอ่านเกี่ยวกับการใช้งานเชิงพาณิชย์ของเครื่องมือขุดข้อความ
Srivastava, AN และ Sahami, M. (2009) การทำเหมืองข้อความ: การจำแนกการจัดกลุ่มและแอปพลิเคชัน แชปแมน & ฮอล / CRC
มันเป็นชุดของงานวิจัยที่ใช้เป็นตัวอย่างของการใช้เครื่องมือขุดข้อความที่แตกต่างกัน มันค่อนข้างมุ่งเน้นเกินไปสำหรับการทดสอบเบื้องต้น
Weiss, SM, Indurkhya, N. , Zhang, T. และ Damerau, F. (2005) การทำเหมืองข้อความ: วิธีการทำนายการวิเคราะห์ข้อมูลที่ไม่มีโครงสร้าง
สปริงเกอร์
ข้อความเกริ่นนำมากที่อธิบายปัญหาทั่วไปบางอย่าง
แมนนิ่ง, C. (1999) รากฐานของการประมวลผลภาษาธรรมชาติทางสถิติ กด MIT
นี่คือหนังสือที่ดีที่สุดที่ฉันได้อ่านในหัวข้อนี้ มันเขียนได้ดีชัดเจนลึกเข้าไปในทฤษฏีมากขึ้น เริ่มด้วยการแนะนำทั่วไป แต่มากกว่าการทบทวนวิธีและอัลกอริทึมที่ใช้กันมากที่สุด หากคุณต้องเลือกหนังสือเล่มเดียวฉันอยากจะแนะนำหนังสือเล่มนี้
คุณสามารถหาหนังสือหลายเล่มเกี่ยวกับการประมวลผลภาษาธรรมชาติและการขุดข้อความที่เน้นการใช้ R ( tm library) หรือ Python ( nltk library) ได้อย่างง่ายดาย