ฉันต้องการทราบว่าคนของคุณมีแบบฝึกหัดที่ดี (รวดเร็วและตรงไปตรงมา) เกี่ยวกับแบบจำลองหัวข้อและ LDA สอนวิธีการตั้งค่าพารามิเตอร์บางอย่างโดยสังเขปว่าพวกเขาหมายถึงอะไรและเป็นไปได้ด้วยตัวอย่างจริง ๆ
ฉันต้องการทราบว่าคนของคุณมีแบบฝึกหัดที่ดี (รวดเร็วและตรงไปตรงมา) เกี่ยวกับแบบจำลองหัวข้อและ LDA สอนวิธีการตั้งค่าพารามิเตอร์บางอย่างโดยสังเขปว่าพวกเขาหมายถึงอะไรและเป็นไปได้ด้วยตัวอย่างจริง ๆ
คำตอบ:
หากคุณกำลังทำงานใน R บทช่วยสอนของ Carson Sievert ในการใช้ LDA กับหัวข้อโมเดลในบทวิจารณ์ภาพยนตร์เป็นจุดเริ่มต้นที่ยอดเยี่ยม:
http://cpsievert.github.io/LDAvis/reviews/reviews.html
บทช่วยสอนนี้ใช้ประโยชน์จาก LDAvis การสร้างภาพข้อมูลเชิงโต้ตอบของหัวข้อและการกระจายคำที่สามารถช่วยปรีชาได้อย่างแท้จริง
นอกจากนี้แม้ว่าจะไม่สั้น แต่การบรรยายของ David M. Blei ในหัวข้อแบบจำลองเป็นแหล่งข้อมูลที่ดีสำหรับการทำความเข้าใจความหมายของพารามิเตอร์: http://videolectures.net/mlss09uk_blei_tm/
ฉันขอแนะนำบทช่วยสอนนี้: การเริ่มต้นกับการสร้างแบบจำลองหัวข้อและ MALLET
นี่คือลิงค์เพิ่มเติมเพื่อช่วยให้คุณเริ่มต้น ...
วัสดุเบื้องต้นที่ดี (รวมถึงลิงก์ไปยังรายงานการวิจัย): http://www.cs.princeton.edu/~blei/topicmodeling.html
ซอฟต์แวร์:
มากยิ่งขึ้นที่นี่ในบล็อกการประเมินแบบลำเอียง: รายการแบบจำลองหัวข้อการอ่าน
หากคุณกำลังมองหาสิ่งที่ง่ายในการเริ่มต้นและใช้งานง่ายฉันจะแนะนำสิ่งนี้
โครงการ Clarin-D ได้รวบรวมคำแนะนำที่ดีที่จะแบบฝึกหัดสำหรับการสร้างแบบจำลองและหัวข้อ LDA ในการเรียนการสอนการเรียนรู้วัสดุ ans สะสม (Telemaco)เว็บไซต์เจ้าภาพโดยUniversität des Saarlandesศูนย์ Clarin
ผมขอแนะนำให้พยายามเรียนรู้เครื่องพลูของ Gensimกวดวิชา มันจะให้ภาพรวมแบบองค์รวมบน NLP และ LDA รวมถึง: วิธีการประมวลผลข้อมูลของคุณล่วงหน้าทำวิศวกรรมคุณสมบัติและใช้ LDA