คุณสมบัติใดที่ใช้โดยทั่วไปจากต้นการแยกวิเคราะห์ในกระบวนการจำแนกใน NLP


13

ฉันกำลังสำรวจโครงสร้างต้นไม้แยกวิเคราะห์ประเภทต่างๆ โครงสร้างการแยกวิเคราะห์ต้นไม้ที่รู้จักกันอย่างกว้างขวางทั้งสองคือก) การแยกวิเคราะห์ต้นไม้ตามโครงสร้างและข) โครงสร้างการแยกวิเคราะห์ต้นไม้ที่ขึ้นอยู่กับการพึ่งพา

ฉันสามารถใช้สร้างโครงสร้างการแยกวิเคราะห์ต้นไม้ทั้งสองชนิดโดยใช้แพ็คเกจ Stanford NLP อย่างไรก็ตามฉันไม่แน่ใจว่าจะใช้โครงสร้างต้นไม้เหล่านี้สำหรับงานการจัดหมวดหมู่ของฉันได้อย่างไร

ตัวอย่างเช่นถ้าฉันต้องการวิเคราะห์ความเชื่อมั่นและต้องการจัดหมวดหมู่ข้อความเป็นคลาสบวกและลบฉันสามารถใช้คุณลักษณะใดได้บ้างจากโครงสร้างการแยกวิเคราะห์ต้นไม้สำหรับงานการจัดหมวดหมู่ของฉัน

คำตอบ:


9

โดยการใช้แผนภูมิแยกวิเคราะห์คุณแบ่งประโยคของคุณเป็นส่วน ๆ สมมติว่าในตัวอย่างของการวิเคราะห์ความเชื่อมั่นคุณสามารถใช้ชิ้นส่วนเหล่านั้นเพื่อกำหนดความเชื่อมั่นในเชิงบวก / เชิงลบให้กับแต่ละส่วนแล้วนำผลสะสมของชิ้นส่วนเหล่านั้นมาใช้

การวิเคราะห์ความเชื่อมั่น

ภาพนี้จะช่วยให้คุณเข้าใจมากขึ้น ในช่วงครึ่งปีแรกมีความเชื่อมั่นในเชิงลบ (ส่วนใหญ่เป็นเพราะคำว่า "แห้ง") แต่เป็นเพราะคำว่า "แต่" และ "การใช้คำว่า" สนุก "ความรู้สึกเชิงลบจะเปลี่ยนเป็นความรู้สึกเชิงบวก

สำหรับการใช้พวกมันคุณสามารถสร้างคำแทนเวกเตอร์ของแต่ละคำในประโยคและใช้เซลล์ประสาทแทนโหนดแม่ เซลล์ประสาทแต่ละอันควรเชื่อมต่อกับเซลล์ประสาทอื่นด้วยน้ำหนัก โหนดใบไม้ทั้งหมดจะเป็นคำแทนเวกเตอร์ของคำในประโยค เซลล์ต้นกำเนิดอันดับต้น ๆ (ในกรณีนี้สัญลักษณ์สีน้ำเงิน + บนสุด) ควรสร้างความเชื่อมั่นที่เป็นบวก / ลบตามประโยค โครงสร้างต้นไม้นี้สามารถฝึกอบรมในลักษณะที่ได้รับการดูแล

อ่านบทความนี้เพื่อทำความเข้าใจเพิ่มเติม

เครดิตรูปภาพ: cs224.stanford.edu


1

ฉันคิดว่าการพึ่งพาสามารถนำมาใช้เพื่อปรับปรุงความถูกต้องของตัวแยกประเภทความเชื่อมั่นของคุณ ลองพิจารณาตัวอย่างต่อไปนี้:

E1: บิลไม่ใช่นักวิทยาศาสตร์

และสมมติว่าโทเค็น "นักวิทยาศาสตร์" มีความรู้สึกเชิงบวกในโดเมนเฉพาะ

รู้ว่าการพึ่งพา neg (นักวิทยาศาสตร์ไม่ใช่) เราสามารถเห็นได้ว่าตัวอย่างข้างต้นมีความรู้สึกเชิงลบ เราอาจจำแนกประโยคว่าเป็นสิ่งที่ดี

การอ้างอิงประเภทอื่นสามารถใช้ในลักษณะเดียวกันเพื่อปรับปรุงความแม่นยำของตัวแยกประเภท

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.