ใช้ liblinear กับข้อมูลขนาดใหญ่สำหรับการวิเคราะห์ความหมาย


17

ฉันใช้Libsvmเพื่อฝึกอบรมข้อมูลและทำนายการจำแนกปัญหาการวิเคราะห์ความหมาย แต่มันก็มีผลการดำเนินงานปัญหากับข้อมูลขนาดใหญ่เนื่องจากความกังวลเกี่ยวกับการวิเคราะห์ความหมายn มิติปัญหา

เมื่อปีที่แล้วLiblinearได้เปิดตัวและสามารถแก้ไขปัญหาคอขวดของประสิทธิภาพได้ แต่มันก็มีค่าใช้จ่ายมากเกินไปหน่วยความจำ คือMapReduceวิธีเดียวที่จะแก้ปัญหาการวิเคราะห์ความหมายเกี่ยวกับข้อมูลขนาดใหญ่? หรือมีวิธีอื่นใดที่สามารถปรับปรุงคอขวดของหน่วยความจำบนLiblinear ได้หรือไม่?

คำตอบ:


11

ทราบว่ามีเป็นรุ่นแรกของ LIBLINEAR รังเพลิงApache Spark ดูความคิดเห็นรายการจดหมายสำหรับรายละเอียดบางต้นและเว็บไซต์ของโครงการ


ขอบคุณสำหรับคำตอบ. ดูเหมือนว่าจะแตกต่างจาก SVM ฉันจะสำรวจมัน :)
Puffin GDI

4
เพียงเตือนความจำว่าเราไม่สนับสนุนให้เชื่อมโยงนอกไซต์กับคำตอบเพราะมันง่ายสำหรับการเชื่อมโยงที่จะทำลายทำให้ทรัพยากรชุมชนที่มีประโยชน์เป็นอย่างอื่นแทนกลายเป็นทางตัน เป็นการดีที่สุดที่จะใส่คำตอบลงในโพสต์ของคุณโดยตรง
อานา

1
เห็นด้วยกับที่ ณ จุดนี้มันแทบจะไม่เป็นมากกว่าลิงค์ใด ๆ ฉันจะเพิ่มลิงค์ไปยังโครงการพื้นฐาน
Sean Owen

10

คุณสามารถตรวจสอบWabbit vowpal มันค่อนข้างเป็นที่นิยมสำหรับการเรียนรู้ขนาดใหญ่และมีบทบัญญัติแบบขนาน

จากเว็บไซต์ของพวกเขา:

VW เป็นสาระสำคัญของความเร็วในการเรียนรู้ของเครื่องจักรสามารถเรียนรู้จากชุดข้อมูลเทราฟีเอเรได้อย่างง่ายดาย ผ่านการเรียนรู้แบบขนานมันสามารถเกินกว่าปริมาณงานของอินเทอร์เฟซเครือข่ายเครื่องเดียวเมื่อทำการเรียนรู้เชิงเส้นซึ่งเป็นหนึ่งในขั้นตอนวิธีการเรียนรู้


1
โอเพ่นซอร์สและวิกิบางอย่าง มันดูดี. ขอบคุณสำหรับคำแนะนำของคุณ :)
Puffin GDI
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.