การเรียนแบบกึ่งมีผู้เรียน, การเรียนแบบกระตือรือร้นและการเรียนรู้ลึกเพื่อการจำแนกประเภท


19

การแก้ไขครั้งสุดท้ายพร้อมการอัปเดตทรัพยากรทั้งหมด:

สำหรับโครงการฉันกำลังใช้อัลกอริธึมการเรียนรู้ของเครื่องเพื่อจัดหมวดหมู่

ถาม:ข้อมูลที่มีป้ายกำกับค่อนข้าง จำกัด และข้อมูลที่ไม่มีป้ายกำกับอีกมากมาย

เป้าหมาย:

  1. ใช้การจำแนกประเภทภายใต้การดูแล
  2. ใช้กระบวนการการติดฉลากแบบกึ่งกำกับอย่างใด (ที่รู้จักกันว่าการเรียนรู้ที่ใช้งานอยู่)

ฉันได้พบข้อมูลจำนวนมากจากงานวิจัยเช่นการใช้ EM, Transductive SVM หรือ S3VM (Semi Supervised SVM) หรือใช้ LDA อย่างอื่นเป็นต้นแม้จะมีหนังสือไม่กี่เล่มในหัวข้อนี้

คำถาม: การใช้งานและแหล่งข้อมูลที่เป็นประโยชน์อยู่ที่ไหน?


อัปเดตครั้งสุดท้าย (ขึ้นอยู่กับความช่วยเหลือที่จัดทำโดย mpiktas, bayer และ Dikran Marsupial)

การเรียนรู้แบบกึ่งภายใต้การดูแล:

การเรียนรู้ที่ใช้งานอยู่:

  • Dualist : การใช้งานการเรียนรู้อย่างคล่องแคล่วด้วยซอร์สโค้ดในการจำแนกข้อความ
  • หน้าเว็บนี้ให้ภาพรวมที่ยอดเยี่ยมของการเรียนรู้ที่กระตือรือร้น
  • การประชุมเชิงปฏิบัติการการออกแบบการทดลอง: ที่นี่

การเรียนรู้ลึก:

  • วิดีโอแนะนำที่นี่
  • เว็บไซต์ทั่วไป
  • สแตนฟอ Unsupervised คุณลักษณะการเรียนรู้และการเรียนรู้ลึกกวดวิชา

มีแพคเกจ R คือRTextTools ถ้าฉันไม่ผิดมันใช้วิธีการต่าง ๆ ที่คุณพูดถึง
mpiktas

สวัสดี mpiktas ขอบคุณสำหรับความช่วยเหลือของคุณ มันเป็นชุดเครื่องมือที่น่าสนใจ อย่างไรก็ตามดูเหมือนว่าจะเกี่ยวข้องกับการเรียนรู้ภายใต้การดูแลเท่านั้นขณะที่ฉันอ่าน "TextTools เป็นชุดการเรียนรู้ของเครื่องโอเพ่นซอร์สฟรีสำหรับการจำแนกข้อความอัตโนมัติที่ทำให้ง่ายสำหรับผู้เริ่มต้นและผู้ใช้ขั้นสูงในการเริ่มต้นการเรียนรู้ภายใต้การดูแล เก้าอัลกอริทึมสำหรับการจำแนกวงดนตรี (svm, slda, การส่งเสริม, การบรรจุ, การสุ่มป่า, glmnet, ต้นไม้การตัดสินใจ, โครงข่ายประสาทเทียม, เอนโทรปีสูงสุด) "
Flake

ตกลงนี่คือลองอื่น: Weka ผู้เขียนได้เขียนหนังสือและสารบัญของมันกล่าวถึงการเรียนรู้แบบกึ่งภายใต้การดูแล ผมหวังว่าบทที่ไม่ได้จบด้วย "... น่าเสียดายที่ไม่มีขั้นตอนวิธีการเหล่านี้จะถูกนำมาใช้ใน Weka" :)
mpiktas

Drat ฉันได้หนังสือรุ่นเก่า! ขอบคุณมากสำหรับการชี้แหล่งที่มานี้!
เกล็ด

คำตอบ:


8

ดูเหมือนว่าการเรียนรู้อย่างลึกซึ้งอาจจะน่าสนใจสำหรับคุณ นี่เป็นฟิลด์ล่าสุดของโมเดลการเชื่อมต่อที่ลึกซึ่งถูกกำหนดในลักษณะที่ไม่ได้รับการดูแลและปรับหลังจากนั้นด้วยการควบคุม การปรับจูนแบบละเอียดนั้นต้องการตัวอย่างน้อยกว่าการเตรียมล่วงหน้า

ให้เปียกลิ้นของคุณผมขอแนะนำ [Semantig Hashing Salakhutdinov ฮินตัน ดูรหัสที่พบสำหรับเอกสารที่แตกต่างกันของคลังข้อมูล Reuters: (unsupervised!)

ป้อนคำอธิบายรูปภาพที่นี่

หากคุณจำเป็นต้องใช้รหัสบางส่วนดำเนินการตรวจสอบdeeplearning.net ฉันไม่เชื่อว่ามีวิธีแก้ปัญหาแบบกล่องอยู่ดี


นี่เป็นข้อมูลที่น่าสนใจและใหม่สำหรับฉัน แน่นอนว่าการใช้งานนอกกรอบจะดีกว่า แต่สิ่งนี้ช่วยให้ฉันรู้อะไรบางอย่างที่ใกล้เคียงกับสิ่งที่ฉันต้องการ ขอบคุณ
เกล็ด

5

Isabelle Guyon (และเพื่อนร่วมงาน) ได้จัดการกับความท้าทายในการเรียนรู้ที่ใช้งานอยู่ครู่หนึ่งการตีพิมพ์เผยแพร่ที่นี่ (การเข้าถึงแบบเปิด) นี่เป็นข้อได้เปรียบของการใช้งานได้จริงและคุณสามารถเปรียบเทียบการแสดงของวิธีการต่าง ๆ ภายใต้โปรโตคอลที่เป็นกลาง (ในแง่ภาษาพูด) (การเลือกรูปแบบสุ่มเป็นการยากที่จะเอาชนะ)


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.