ในบริบทของการเรียนรู้ของเครื่องสิ่งที่แตกต่างกันคืออะไร
- การเรียนรู้แบบไม่มีผู้ดูแล
- การเรียนรู้ภายใต้การดูแลและ
- การเรียนรู้แบบกึ่งภายใต้การดูแล?
และวิธีการบางอย่างของอัลกอริทึมหลักในการดูคืออะไร?
ในบริบทของการเรียนรู้ของเครื่องสิ่งที่แตกต่างกันคืออะไร
และวิธีการบางอย่างของอัลกอริทึมหลักในการดูคืออะไร?
คำตอบ:
โดยทั่วไปแล้วปัญหาของการเรียนรู้ของเครื่องอาจได้รับการพิจารณาความหลากหลายในการประเมินฟังก์ชั่นสำหรับการจำแนกการทำนายหรือการสร้างแบบจำลอง
ในการเรียนรู้แบบมีผู้สอนจะมีอินพุต ( , , ... ,) และเอาท์พุท ( , , ... ,) และถูกท้าทายด้วยการหาฟังก์ชั่นที่ใกล้เคียงกับพฤติกรรมนี้ในรูปแบบที่สามารถสรุปได้ทั่วไป ผลลัพธ์อาจเป็นฉลากคลาส (ในการจำแนกประเภท) หรือจำนวนจริง (ในการถดถอย) - นี่คือ "การกำกับดูแล" ในการเรียนรู้แบบมีผู้สอน
ในกรณีของการเรียนรู้ที่ไม่สำรองในกรณีพื้นฐานคุณจะได้รับอินพุต , , ... , แต่จะไม่มีเอาต์พุตเป้าหมายและไม่มีรางวัลจากสภาพแวดล้อม จากปัญหา (จำแนกหรือทำนาย) และความรู้พื้นฐานของพื้นที่ตัวอย่างคุณอาจใช้วิธีการต่าง ๆ : การประเมินความหนาแน่น (ประมาณ PDF พื้นฐานบางอย่างสำหรับการทำนาย), การจัดกลุ่ม k-mean (จำแนกข้อมูลมูลค่าจริงที่ไม่มีป้ายกำกับ), k- การจัดกลุ่มโหมด (การจำแนกข้อมูลหมวดหมู่แบบไม่มีป้ายกำกับ) ฯลฯ
การเรียนรู้แบบกึ่งกำกับดูแลเกี่ยวข้องกับการประเมินฟังก์ชั่นเกี่ยวกับข้อมูลที่ติดป้ายกำกับและไม่มีป้ายกำกับ วิธีการนี้ได้รับแรงบันดาลใจจากความจริงที่ว่าข้อมูลที่ติดป้ายมักจะมีค่าใช้จ่ายสูงในการสร้างในขณะที่ข้อมูลที่ไม่มีป้ายกำกับนั้นโดยทั่วไปจะไม่ ความท้าทายที่นี่ส่วนใหญ่เกี่ยวข้องกับคำถามทางเทคนิคของวิธีการรักษาข้อมูลที่ผสมในรูปแบบนี้ ดูการสำรวจวรรณกรรมเพื่อการเรียนรู้แบบกึ่งกำกับดูแลนี้สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับวิธีการเรียนรู้แบบกึ่งกำกับ
นอกเหนือจากการเรียนรู้ประเภทนี้แล้วยังมีอื่น ๆ อีกเช่นการเรียนรู้การเสริมแรงโดยวิธีการเรียนรู้มีปฏิสัมพันธ์กับสภาพแวดล้อมของมันด้วยการสร้างการกระทำ , , . .. ที่สร้างรางวัลหรือบทลงโทษ , , ...
การเรียนรู้ที่ไม่จำเป็น
การเรียนรู้ที่ไม่ได้สำรองไว้คือเมื่อคุณไม่มีข้อมูลกำกับสำหรับการฝึกอบรม ตัวอย่างนี้มักจะวิธีการจัดกลุ่ม
การเรียนรู้ภายใต้การดูแล
ในกรณีนี้ข้อมูลการฝึกอบรมของคุณไม่มีข้อมูลกำกับ ปัญหาที่คุณแก้ไขที่นี่มักจะทำนายเลเบลสำหรับจุดข้อมูลที่ไม่มีเลเบล
การเรียนรู้แบบกึ่งกำกับ
ในกรณีนี้จะใช้ทั้งข้อมูลที่มีป้ายกำกับและข้อมูลที่ไม่มีป้ายกำกับ ตัวอย่างนี้สามารถใช้ในเครือข่ายความเชื่อลึกที่บางเลเยอร์กำลังเรียนรู้โครงสร้างของข้อมูล (unsupervised) และใช้เลเยอร์หนึ่งเพื่อจัดหมวดหมู่ (ฝึกอบรมด้วยข้อมูลภายใต้การดูแล)
ฉันไม่คิดว่าการดูแล / unsupervised เป็นวิธีที่ดีที่สุดที่จะคิดเกี่ยวกับมัน สำหรับการทำเหมืองข้อมูลขั้นพื้นฐานคุณควรคิดถึงสิ่งที่คุณพยายามทำ มีภารกิจหลักที่สี่:
คาดการณ์. หากคุณทำนายจำนวนจริงจะเรียกว่าการถดถอย หากคุณกำลังทำนายจำนวนหรือคลาสทั้งหมดจะเรียกว่าการจำแนกประเภท
สร้างหุ่นจำลอง การสร้างแบบจำลองเหมือนกับการทำนาย แต่แบบจำลองนั้นสามารถเข้าใจได้โดยมนุษย์ โครงข่ายใยประสาทเทียมและเครื่องเวกเตอร์สนับสนุนทำงานได้ดี แต่อย่าสร้างโมเดลที่เข้าใจได้ [1] ต้นไม้การตัดสินใจและการถดถอยเชิงเส้นแบบคลาสสิกเป็นตัวอย่างของแบบจำลองที่เข้าใจง่าย
ความคล้ายคลึงกัน หากคุณพยายามค้นหากลุ่มของคุณสมบัติตามธรรมชาติมันจะเรียกว่าการวิเคราะห์ปัจจัย หากคุณกำลังพยายามค้นหากลุ่มสังเกตธรรมชาติจะเรียกว่าการจัดกลุ่ม
สมาคม. มันเหมือนกับความสัมพันธ์ แต่สำหรับชุดข้อมูลไบนารีขนาดใหญ่
[1] เห็นได้ชัดว่าโกลด์แมนแซคส์สร้างเครือข่ายประสาทเทียมที่ยอดเยี่ยมเพื่อการทำนาย แต่ก็ไม่มีใครเข้าใจพวกเขาดังนั้นพวกเขาจึงต้องเขียนโปรแกรมอื่น ๆ เพื่อพยายามอธิบายโครงข่ายประสาทเทียม