อะไรคือความแตกต่างระหว่างการเรียนรู้แบบมีผู้สอนและไม่ได้รับการดูแล?


28

ฉันพยายามทำความเข้าใจวิธีการจัดกลุ่ม

สิ่งที่ฉันคิดว่าฉันเข้าใจ:

  1. ในการเรียนรู้ภายใต้การดูแลข้อมูลจะถูกกำหนดให้หมวดหมู่ / ป้ายกำกับก่อนการคำนวณ ดังนั้นจึงมีการใช้เลเบลคลาสหรือหมวดหมู่เพื่อ "เรียนรู้" พารามิเตอร์ที่มีความสำคัญสำหรับกลุ่มเหล่านั้น

  2. ในการเรียนรู้ที่ไม่มีการดูแลชุดข้อมูลจะถูกกำหนดให้กับกลุ่มโดยไม่ทราบว่าเป็นกลุ่มใด

นั่นหมายความว่าถ้าฉันไม่รู้ด้วยซ้ำว่าพารามิเตอร์ใดมีความสำคัญต่อการแบ่งกลุ่มฉันควรเลือกการเรียนรู้แบบมีผู้สอนหรือไม่


2
ขอให้สังเกตว่าการจัดกลุ่มไม่ใช่เพียงการเรียนรู้แบบไม่สำรองเท่านั้น
จอร์จ

1
การเรียนรู้ภายใต้การดูแลเป็นที่ต้องการเมื่อมีข้อมูลการฝึกอบรมกำกับ คุณสามารถแบ่งพาร์ติชันข้อมูลของคุณโดยใช้วิธีการที่อยู่ภายใต้การดูแลหรือไม่ดูแล ความแตกต่างที่สำคัญคือในการตั้งค่าภายใต้การดูแลคุณจะทราบการแบ่งส่วนที่ถูกต้องสำหรับข้อมูลการฝึกอบรมของคุณ
Nick

คำตอบ:


23

ความแตกต่างคือในการเรียนรู้ภายใต้การดูแลภายใต้การเรียนรู้แบบ "หมวดหมู่" "คลาส" หรือ "ป้ายกำกับ" ในการเรียนรู้ที่ไม่มีการดูแลพวกเขาจะไม่และกระบวนการเรียนรู้พยายามค้นหา "หมวดหมู่" ที่เหมาะสม ในการเรียนรู้ทั้งสองชนิดพารามิเตอร์ทั้งหมดจะถูกพิจารณาเพื่อกำหนดว่าเหมาะสมที่สุดในการจำแนกประเภทหรือไม่

ไม่ว่าคุณจะเลือกภายใต้การดูแลหรือไม่ได้รับการดูแลควรขึ้นอยู่กับว่าคุณรู้หรือไม่ว่า "หมวดหมู่" ของข้อมูลของคุณคืออะไร ถ้าคุณรู้ให้ใช้การเรียนรู้แบบมีผู้สอน หากคุณไม่ทราบให้ใช้ unsupervised

เนื่องจากคุณมีพารามิเตอร์จำนวนมากและคุณไม่ทราบว่ามีพารามิเตอร์ใดบ้างที่เกี่ยวข้องคุณสามารถใช้การวิเคราะห์องค์ประกอบหลักการเพื่อช่วยพิจารณาพารามิเตอร์ที่เกี่ยวข้อง


13

โปรดทราบว่ามีการควบคุมมากกว่า 2 องศา ตัวอย่างเช่นดูหน้า 24-25 (6-7) ในวิทยานิพนธ์ปริญญาเอกของChristian Biemann, การประมวลผลภาษาธรรมชาติที่ปราศจากความรู้และปราศจากความรู้ในกระบวนทัศน์การค้นพบโครงสร้าง, 2007

วิทยานิพนธ์ระบุ 4 องศา: ภายใต้การดูแลควบคุมแบบกึ่งกำกับดูแลอ่อนแอและไม่ดูแลและอธิบายความแตกต่างในบริบทการประมวลผลภาษาธรรมชาติ นี่คือคำจำกัดความที่เกี่ยวข้อง:

  • ในระบบที่อยู่ภายใต้การดูแลข้อมูลที่ปรากฏในอัลกอริทึมการเรียนรู้ของเครื่องจะถูกระบุไว้อย่างสมบูรณ์ นั่นหมายถึง: ตัวอย่างทั้งหมดจะแสดงด้วยการจำแนกประเภทที่เครื่องมีความหมายในการทำซ้ำ สำหรับเรื่องนี้ลักษณนามได้รับการเรียนรู้จากข้อมูลกระบวนการของการกำหนดป้ายกำกับให้กับอินสแตนซ์ที่มองไม่เห็นเรียกว่าการจำแนกประเภท
  • ในระบบแบบกึ่งควบคุมเครื่องจะได้รับอนุญาตให้นำข้อมูลที่ไม่มีป้ายกำกับมาพิจารณาเพิ่มเติม เนื่องจากพื้นฐานของข้อมูลที่มีขนาดใหญ่ขึ้นระบบกึ่งควบคุมมักจะมีประสิทธิภาพสูงกว่าคู่ที่ควบคุมโดยใช้ตัวอย่างป้ายกำกับเดียวกัน เหตุผลในการปรับปรุงนี้คือข้อมูลที่ไม่ได้ติดฉลากทำให้ระบบสามารถสร้างแบบจำลองโครงสร้างที่แท้จริงของข้อมูลได้อย่างแม่นยำมากขึ้น
  • ความร่วมมือที่เรียกว่าตัวเองฝึกอบรมเป็นรูปแบบของการเรียนรู้ที่ถูกออกแบบมาเพื่อใช้ในการฝึกอบรมแม้แต่น้อยตัวอย่างดังนั้นบางครั้งเรียกว่าอ่อนภายใต้การดูแล Bootstrapping เริ่มต้นด้วยตัวอย่างการฝึกอบรมสองสามตัวอย่างฝึกอบรมตัวจําแนกและใช้ตัวอย่างเชิงบวกที่คิดว่าเป็นไปตามที่ตัวจําแนกนี้ให้การฝึกอบรมใหม่ เมื่อชุดของตัวอย่างการฝึกอบรมเพิ่มขึ้นตัวจําแนกจะดีขึ้นหากว่าไม่มีตัวอย่างเชิงลบจํานวนมากเกินไปที่ถูกจัดประเภทไว้ในเชิงบวกซึ่งอาจนําไปสู่การเสื่อมประสิทธิภาพ
  • หากินระบบจะไม่ให้ตัวอย่างการฝึกอบรมใด ๆ และการดำเนินการจัดกลุ่ม นี่คือการแบ่งอินสแตนซ์ข้อมูลออกเป็นหลายกลุ่ม ผลลัพธ์ของอัลกอริทึมการจัดกลุ่มเป็นข้อมูลที่ขับเคลื่อนด้วยดังนั้นจึงเป็น 'ธรรมชาติ' และเหมาะสมกับโครงสร้างพื้นฐานของข้อมูล ข้อได้เปรียบนี้ยังเป็นข้อเสียเปรียบที่สำคัญ: หากไม่มีความเป็นไปได้ที่จะบอกเครื่องว่าต้องทำอย่างไร (เช่นในการจำแนกประเภท) มันเป็นการยากที่จะตัดสินคุณภาพของการจัดกลุ่มผลลัพธ์แบบสรุป แต่การขาดการเตรียมตัวอย่างการฝึกอบรมทำให้กระบวนทัศน์ที่ไม่มีผู้ดูแลดึงดูดความสนใจมาก

0

ในการเรียนรู้ภายใต้การดูแลชั้นเรียนจะทราบล่วงหน้าและประเภทของพวกเขาเช่นลูกค้าสองชั้นดีและไม่ดี เมื่อวัตถุใหม่ (ลูกค้า) มาบนพื้นฐานของคุณลักษณะของมันลูกค้าสามารถกำหนดให้กับระดับลูกค้าที่ไม่ดีหรือดี

ในการเรียนรู้กลุ่ม / ชั้นเรียนแบบไม่มีผู้รู้แจ้งเรามีวัตถุ (ลูกค้า) ดังนั้นจึงจัดกลุ่มลูกค้าที่มีพฤติกรรมการซื้อที่คล้ายคลึงกันดังนั้นกลุ่มที่แตกต่างกันนั้นทำจากลูกค้านั่นคือไม่รู้จักกันบนพื้นฐานของนิสัยการซื้อที่คล้ายกัน


0

ในการเรียนรู้ภายใต้การดูแลการส่งออก (ตัวแปรตาม) ขึ้นอยู่กับตัวแปรอินพุท (ตัวแปรอิสระ) ในชุดการกำกับดูแลบางชุดผู้ตอบกลับจะพยายามคำนวณเป้าหมายที่ต้องการ

ในการเรียนรู้ที่ไม่มีการดูแลไม่มีการควบคุมดังนั้นระบบพยายามปรับตัวเองให้เข้ากับสถานการณ์และเรียนรู้ด้วยตนเองตามมาตรการบางอย่าง

เช่น: ครูในชั้นเรียน - การเรียนการสอน - การเรียนรู้ด้วยตนเองวิชาเลือกด้วยตนเองในชั้นเรียน - ไม่มีการนิเทศ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.