การเรียนรู้แบบไม่ควบคุมดูแลและแบบกึ่งควบคุม


27

ในบริบทของการเรียนรู้ของเครื่องสิ่งที่แตกต่างกันคืออะไร

  • การเรียนรู้แบบไม่มีผู้ดูแล
  • การเรียนรู้ภายใต้การดูแลและ
  • การเรียนรู้แบบกึ่งภายใต้การดูแล?

และวิธีการบางอย่างของอัลกอริทึมหลักในการดูคืออะไร?


8
อันดับแรกสองบรรทัดจากวิกิ: "ในวิทยาการคอมพิวเตอร์การเรียนรู้แบบกึ่งกำกับเป็นชั้นเรียนของเทคนิคการเรียนรู้ของเครื่องที่ใช้ประโยชน์จากข้อมูลที่มีป้ายกำกับและไม่มีป้ายกำกับสำหรับการฝึกอบรม - โดยทั่วไปแล้วเป็นข้อมูลที่ติดป้ายจำนวนเล็กน้อย การเรียนรู้แบบกึ่งภายใต้การดูแลจะอยู่ระหว่างการเรียนรู้ที่ไม่ได้รับการดูแล (ไม่มีข้อมูลการฝึกอบรมที่มีป้ายกำกับ) และการเรียนรู้แบบมีผู้สอน มันช่วยได้ไหม

คุณมีอะไรในใจกับ "วิธีการขั้นตอนวิธี"? ฉันให้ตัวอย่างแอปพลิเคชันในคำตอบของฉันนั่นคือสิ่งที่คุณกำลังมองหา?
Peter Smit

คำตอบ:


20

โดยทั่วไปแล้วปัญหาของการเรียนรู้ของเครื่องอาจได้รับการพิจารณาความหลากหลายในการประเมินฟังก์ชั่นสำหรับการจำแนกการทำนายหรือการสร้างแบบจำลอง

ในการเรียนรู้แบบมีผู้สอนจะมีอินพุต ( , , ... ,) และเอาท์พุท ( , , ... ,) และถูกท้าทายด้วยการหาฟังก์ชั่นที่ใกล้เคียงกับพฤติกรรมนี้ในรูปแบบที่สามารถสรุปได้ทั่วไป ผลลัพธ์อาจเป็นฉลากคลาส (ในการจำแนกประเภท) หรือจำนวนจริง (ในการถดถอย) - นี่คือ "การกำกับดูแล" ในการเรียนรู้แบบมีผู้สอนx1x2y1y2

ในกรณีของการเรียนรู้ที่ไม่สำรองในกรณีพื้นฐานคุณจะได้รับอินพุต , , ... , แต่จะไม่มีเอาต์พุตเป้าหมายและไม่มีรางวัลจากสภาพแวดล้อม จากปัญหา (จำแนกหรือทำนาย) และความรู้พื้นฐานของพื้นที่ตัวอย่างคุณอาจใช้วิธีการต่าง ๆ : การประเมินความหนาแน่น (ประมาณ PDF พื้นฐานบางอย่างสำหรับการทำนาย), การจัดกลุ่ม k-mean (จำแนกข้อมูลมูลค่าจริงที่ไม่มีป้ายกำกับ), k- การจัดกลุ่มโหมด (การจำแนกข้อมูลหมวดหมู่แบบไม่มีป้ายกำกับ) ฯลฯx1x2

การเรียนรู้แบบกึ่งกำกับดูแลเกี่ยวข้องกับการประเมินฟังก์ชั่นเกี่ยวกับข้อมูลที่ติดป้ายกำกับและไม่มีป้ายกำกับ วิธีการนี้ได้รับแรงบันดาลใจจากความจริงที่ว่าข้อมูลที่ติดป้ายมักจะมีค่าใช้จ่ายสูงในการสร้างในขณะที่ข้อมูลที่ไม่มีป้ายกำกับนั้นโดยทั่วไปจะไม่ ความท้าทายที่นี่ส่วนใหญ่เกี่ยวข้องกับคำถามทางเทคนิคของวิธีการรักษาข้อมูลที่ผสมในรูปแบบนี้ ดูการสำรวจวรรณกรรมเพื่อการเรียนรู้แบบกึ่งกำกับดูแลนี้สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับวิธีการเรียนรู้แบบกึ่งกำกับ

นอกเหนือจากการเรียนรู้ประเภทนี้แล้วยังมีอื่น ๆ อีกเช่นการเรียนรู้การเสริมแรงโดยวิธีการเรียนรู้มีปฏิสัมพันธ์กับสภาพแวดล้อมของมันด้วยการสร้างการกระทำ , , . .. ที่สร้างรางวัลหรือบทลงโทษ , , ...a1a2r1r2


1
คำตอบของคุณบ่งบอกว่าการเรียนรู้แบบมีผู้สอนนั้นดีกว่าการเรียนแบบกึ่งมีผู้สอนซึ่งเป็นไปได้ ถูกต้องหรือไม่ ถ้าไม่การเรียนแบบกึ่งกำกับอาจจะดีกว่าเมื่อใด
naught101

@ naught101 คุณอ่านได้อย่างไรจากคำตอบของเขา? ฉันเห็นด้วยกับสิ่งที่จอห์นพูด แต่ฉันจะพูดตรงข้ามกับสิ่งที่คุณพูดนั่นคือการเรียนแบบกึ่งมีผู้ดูแลดีกว่าการเรียนรู้แบบมีผู้สอนในทุกที่ที่ทำได้ นั่นคือถ้าคุณมีข้อมูลที่มีป้ายกำกับและข้อมูลที่ไม่มีป้ายกำกับ (โดยปกติแล้วจะมากกว่าจำนวนข้อมูลที่มีป้ายกำกับ) คุณจะทำได้ดีกว่าถ้าคุณสามารถใช้ข้อมูลทั้งหมดได้มากกว่าที่จะใช้ข้อมูลที่ติดป้ายกำกับเท่านั้น จุดรวมของการใช้การเรียนรู้แบบมีผู้ดูแลคือการเกินประสิทธิภาพที่ได้รับโดยการเรียนรู้แบบมีผู้สอนหรือการเรียนรู้แบบไม่มีผู้ดูแล
HelloGoodbye

@HelloGoodbye: เพราะประโยชน์เพียงอย่างเดียวที่ระบุไว้สำหรับการเรียนรู้แบบกึ่งภายใต้การดูแลคือราคาถูกกว่าในบางกรณี ดูเหมือนว่าสมเหตุสมผลสำหรับฉันที่การเรียนรู้แบบมีผู้ดูแลอย่างเต็มที่จะง่ายขึ้นและแม่นยำยิ่งขึ้น (ทุกสิ่งเท่าเทียมกัน) เนื่องจากมีการให้ข้อมูลความจริงที่เป็นพื้นฐานมากขึ้น ดังนั้นฉันแค่ขอตัวอย่างที่ให้เลือกระหว่างทั้งสองจะได้รับการดูแลกึ่ง คุณแสดงความคิดเห็นไม่สมเหตุสมผล แต่มีกรณีที่ข้อมูลทั้งหมดมีป้ายกำกับและคุณยังคงต้องการการดูแลแบบกึ่ง
naught101

@ naught101 ฉันเดาว่าข้อมูลทั้งหมดมีป้ายกำกับคุณจะไม่ชนะมาก ๆ โดยใช้การเรียนรู้แบบกึ่งกำกับดูแลแทนที่จะใช้การเรียนรู้แบบมีผู้สอนปกติ เมื่อคุณมีข้อมูลที่ไม่มีป้ายกำกับจำนวนมากและทำการเรียนรู้แบบกึ่งภายใต้การดูแลเหตุผลหลักที่คุณเห็นประสิทธิภาพที่ดีขึ้นก็เพราะคุณถ่ายโอนการเรียนรู้และสามารถดึงประสบการณ์จากข้อมูลที่ไม่มีป้ายกำกับได้เช่นกัน
HelloGoodbye

@ naught101 อย่างไรก็ตามด้วยการให้เครือข่ายทำงานในการทำซ้ำข้อมูลอินพุตให้ได้มากที่สุดเท่าที่จะเป็นไปได้จากข้อมูลเอาต์พุต (เช่นการนำ autoencoder มาใช้ซึ่งเป็นการเรียนรู้แบบไม่สำรองข้อมูล) เครือข่ายจะถูกบังคับให้เรียนรู้ข้อมูลที่ดี นี่อาจเป็นรูปแบบของการทำให้เป็นระเบียบซึ่งในทางกลับกันก็สามารถพิสูจน์ได้ว่าเป็นประโยชน์ ดังนั้นอาจมีการชนะเล็กน้อยจากการใช้การเรียนรู้แบบมีผู้ดูแลแทนการเรียนรู้แบบมีผู้สอนปกติแม้ว่าข้อมูลทั้งหมดจะถูกระบุไว้ แม้ว่าเอฟเฟกต์นี้จะใหญ่แค่ไหนฉันไม่รู้
HelloGoodbye

13

การเรียนรู้ที่ไม่จำเป็น

การเรียนรู้ที่ไม่ได้สำรองไว้คือเมื่อคุณไม่มีข้อมูลกำกับสำหรับการฝึกอบรม ตัวอย่างนี้มักจะวิธีการจัดกลุ่ม

การเรียนรู้ภายใต้การดูแล

ในกรณีนี้ข้อมูลการฝึกอบรมของคุณไม่มีข้อมูลกำกับ ปัญหาที่คุณแก้ไขที่นี่มักจะทำนายเลเบลสำหรับจุดข้อมูลที่ไม่มีเลเบล

การเรียนรู้แบบกึ่งกำกับ

ในกรณีนี้จะใช้ทั้งข้อมูลที่มีป้ายกำกับและข้อมูลที่ไม่มีป้ายกำกับ ตัวอย่างนี้สามารถใช้ในเครือข่ายความเชื่อลึกที่บางเลเยอร์กำลังเรียนรู้โครงสร้างของข้อมูล (unsupervised) และใช้เลเยอร์หนึ่งเพื่อจัดหมวดหมู่ (ฝึกอบรมด้วยข้อมูลภายใต้การดูแล)


7

ฉันไม่คิดว่าการดูแล / unsupervised เป็นวิธีที่ดีที่สุดที่จะคิดเกี่ยวกับมัน สำหรับการทำเหมืองข้อมูลขั้นพื้นฐานคุณควรคิดถึงสิ่งที่คุณพยายามทำ มีภารกิจหลักที่สี่:

  1. คาดการณ์. หากคุณทำนายจำนวนจริงจะเรียกว่าการถดถอย หากคุณกำลังทำนายจำนวนหรือคลาสทั้งหมดจะเรียกว่าการจำแนกประเภท

  2. สร้างหุ่นจำลอง การสร้างแบบจำลองเหมือนกับการทำนาย แต่แบบจำลองนั้นสามารถเข้าใจได้โดยมนุษย์ โครงข่ายใยประสาทเทียมและเครื่องเวกเตอร์สนับสนุนทำงานได้ดี แต่อย่าสร้างโมเดลที่เข้าใจได้ [1] ต้นไม้การตัดสินใจและการถดถอยเชิงเส้นแบบคลาสสิกเป็นตัวอย่างของแบบจำลองที่เข้าใจง่าย

  3. ความคล้ายคลึงกัน หากคุณพยายามค้นหากลุ่มของคุณสมบัติตามธรรมชาติมันจะเรียกว่าการวิเคราะห์ปัจจัย หากคุณกำลังพยายามค้นหากลุ่มสังเกตธรรมชาติจะเรียกว่าการจัดกลุ่ม

  4. สมาคม. มันเหมือนกับความสัมพันธ์ แต่สำหรับชุดข้อมูลไบนารีขนาดใหญ่

[1] เห็นได้ชัดว่าโกลด์แมนแซคส์สร้างเครือข่ายประสาทเทียมที่ยอดเยี่ยมเพื่อการทำนาย แต่ก็ไม่มีใครเข้าใจพวกเขาดังนั้นพวกเขาจึงต้องเขียนโปรแกรมอื่น ๆ เพื่อพยายามอธิบายโครงข่ายประสาทเทียม


คุณสามารถให้ข้อมูลเพิ่มเติมเกี่ยวกับเรื่องราว GS ได้ไหม (ไม่แน่ใจว่าทำไมฉันไม่สามารถแสดงความคิดเห็นโดยตรงกับความคิดเห็นของคุณ)
YA

ฉันจำไม่ได้ว่าฉันอ่านตรงไหน แต่นี่คือข้อมูลเพิ่มเติมเกี่ยวกับ AI @ GS: hplusmagazine.com/2009/08/06//
Neil McGuigan

ฉันมีความรู้สึกเช่นนี้ว่า 1,2 อธิบายการเรียนรู้ในสถานที่ภายใต้การดูแลและ 3,4 อาศัยอยู่ในสถานที่ที่ไม่มีผู้ดูแล ยังไงถ้าคุณมองหาความคล้ายคลึงกันเพื่อทำนาย? นั่นคือการพิจารณาการสร้างแบบจำลอง?
นาย Tsjolder
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.