ในแง่ของปัญญาประดิษฐ์และการเรียนรู้ของเครื่องอะไรคือความแตกต่างระหว่างการเรียนรู้แบบมีผู้สอนและไม่ได้รับการดูแล? คุณสามารถให้คำอธิบายพื้นฐานที่ง่ายและเป็นตัวอย่างได้หรือไม่?
ในแง่ของปัญญาประดิษฐ์และการเรียนรู้ของเครื่องอะไรคือความแตกต่างระหว่างการเรียนรู้แบบมีผู้สอนและไม่ได้รับการดูแล? คุณสามารถให้คำอธิบายพื้นฐานที่ง่ายและเป็นตัวอย่างได้หรือไม่?
คำตอบ:
เมื่อคุณถามคำถามพื้นฐานนี้ดูเหมือนว่าคุ้มค่าที่จะระบุว่าการเรียนรู้ด้วยตนเองเป็นอย่างไร
การเรียนรู้ของเครื่องเป็นคลาสของอัลกอริธึมที่ขับเคลื่อนด้วยข้อมูลซึ่งแตกต่างจากอัลกอริทึม "ปกติ" คือข้อมูลที่ "บอก" ว่า "คำตอบที่ดี" คืออะไร ตัวอย่าง: อัลกอริทึมการเรียนรู้ที่ไม่ใช้เครื่องจักรสมมุติสำหรับการตรวจจับใบหน้าในภาพจะพยายามกำหนดว่าใบหน้าคืออะไร (ดิสก์กลมสีผิวเหมือนกับพื้นที่มืดที่คุณคาดหวังตา ฯลฯ ) อัลกอริทึมการเรียนรู้ของเครื่องจะไม่มีคำจำกัดความของรหัสดังกล่าว แต่จะ "เรียนรู้โดยตัวอย่าง": คุณจะแสดงภาพใบหน้าและหน้าไม่ได้หลายภาพและในที่สุดอัลกอริทึมที่ดีจะเรียนรู้และสามารถทำนายได้ว่ามองไม่เห็น ภาพคือใบหน้า
ตัวอย่างเฉพาะของการตรวจจับใบหน้าได้รับการดูแลซึ่งหมายความว่าตัวอย่างของคุณจะต้องมีข้อความกำกับหรือพูดอย่างชัดเจนว่าคนใดเป็นใบหน้าและคนที่ไม่ใช่
ในการใกล้ชิดอัลกอริทึมตัวอย่างของคุณไม่ได้มีป้ายกำกับคือคุณไม่ได้พูดอะไร แน่นอนในกรณีเช่นนี้อัลกอริธึมไม่สามารถ "ประดิษฐ์" ว่าใบหน้าคืออะไร แต่สามารถลองจัดกลุ่มข้อมูลเป็นกลุ่มต่าง ๆ เช่นสามารถแยกแยะว่าใบหน้าแตกต่างจากภูมิทัศน์ซึ่งแตกต่างจากม้ามาก
ตั้งแต่คำตอบอื่นกล่าวถึงมัน (แม้ว่าในทางที่ไม่ถูกต้อง): มี "กลาง" ในรูปแบบของการกำกับดูแลคือกึ่งภายใต้การดูแลและใช้งานการเรียนรู้ ในทางเทคนิคนี่เป็นวิธีการตรวจสอบที่มีวิธี "ฉลาด" เพื่อหลีกเลี่ยงตัวอย่างฉลากจำนวนมาก ในการเรียนรู้อย่างคล่องแคล่วอัลกอริทึมจะตัดสินสิ่งที่คุณควรติดป้าย (เช่นมันค่อนข้างแน่ใจเกี่ยวกับภูมิประเทศและม้า แต่มันอาจขอให้คุณยืนยันว่ากอริลลานั้นเป็นภาพใบหน้าหรือไม่) ในการเรียนรู้แบบกึ่งกำกับดูแลมีสองอัลกอริทึมที่แตกต่างกันซึ่งเริ่มต้นด้วยตัวอย่างที่มีป้ายกำกับและจากนั้น "บอก" วิธีที่พวกเขาคิดเกี่ยวกับข้อมูลที่ไม่มีป้ายกำกับจำนวนมาก จาก "การอภิปราย" พวกเขาเรียนรู้
การเรียนรู้ภายใต้การดูแลคือเมื่อข้อมูลที่คุณป้อนอัลกอริทึมของคุณมี "แท็ก" หรือ "ติดป้ายกำกับ" เพื่อช่วยให้ตรรกะของคุณตัดสินใจ
ตัวอย่าง: การกรองสแปมแบบเบส์ซึ่งคุณต้องติดธงรายการเป็นสแปมเพื่อปรับแต่งผลลัพธ์
การเรียนรู้ที่ไม่ได้รับการสนับสนุนคือประเภทของอัลกอริทึมที่พยายามค้นหาความสัมพันธ์โดยไม่มีอินพุตภายนอกอื่นนอกเหนือจากข้อมูลดิบ
ตัวอย่าง: อัลกอริทึมการจัดกลุ่มการทำเหมืองข้อมูล
แอปพลิเคชันที่ข้อมูลการฝึกอบรมประกอบด้วยตัวอย่างของเวกเตอร์อินพุทพร้อมกับเวกเตอร์เป้าหมายที่สอดคล้องกันนั้นเป็นที่รู้จักกันว่าปัญหาการเรียนรู้แบบมีผู้สอน
ในปัญหาการจดจำรูปแบบอื่น ๆ ข้อมูลการฝึกอบรมประกอบด้วยชุดของเวกเตอร์อินพุต x โดยไม่มีค่าเป้าหมายที่สอดคล้องกัน เป้าหมายในปัญหาการเรียนรู้ที่ไม่ได้รับการจัดการดังกล่าวอาจเป็นการค้นหากลุ่มของตัวอย่างที่คล้ายกันภายในข้อมูลซึ่งเรียกว่าการจัดกลุ่ม
การจดจำรูปแบบและการเรียนรู้ของเครื่อง (อธิการ 2549)
ในการเรียนรู้ภายใต้การดูแล, การป้อนข้อมูลที่x
มีให้กับผลที่คาดหวังy
(เช่นการส่งออกรูปแบบที่ควรจะผลิตเมื่อเข้าเป็นx
) ซึ่งมักจะเรียกว่า "ชั้น" (หรือ "ป้าย") x
ของการป้อนข้อมูลที่สอดคล้องกัน
ในการเรียนรู้ใกล้ชิดที่ "คลาส" ของตัวอย่างที่x
ไม่ได้ให้ ดังนั้นการเรียนรู้ที่ไม่มีผู้ดูแลอาจถือได้ว่าเป็นการหา "โครงสร้างที่ซ่อนอยู่" ในชุดข้อมูลที่ไม่มีป้ายกำกับ
แนวทางการเรียนรู้แบบมีผู้สอนประกอบด้วย:
การจำแนกประเภท (1R, Naive Bayes, อัลกอริทึมการเรียนรู้ต้นไม้ตัดสินใจเช่นรถเข็น ID3 และอื่น ๆ )
การทำนายค่าตัวเลข
แนวทางการเรียนรู้ที่ไม่ได้รับการดูแลรวมถึง:
การทำคลัสเตอร์ (K-หมายถึงการจัดกลุ่มแบบลำดับชั้น)
การเรียนรู้กฎของสมาคม
ตัวอย่างเช่นบ่อยครั้งที่การฝึกอบรมเครือข่ายประสาทเทียมเป็นการเรียนรู้แบบมีผู้สอน: คุณกำลังบอกเครือข่ายว่าคลาสใดสอดคล้องกับเวกเตอร์คุณลักษณะที่คุณป้อน
การทำคลัสเตอร์คือการเรียนรู้ที่ไม่สำรอง: คุณให้อัลกอริทึมตัดสินใจว่าจะจัดกลุ่มตัวอย่างเป็นคลาสที่ใช้คุณสมบัติทั่วไปได้อย่างไร
ตัวอย่างของการเรียนรู้ใกล้ชิดก็คือKohonen ของแผนที่การจัดระเบียบตัวเอง
ฉันสามารถบอกคุณตัวอย่าง
สมมติว่าคุณจำเป็นต้องรู้จักยานพาหนะคันใดและเป็นมอเตอร์ไซค์คันไหน
ในกรณีการเรียนรู้ภายใต้การดูแลชุดข้อมูลอินพุต (การฝึกอบรม) ของคุณจะต้องมีข้อความกำกับนั่นคือสำหรับแต่ละองค์ประกอบอินพุตในชุดข้อมูล (การฝึกอบรม) ของคุณคุณควรระบุว่าเป็นตัวแทนของรถยนต์หรือรถจักรยานยนต์
ในกรณีการเรียนรู้ที่ไม่มีผู้ดูแลคุณจะไม่ติดป้ายอินพุต โมเดลที่ไม่มีการดูแลจะจัดกลุ่มอินพุตให้เป็นคลัสเตอร์โดยยึดตามคุณสมบัติ / คุณสมบัติที่คล้ายกัน ดังนั้นในกรณีนี้จึงไม่มีป้ายกำกับเหมือน "รถยนต์"
การเรียนรู้ภายใต้การดูแล
การเรียนรู้ภายใต้การดูแลขึ้นอยู่กับการฝึกอบรมตัวอย่างข้อมูลจากแหล่งข้อมูลด้วยการจำแนกประเภทที่ถูกต้องที่กำหนดไว้แล้ว เทคนิคดังกล่าวถูกใช้ในโมเดล feedforward หรือ MultiLayer Perceptron (MLP) MLP เหล่านี้มีลักษณะเด่นสามประการ:
ลักษณะเหล่านี้พร้อมกับการเรียนรู้ผ่านการฝึกอบรมแก้ปัญหาที่ยากและหลากหลาย การเรียนรู้ผ่านการฝึกอบรมในรูปแบบ ANN ภายใต้การดูแลที่เรียกว่าเป็นอัลกอริทึม backpropagation ข้อผิดพลาด อัลกอริธึมการแก้ไขข้อผิดพลาดการเรียนรู้ฝึกอบรมเครือข่ายตามตัวอย่างอินพุตเอาต์พุตและค้นหาสัญญาณข้อผิดพลาดซึ่งเป็นความแตกต่างของเอาต์พุตที่คำนวณและเอาต์พุตที่ต้องการและปรับน้ำหนัก synaptic ของเซลล์ประสาทที่เป็นสัดส่วนกับผลิตภัณฑ์ของข้อผิดพลาด สัญญาณและอินสแตนซ์อินพุตของน้ำหนัก synaptic ตามหลักการนี้การเรียนรู้การแพร่กระจายกลับข้อผิดพลาดเกิดขึ้นในสองรอบ:
ส่งต่อ:
ที่นี่เวกเตอร์อินพุตจะแสดงต่อเครือข่าย สัญญาณอินพุตนี้แพร่กระจายไปข้างหน้าเซลล์ประสาทโดยเซลล์ประสาทผ่านเครือข่ายและเกิดขึ้นที่ปลายเอาท์พุทของเครือข่ายเป็นสัญญาณเอาท์พุท: y(n) = φ(v(n))
ที่ไหนv(n)
เป็นสนามท้องถิ่นเหนี่ยวนำให้เกิดเซลล์ประสาทที่กำหนดโดยv(n) =Σ w(n)y(n).
เอาท์พุท เปรียบเทียบกับการตอบสนองที่ต้องการd(n)
และค้นหาข้อผิดพลาดe(n)
สำหรับเซลล์ประสาทนั้น ตุ้มน้ำหนัก synaptic ของเครือข่ายในช่วงนี้ยังคงเหมือนเดิม
ย้อนหลังผ่าน:
สัญญาณข้อผิดพลาดที่เกิดขึ้นที่เซลล์ประสาทขาออกของเลเยอร์นั้นจะแพร่กระจายไปข้างหลังผ่านเครือข่าย สิ่งนี้คำนวณการไล่ระดับสีท้องถิ่นสำหรับแต่ละเซลล์ประสาทในแต่ละชั้นและอนุญาตให้น้ำหนัก synaptic ของเครือข่ายได้รับการเปลี่ยนแปลงตามกฎเดลต้าเป็น:
Δw(n) = η * δ(n) * y(n).
การคำนวณแบบเรียกซ้ำนี้ยังคงดำเนินต่อไปโดยมีการส่งต่อไปตามด้วยการส่งผ่านย้อนกลับสำหรับแต่ละรูปแบบการป้อนข้อมูลจนกว่าเครือข่ายจะถูกรวมเข้าด้วยกัน
กระบวนทัศน์การเรียนรู้ภายใต้การดูแลของ ANN นั้นมีประสิทธิภาพและค้นหาวิธีการแก้ปัญหาเชิงเส้นและไม่เป็นเชิงเส้นเช่นการจำแนกการควบคุมพืชการพยากรณ์พยากรณ์หุ่นยนต์เป็นต้น
การเรียนรู้ที่ไม่จำเป็น
เครือข่ายนิวรัลที่จัดระเบียบตนเองเรียนรู้โดยใช้อัลกอริทึมการเรียนรู้แบบไม่มีผู้ดูแลเพื่อระบุรูปแบบที่ซ่อนอยู่ในข้อมูลอินพุตที่ไม่มีป้ายกำกับ unsupervised นี้หมายถึงความสามารถในการเรียนรู้และจัดการข้อมูลโดยไม่ต้องให้สัญญาณข้อผิดพลาดเพื่อประเมินวิธีแก้ปัญหาที่อาจเกิดขึ้น การไม่มีทิศทางสำหรับอัลกอริทึมการเรียนรู้ในการเรียนรู้ที่ไม่มีผู้ดูแลอาจมีประโยชน์ในบางครั้งเนื่องจากให้อัลกอริทึมสามารถมองย้อนกลับไปหารูปแบบที่ไม่เคยได้รับการพิจารณามาก่อน ลักษณะสำคัญของแผนที่ที่จัดระเบียบตัวเอง (SOM) คือ:
เลเยอร์การคำนวณเรียกอีกอย่างว่าเลเยอร์การแข่งขันเนื่องจากเซลล์ประสาทในเลเยอร์แข่งขันกันเพื่อให้ทำงานได้ ดังนั้นอัลกอริทึมการเรียนรู้นี้เรียกว่าอัลกอริทึมการแข่งขัน อัลกอริทึม Unsupervised ใน SOM ทำงานในสามขั้นตอน:
ขั้นตอนการแข่งขัน:
สำหรับรูปแบบการป้อนข้อมูลแต่ละรูปแบบx
นำเสนอไปยังเครือข่ายผลิตภัณฑ์ภายในที่มีการw
คำนวณน้ำหนักแบบ synaptic และเซลล์ประสาทในชั้นแข่งขันพบว่าฟังก์ชันการจำแนกที่ทำให้เกิดการแข่งขันระหว่างเซลล์ประสาทและเวกเตอร์น้ำหนัก synaptic ที่อยู่ใกล้กับเวกเตอร์อินพุตในระยะทางแบบยุคลิด ประกาศเป็นผู้ชนะในการแข่งขัน เซลล์ประสาทนั้นเรียกว่าเซลล์ประสาทที่ดีที่สุด
i.e. x = arg min ║x - w║.
ระยะสหกรณ์:
เซลล์ประสาทที่ได้รับรางวัลจะกำหนดศูนย์กลางของย่านโทโพโลยีh
ของเซลล์ประสาทที่ให้ความร่วมมือ นี่คือการดำเนินการโดยการทำงานร่วมกันd
ในหมู่เซลล์ประสาทด้านข้าง โทโพโลยีย่านนี้ลดขนาดในช่วงเวลาหนึ่ง
ช่วงการปรับตัว:
ช่วยให้เซลล์ประสาทที่ชนะเลิศและเซลล์ประสาทข้างเคียงสามารถเพิ่มค่าส่วนบุคคลของฟังก์ชั่นการจำแนกที่เกี่ยวข้องกับรูปแบบการป้อนข้อมูลผ่านการปรับน้ำหนัก synaptic ที่เหมาะสม
Δw = ηh(x)(x –w).
เมื่อนำเสนอรูปแบบการฝึกซ้ำแล้วซ้ำอีกเวกเตอร์น้ำหนัก synaptic มีแนวโน้มที่จะติดตามการกระจายของรูปแบบการป้อนข้อมูลเนื่องจากการอัปเดตพื้นที่ใกล้เคียงและทำให้ ANN เรียนรู้โดยไม่มีหัวหน้างาน
รูปแบบการจัดตัวเองตามธรรมชาติแสดงถึงพฤติกรรมทางชีววิทยาและด้วยเหตุนี้จะใช้ในการใช้งานในโลกแห่งความเป็นจริงเช่นการจัดกลุ่มการรู้จำเสียงการแบ่งพื้นผิวการเข้ารหัสเวกเตอร์ ฯลฯ
ฉันมักจะพบความแตกต่างระหว่างการเรียนรู้ที่ไม่ได้รับการดูแลและการเรียนรู้แบบมีผู้สอนเพื่อให้เป็นไปตามอำเภอใจและสร้างความสับสนเล็กน้อย ไม่มีความแตกต่างที่แท้จริงระหว่างสองกรณีนี้แทนที่จะมีช่วงของสถานการณ์ที่อัลกอริทึมสามารถมี 'การควบคุม' มากขึ้นหรือน้อยลง การมีอยู่ของการเรียนรู้แบบกึ่งกำกับเป็นตัวอย่างที่ชัดเจนที่เส้นจะเบลอ
ฉันมักจะคิดว่าการกำกับดูแลเป็นการให้ข้อเสนอแนะกับอัลกอริทึมเกี่ยวกับวิธีการแก้ไขปัญหาควรเป็นที่ต้องการ สำหรับการตั้งค่าการดูแลแบบดั้งเดิมเช่นการตรวจจับสแปมคุณบอกอัลกอริทึม"อย่าทำผิดพลาดใด ๆ ในชุดฝึกอบรม" ; สำหรับการตั้งค่าหากินแบบดั้งเดิมเช่นการจัดกลุ่มคุณบอกขั้นตอนวิธี"จุดที่อยู่ใกล้กับแต่ละอื่น ๆ ควรจะอยู่ในคลัสเตอร์เดียวกัน" มันเกิดขึ้นแบบนั้นข้อเสนอแนะรูปแบบแรกนั้นมีความเฉพาะเจาะจงมากกว่าแบบหลัง ๆ
ในระยะสั้นเมื่อมีคนบอกว่า 'ดูแล' ให้คิดการจัดประเภทเมื่อพวกเขาพูดว่า 'ไม่ได้รับการดูแล' คิดว่าการรวมกลุ่มและพยายามที่จะไม่กังวลมากไปกว่านั้น
การเรียนรู้ของเครื่อง: สำรวจการศึกษาและการสร้างอัลกอริธึมที่สามารถเรียนรู้และทำการทำนายข้อมูลได้อัลกอริธึมดังกล่าวดำเนินการโดยการสร้างแบบจำลองจากอินพุตตัวอย่างเพื่อทำการพยากรณ์หรือการตัดสินใจที่ขับเคลื่อนด้วยข้อมูล คำแนะนำโปรแกรม
การเรียนรู้ภายใต้การดูแล: มันเป็นงานการเรียนรู้ของเครื่องในการอนุมานฟังก์ชั่นจากข้อมูลการฝึกอบรมที่มีข้อความข้อมูลการฝึกอบรมประกอบด้วยชุดของตัวอย่างการฝึกอบรม ในการเรียนรู้แบบมีผู้สอนแต่ละตัวอย่างคือคู่ที่ประกอบด้วยวัตถุอินพุต (โดยทั่วไปคือเวกเตอร์) และค่าเอาต์พุตที่ต้องการ (เรียกอีกอย่างว่าสัญญาณควบคุม) อัลกอริทึมการเรียนรู้แบบมีผู้สอนวิเคราะห์ข้อมูลการฝึกอบรมและสร้างฟังก์ชันอนุมานซึ่งสามารถใช้สำหรับการทำแผนที่ตัวอย่างใหม่
คอมพิวเตอร์นำเสนอตัวอย่างอินพุตและเอาต์พุตที่ต้องการโดย "ครู" และเป้าหมายคือการเรียนรู้กฎทั่วไปที่แมปอินพุตกับเอาต์พุตโดยเฉพาะอัลกอริทึมการเรียนรู้ภายใต้การดูแลใช้ชุดข้อมูลอินพุตที่รู้จักและการตอบสนองที่รู้จัก ไปยังข้อมูล (เอาท์พุท) และฝึกฝนแบบจำลองเพื่อสร้างการคาดการณ์ที่สมเหตุสมผลสำหรับการตอบสนองต่อข้อมูลใหม่
การเรียนรู้ที่ไม่มีประโยชน์: เป็นการเรียนรู้ที่ไม่มีครู สิ่งหนึ่งที่พื้นฐานที่คุณอาจต้องการทำกับข้อมูลคือการมองเห็นมัน มันเป็นงานการเรียนรู้ของเครื่องในการอนุมานฟังก์ชั่นเพื่ออธิบายโครงสร้างที่ซ่อนอยู่จากข้อมูลที่ไม่มีป้ายกำกับ เนื่องจากตัวอย่างที่มอบให้กับผู้เรียนจะไม่มีป้ายกำกับจึงไม่มีข้อผิดพลาดหรือสัญญาณรางวัลเพื่อประเมินวิธีแก้ปัญหาที่อาจเกิดขึ้น สิ่งนี้แตกต่างจากการเรียนรู้แบบไม่มีผู้ดูแลจากการเรียนรู้แบบมีผู้สอน การเรียนรู้ที่ไม่ได้สำรองไว้ใช้ขั้นตอนที่พยายามค้นหาพาร์ติชันตามธรรมชาติของรูปแบบ
ด้วยการเรียนรู้ที่ไม่มีการดูแลจะไม่มีข้อเสนอแนะจากผลการทำนายเช่นไม่มีครูที่จะแก้ไขให้คุณภายใต้วิธีการเรียนรู้ที่ไม่ได้รับการยืนยันไม่มีตัวอย่างที่มีป้ายกำกับและไม่มีความคิดเกี่ยวกับผลลัพธ์ในระหว่างกระบวนการเรียนรู้ เป็นผลให้มันขึ้นอยู่กับรูปแบบการเรียนรู้ / รูปแบบการค้นหารูปแบบหรือค้นพบกลุ่มของข้อมูลอินพุต
คุณควรใช้วิธีการเรียนรู้แบบไม่มีผู้ดูแลเมื่อคุณต้องการข้อมูลจำนวนมากในการฝึกอบรมแบบจำลองของคุณและความเต็มใจและความสามารถในการทดสอบและสำรวจและแน่นอนว่าความท้าทายที่ไม่ได้รับการแก้ไขอย่างดีผ่านวิธีที่เป็นที่ยอมรับมากขึ้น เป็นไปได้ที่จะเรียนรู้รูปแบบที่ใหญ่และซับซ้อนกว่าการเรียนรู้แบบมีผู้สอน นี่คือตัวอย่างที่ดีของมัน
.
การเรียนรู้ภายใต้การดูแล: พูดว่าเด็กคนหนึ่งไปสวนที่ใจดีกว่า ที่นี่ครูแสดงให้เขาเห็น 3 บ้านของเล่นลูกบอลและรถยนต์ ตอนนี้อาจารย์มอบของเล่นให้เขา 10 ชิ้น เขาจะแบ่งพวกเขาใน 3 กล่องของบ้านลูกบอลและรถยนต์ตามประสบการณ์ของเขาก่อนหน้า ดังนั้นเด็กได้รับการดูแลโดยครูเป็นครั้งแรกเพื่อให้ได้คำตอบที่ถูกต้องในบางชุด จากนั้นเขาก็ทดสอบกับของเล่นที่ไม่รู้จัก
การเรียนรู้ที่ไม่ต้องจองล่วงหน้า: ตัวอย่างอนุบาลอีกครั้งเด็กจะได้รับของเล่น 10 ชิ้น เขาบอกให้แบ่งส่วนที่คล้ายกัน ขึ้นอยู่กับคุณสมบัติเช่นรูปร่างขนาดสีฟังก์ชั่น ฯลฯ เขาจะพยายามทำให้ 3 กลุ่มพูดว่า A, B, C และจัดกลุ่มพวกเขา
คำว่าการกำกับดูแลหมายถึงคุณกำลังให้การควบคุมดูแล / การเรียนการสอนกับเครื่องเพื่อช่วยหาคำตอบ เมื่อเรียนรู้คำแนะนำแล้วจะสามารถคาดการณ์กรณีใหม่ได้อย่างง่ายดาย
Unsupervised หมายถึงไม่มีการควบคุมดูแลหรือคำแนะนำวิธีการค้นหาคำตอบ / ฉลากและเครื่องจะใช้ความฉลาดของมันเพื่อค้นหารูปแบบบางอย่างในข้อมูลของเรา ที่นี่จะไม่ทำการคาดการณ์ แต่จะพยายามค้นหากลุ่มที่มีข้อมูลที่คล้ายกัน
มีคำตอบมากมายที่อธิบายความแตกต่างของรายละเอียดแล้ว ฉันพบ gif เหล่านี้ในcodeacademyและพวกเขามักจะช่วยฉันอธิบายความแตกต่างได้อย่างมีประสิทธิภาพ
ขอให้สังเกตว่าภาพการฝึกอบรมมีป้ายกำกับที่นี่และตัวแบบกำลังเรียนรู้ชื่อของภาพ
โปรดสังเกตว่าสิ่งที่ทำที่นี่เป็นเพียงการจัดกลุ่ม (การจัดกลุ่ม) และโมเดลไม่ทราบอะไรเกี่ยวกับภาพใด ๆ
อัลกอริทึมการเรียนรู้ของเครือข่ายประสาทสามารถควบคุมหรือไม่ดูแล
โครงข่ายประสาทจะกล่าวเพื่อเรียนรู้ภายใต้การดูแลหากทราบว่าต้องการผลลัพธ์แล้ว ตัวอย่าง: ความสัมพันธ์ของรูปแบบ
โครงข่ายประสาทที่เรียนรู้ที่ไม่ได้รับการสนับสนุนไม่มีผลลัพธ์เป้าหมายดังกล่าว ไม่สามารถระบุได้ว่าผลลัพธ์ของกระบวนการเรียนรู้จะเป็นอย่างไร ในระหว่างกระบวนการเรียนรู้หน่วย (ค่าน้ำหนัก) ของโครงข่ายประสาทนั้นจะถูก "จัดเรียง" ภายในช่วงที่กำหนดขึ้นอยู่กับค่าอินพุตที่กำหนด เป้าหมายคือการจัดกลุ่มหน่วยที่คล้ายกันไว้ด้วยกันในบางพื้นที่ของช่วงค่า ตัวอย่าง: การจำแนกรูปแบบ
การเรียนรู้ภายใต้การดูแลได้รับข้อมูลพร้อมคำตอบ
รับอีเมลที่ระบุว่าเป็นสแปม / ไม่ใช่สแปมเรียนรู้ตัวกรองจดหมายขยะ
เมื่อได้รับชุดข้อมูลของผู้ป่วยที่วินิจฉัยว่าเป็นโรคเบาหวานหรือไม่เรียนรู้ที่จะจำแนกผู้ป่วยใหม่ว่าเป็นโรคเบาหวานหรือไม่
การเรียนรู้ที่ไม่ต้องสำรองข้อมูลโดยไม่มีคำตอบให้พีซีจัดกลุ่มสิ่งต่าง ๆ
เมื่อพบชุดบทความข่าวบนเว็บให้จัดกลุ่มชุดบทความเกี่ยวกับเรื่องเดียวกัน
ให้ฐานข้อมูลของข้อมูลที่กำหนดเองค้นหากลุ่มตลาดและลูกค้ากลุ่มโดยอัตโนมัติในกลุ่มตลาดที่แตกต่างกัน
การเรียนรู้ภายใต้การดูแล
ในที่นี้ทุกรูปแบบการป้อนข้อมูลที่ใช้ในการฝึกอบรมเครือข่ายมีความเกี่ยวข้องกับรูปแบบการส่งออกซึ่งเป็นเป้าหมายหรือรูปแบบที่ต้องการ สมมติว่ามีครูอยู่ในระหว่างกระบวนการเรียนรู้เมื่อทำการเปรียบเทียบระหว่างผลลัพธ์ที่คำนวณได้ของเครือข่ายและผลลัพธ์ที่คาดหวังที่ถูกต้องเพื่อกำหนดข้อผิดพลาด ข้อผิดพลาดนั้นสามารถใช้เพื่อเปลี่ยนพารามิเตอร์เครือข่ายซึ่งส่งผลให้มีการปรับปรุงประสิทธิภาพ
การเรียนรู้ที่ไม่จำเป็น
ในวิธีการเรียนรู้นี้ผลลัพธ์เป้าหมายจะไม่แสดงต่อเครือข่าย มันเหมือนกับว่าไม่มีครูผู้สอนที่จะนำเสนอรูปแบบที่ต้องการและด้วยเหตุนี้ระบบเรียนรู้ของตัวเองโดยการค้นพบและปรับให้เข้ากับคุณสมบัติโครงสร้างในรูปแบบการป้อนข้อมูล
การเรียนรู้ภายใต้การดูแล : คุณให้ข้อมูลตัวอย่างที่มีข้อความต่าง ๆ เป็นอินพุตพร้อมกับคำตอบที่ถูกต้อง อัลกอริทึมนี้จะเรียนรู้จากมันและเริ่มทำนายผลลัพธ์ที่ถูกต้องตามอินพุตหลังจากนั้น ตัวอย่าง : ตัวกรองสแปมอีเมล
การเรียนรู้ที่ไม่จำเป็น : คุณเพียงแค่ให้ข้อมูลและไม่บอกอะไรเลยเช่นป้ายกำกับหรือคำตอบที่ถูกต้อง อัลกอริทึมจะวิเคราะห์รูปแบบในข้อมูลโดยอัตโนมัติ ตัวอย่าง : Google News
ฉันจะพยายามทำให้มันง่าย
การเรียนรู้ภายใต้การดูแล:ในเทคนิคของการเรียนรู้นี้เราจะได้รับชุดข้อมูลและระบบทราบการส่งออกที่ถูกต้องของชุดข้อมูล ดังนั้นที่นี่ระบบของเราเรียนรู้โดยการทำนายมูลค่าของมันเอง จากนั้นจะทำการตรวจสอบความถูกต้องโดยใช้ฟังก์ชันต้นทุนเพื่อตรวจสอบว่าการคาดการณ์นั้นใกล้เคียงกับผลผลิตจริงเพียงใด
การเรียนรู้ที่ไม่จำเป็น:ในวิธีการนี้เรามีความรู้เพียงเล็กน้อยหรือไม่มีเลยว่าผลลัพธ์ของเราจะเป็นอย่างไร ดังนั้นเราจึงได้โครงสร้างจากข้อมูลที่เราไม่รู้จักผลกระทบของตัวแปร เราสร้างโครงสร้างโดยการจัดกลุ่มข้อมูลตามความสัมพันธ์ระหว่างตัวแปรในข้อมูล ที่นี่เราไม่มีคำติชมตามการคาดการณ์ของเรา
คุณมีอินพุต x และเอาต์พุตเป้าหมาย t ดังนั้นคุณจึงฝึกอัลกอริทึมให้พูดกับส่วนที่หายไป มันถูกควบคุมดูแลเพราะเป้าหมายถูกกำหนด คุณเป็นหัวหน้างานที่บอกอัลกอริทึม: สำหรับตัวอย่าง x คุณควรเอาท์พุท t!
แม้ว่าการแบ่งกลุ่มการจัดกลุ่มและการบีบอัดมักจะนับในทิศทางนี้ฉันมีเวลายากที่จะเกิดขึ้นกับคำจำกัดความที่ดีสำหรับมัน
ลองมาใช้โปรแกรมเปลี่ยนรหัสอัตโนมัติสำหรับการบีบอัดเป็นตัวอย่าง ในขณะที่คุณได้รับอินพุต x เท่านั้นมันเป็นวิศวกรของมนุษย์ที่จะบอกอัลกอริทึมว่าเป้าหมายนั้นเป็น x ดังนั้นในบางแง่นี้ไม่แตกต่างจากการเรียนรู้แบบมีผู้สอน
และสำหรับการจัดกลุ่มและการแบ่งกลุ่มฉันไม่แน่ใจว่ามันเหมาะกับคำจำกัดความของการเรียนรู้ของเครื่อง (ดูคำถามอื่น )
การเรียนรู้ภายใต้การดูแล: คุณติดป้ายกำกับข้อมูลและต้องเรียนรู้จากสิ่งนั้น เช่นข้อมูลบ้านพร้อมราคาแล้วเรียนรู้การทำนายราคา
การเรียนรู้ที่ไม่ได้รับการสนับสนุน: คุณต้องค้นหาแนวโน้มแล้วทำนายว่าไม่มีป้ายกำกับใดให้มาก่อน เช่นคนที่แตกต่างกันในชั้นเรียนและจากนั้นคนใหม่มาเพื่อให้นักเรียนใหม่นี้เป็นกลุ่มอะไร
ในการเรียนรู้ภายใต้การดูแลเรารู้ว่าสิ่งใดควรนำเข้าและส่งออก ตัวอย่างเช่นกำหนดชุดรถยนต์ เราต้องหาว่าอันไหนสีแดงและอันไหนสีน้ำเงิน
ในขณะที่การเรียนรู้ที่ไม่ได้รับการสนับสนุนคือที่ที่เราต้องค้นหาคำตอบที่มีน้อยมากหรือไม่มีความคิดใด ๆ เกี่ยวกับว่าผลลัพธ์ควรเป็นอย่างไร ตัวอย่างเช่นผู้เรียนอาจสามารถสร้างแบบจำลองที่ตรวจพบเมื่อผู้คนยิ้มตามความสัมพันธ์ของรูปแบบใบหน้าและคำเช่น "คุณกำลังยิ้มเกี่ยวกับอะไร"
การเรียนรู้ภายใต้การดูแลสามารถติดป้ายรายการใหม่เป็นหนึ่งในป้ายกำกับที่ผ่านการฝึกอบรมตามการเรียนรู้ระหว่างการฝึกอบรม คุณต้องจัดเตรียมชุดข้อมูลการฝึกอบรมจำนวนมากชุดข้อมูลตรวจสอบความถูกต้องและชุดข้อมูลทดสอบ หากคุณระบุเวกเตอร์ภาพพิกเซลของตัวเลขพร้อมกับข้อมูลการฝึกอบรมพร้อมป้ายกำกับมันจะสามารถระบุหมายเลขได้
การเรียนรู้ที่ไม่มีผู้ดูแลไม่จำเป็นต้องมีชุดข้อมูลการฝึกอบรม ในการเรียนรู้ที่ไม่มีผู้ดูแลมันสามารถจัดกลุ่มรายการเป็นกลุ่มที่แตกต่างกันโดยขึ้นอยู่กับความแตกต่างในเวกเตอร์อินพุต หากคุณให้ภาพเวกเตอร์พิกเซลของตัวเลขและขอให้แบ่งออกเป็น 10 หมวดหมู่ก็อาจทำได้ แต่มันจะรู้วิธีติดป้ายกำกับเนื่องจากคุณยังไม่ได้จัดเตรียมฉลากฝึกอบรม
การเรียนรู้ภายใต้การดูแลเป็นพื้นฐานที่คุณมีตัวแปรอินพุต (x) และตัวแปรเอาต์พุต (y) และใช้อัลกอริทึมเพื่อเรียนรู้ฟังก์ชันการแมปจากอินพุตไปยังเอาต์พุต เหตุผลที่เราเรียกสิ่งนี้ว่าการดูแลเนื่องจากอัลกอริทึมเรียนรู้จากชุดข้อมูลการฝึกอบรมอัลกอริทึมซ้ำ ๆ ทำให้การคาดการณ์ข้อมูลการฝึกอบรม ภายใต้การดูแลมีการจำแนกประเภทสองประเภทและการถดถอย การจำแนกประเภทคือเมื่อตัวแปรเอาท์พุทเป็นหมวดหมู่เช่นใช่ / ไม่ใช่จริง / เท็จ การถดถอยคือเมื่อเอาต์พุตเป็นค่าจริงเช่นความสูงของบุคคลอุณหภูมิ ฯลฯ
การเรียนรู้ภายใต้การดูแลขององค์การสหประชาชาติคือที่ซึ่งเรามีเฉพาะข้อมูลอินพุต (X) และไม่มีตัวแปรเอาต์พุต สิ่งนี้เรียกว่าการเรียนรู้ที่ไม่มีผู้ดูแลเพราะต่างจากการเรียนรู้แบบมีผู้ดูแลข้างต้นไม่มีคำตอบที่ถูกต้องและไม่มีครู อัลกอริทึมจะถูกทิ้งให้อยู่ในรูปแบบของตนเองเพื่อค้นหาและนำเสนอโครงสร้างที่น่าสนใจในข้อมูล
ประเภทของการเรียนรู้ที่ไม่มีผู้ดูแลคือการจัดกลุ่มและการเชื่อมโยง
การเรียนรู้ภายใต้การดูแลนั้นเป็นเทคนิคหนึ่งที่ข้อมูลการฝึกอบรมที่เครื่องเรียนรู้ได้รับการติดฉลากแล้วซึ่งถือว่าเป็นตัวจําแนกเลขคี่ที่เรียบง่ายที่คุณได้จัดประเภทข้อมูลระหว่างการฝึกอบรมแล้ว ดังนั้นจึงใช้ข้อมูล "LABELED"
การเรียนรู้ที่ไม่ได้รับการสนับสนุนในทางตรงกันข้ามเป็นเทคนิคที่เครื่องจักรจะติดป้ายกำกับข้อมูลเอง หรือคุณสามารถพูดมันเป็นกรณีเมื่อเครื่องเรียนรู้ด้วยตนเองตั้งแต่เริ่มต้น
ในการเรียนรู้แบบควบคุมอย่างง่าย คือประเภทของปัญหาการเรียนรู้ของเครื่องที่เรามีป้ายกำกับบางส่วนและโดยการใช้ป้ายกำกับนั้นเราใช้อัลกอริทึมเช่นการถดถอยและการจำแนกประเภทการจำแนกประเภทจะถูกนำไปใช้ ใช่ไม่ใช่. และการถดถอยจะถูกนำมาใช้ในกรณีที่มูลค่าที่แท้จริงเช่นบ้านราคา
Unsupervised Learningเป็นรูปแบบของปัญหาการเรียนรู้ของเครื่องที่เราไม่มีฉลากหมายความว่าเรามีข้อมูลบางอย่างเท่านั้นข้อมูลที่ไม่มีโครงสร้างและเราต้องจัดกลุ่มข้อมูล (การจัดกลุ่มข้อมูล) โดยใช้อัลกอริทึมที่ไม่ได้รับการดูแลต่างๆ
การเรียนรู้ของเครื่องภายใต้การดูแล
"กระบวนการของการเรียนรู้อัลกอริทึมจากชุดฝึกอบรมและทำนายผลลัพธ์"
ความแม่นยำในการทำนายผลลัพธ์โดยตรงตามสัดส่วนกับข้อมูลการฝึกอบรม (ความยาว)
การเรียนรู้ภายใต้การดูแลคือที่ที่คุณมีตัวแปรอินพุต (x) (ชุดข้อมูลการฝึกอบรม) และตัวแปรเอาต์พุต (Y) (ชุดข้อมูลทดสอบ) และคุณใช้อัลกอริทึมเพื่อเรียนรู้ฟังก์ชันการแมปจากอินพุตไปยังเอาต์พุต
Y = f(X)
ประเภทหลัก:
ขั้นตอนวิธีการ:
อัลกอริทึมการจำแนกประเภท:
Neural Networks
Naïve Bayes classifiers
Fisher linear discriminant
KNN
Decision Tree
Super Vector Machines
ขั้นตอนวิธีการทำนาย:
Nearest neighbor
Linear Regression,Multi Regression
พื้นที่ใช้งาน:
การรับรู้เสียง
ทำนาย HR เลือกผู้สมัครโดยเฉพาะหรือไม่
ทำนายราคาตลาดหุ้น
การเรียนรู้ภายใต้การดูแล :
อัลกอริทึมการเรียนรู้แบบมีผู้สอนวิเคราะห์ข้อมูลการฝึกอบรมและสร้างฟังก์ชั่นอนุมานซึ่งสามารถใช้สำหรับการทำแผนที่ตัวอย่างใหม่
หมวดหมู่ของปัญหา:
การถดถอย: ทำนายผลภายในเอาท์พุทต่อเนื่อง => แม็พตัวแปรอินพุตเข้ากับฟังก์ชันต่อเนื่อง
ตัวอย่าง:
ให้ภาพของบุคคลทำนายอายุของเขา
การจำแนกประเภท:ทำนายผลลัพธ์ในผลลัพธ์ที่ไม่ต่อเนื่อง => แผนที่ตัวแปรอินพุตเป็นหมวดหมู่ที่ไม่ต่อเนื่อง
ตัวอย่าง:
มะเร็งนี้เป็นมะเร็งหรือไม่?
การเรียนรู้ที่ไม่สำรอง:
การเรียนรู้ที่ไม่ได้สำรองไว้นั้นเรียนรู้จากข้อมูลการทดสอบที่ไม่ได้ติดป้ายจำแนกหรือจัดหมวดหมู่ การเรียนรู้ที่ไม่ได้สำรองไว้จะระบุ commonalities ในข้อมูลและตอบสนองตามการมีหรือไม่มีของ commonalities ดังกล่าวในแต่ละชิ้นส่วนของข้อมูลใหม่
เราสามารถหาโครงสร้างนี้ได้โดยการจัดกลุ่มข้อมูลตามความสัมพันธ์ระหว่างตัวแปรในข้อมูล
ไม่มีคำติชมตามผลการทำนาย
หมวดหมู่ของปัญหา:
การทำคลัสเตอร์:เป็นงานของการจัดกลุ่มชุดของวัตถุในลักษณะที่วัตถุในกลุ่มเดียวกัน (เรียกว่าคลัสเตอร์) จะคล้ายกันมากขึ้น (ในบางกรณี) ซึ่งกันและกันมากกว่ากลุ่มอื่น (กลุ่ม)
ตัวอย่าง:
นำยีนต่าง ๆ 1,000,000 ชุดมารวมกันและหาวิธีจัดกลุ่มยีนเหล่านี้โดยอัตโนมัติเป็นกลุ่มที่มีความคล้ายคลึงกันหรือเกี่ยวข้องกับตัวแปรต่าง ๆ เช่นอายุการใช้งานที่ตั้งบทบาทและอื่นๆ
กรณีการใช้งานที่เป็นที่นิยมมีการระบุไว้ที่นี่
ความแตกต่างระหว่างการจำแนกและการทำคลัสเตอร์ในการขุดข้อมูล?
อ้างอิง:
การเรียนรู้ภายใต้การดูแล
การเรียนรู้ที่ไม่จำเป็น
ตัวอย่าง:
การเรียนรู้ภายใต้การดูแล:
หนึ่งถุงที่มีสีส้ม
=> สร้างแบบจำลอง
ถุงแอปเปิ้ลและส้มหนึ่งถุง
=> โปรดจัดประเภท
การเรียนรู้ที่ไม่มีผู้ดูแล:
ถุงแอปเปิ้ลและส้มหนึ่งถุง
=> สร้างแบบจำลอง
อีกถุงผสม
=> โปรดจัดประเภท
ในคำง่าย ๆ .. :) มันเป็นความเข้าใจของฉัน การเรียนรู้ภายใต้การดูแลคือเรารู้ว่าเรากำลังทำนายอะไรบนพื้นฐานของข้อมูลที่ให้ ดังนั้นเราจึงมีคอลัมน์ในชุดข้อมูลที่ต้องบอกกล่าวล่วงหน้า การเรียนรู้ที่ไม่ได้รับการสนับสนุนคือเราพยายามแยกความหมายออกจากชุดข้อมูลที่ให้ไว้ เราไม่มีความชัดเจนในสิ่งที่คาดการณ์ ดังนั้นคำถามคือทำไมเราทำเช่นนี้? .. :) คำตอบคือ - ผลลัพธ์ของการเรียนรู้ที่ไม่ได้รับการสนับสนุนคือกลุ่ม / กลุ่ม (ข้อมูลที่คล้ายกันเข้าด้วยกัน) ดังนั้นหากเราได้รับข้อมูลใหม่เราจะทำการเชื่อมโยงกับกลุ่ม / กลุ่มที่ระบุและเข้าใจคุณสมบัติของมัน
ฉันหวังว่ามันจะช่วยคุณ
การเรียนรู้ภายใต้การดูแล
การเรียนรู้แบบมีผู้ควบคุมเป็นที่ที่เรารู้ว่าผลลัพธ์ของข้อมูลดิบคือข้อมูลที่มีป้ายกำกับเพื่อให้ในระหว่างการฝึกอบรมรูปแบบการเรียนรู้ของเครื่องมันจะเข้าใจสิ่งที่จำเป็นในการตรวจจับในการให้ผลผลิตและมันจะเป็นแนวทาง ตรวจจับวัตถุที่มีป้ายกำกับล่วงหน้าซึ่งจะตรวจจับวัตถุที่คล้ายกันซึ่งเราได้จัดเตรียมไว้ในการฝึก
อัลกอริทึมที่นี่จะรู้ว่าโครงสร้างและรูปแบบของข้อมูลคืออะไร การเรียนรู้ภายใต้การดูแลใช้สำหรับการจำแนกประเภท
ตัวอย่างเช่นเราสามารถมีวัตถุต่าง ๆ ที่มีรูปร่างเป็นรูปสี่เหลี่ยมวงกลมรูปสามเหลี่ยมงานของเราคือจัดเรียงรูปร่างประเภทเดียวกันกับชุดข้อมูลที่มีป้ายชื่อมีรูปร่างทั้งหมดที่มีป้ายกำกับและเราจะฝึกรูปแบบการเรียนรู้ของเครื่องบนชุดข้อมูลนั้น พื้นฐานของชุดฝึกอบรมจะเริ่มตรวจจับรูปร่าง
การเรียนรู้ที่ไม่อยู่ภายใต้การดูแล
Unsupervised learning เป็นการเรียนรู้ที่ไม่มีผู้ชี้นำซึ่งไม่ทราบผลลัพธ์สุดท้ายมันจะจัดกลุ่มชุดข้อมูลและตามคุณสมบัติที่คล้ายกันของวัตถุซึ่งจะแบ่งวัตถุออกเป็นกลุ่มต่าง ๆ และตรวจจับวัตถุ
อัลกอริทึมที่นี่จะค้นหารูปแบบที่แตกต่างกันในข้อมูลดิบและขึ้นอยู่กับว่ามันจะจัดกลุ่มข้อมูล การเรียนรู้ที่ไม่อยู่ภายใต้การดูแลใช้สำหรับการทำคลัสเตอร์
ตัวอย่างเช่นเราสามารถมีวัตถุที่แตกต่างกันของรูปทรงสี่เหลี่ยมจัตุรัสวงกลมสามเหลี่ยมดังนั้นมันจะทำให้กระจุกตามคุณสมบัติของวัตถุถ้าวัตถุมีสี่ด้านมันจะพิจารณาว่าเป็นรูปสี่เหลี่ยมจัตุรัสและถ้ามันมีสามเหลี่ยมสามด้านและ หากไม่มีด้านใดเหนือวงกลมนี่คือข้อมูลที่ไม่มีการติดฉลากมันจะเรียนรู้ที่จะตรวจจับรูปร่างต่าง ๆ
การเรียนรู้ของเครื่องเป็นสาขาที่คุณพยายามสร้างเครื่องจักรเพื่อเลียนแบบพฤติกรรมมนุษย์
คุณฝึกฝนเครื่องจักรเหมือนเด็กทารกวิธีที่มนุษย์เรียนรู้ระบุคุณลักษณะจดจำรูปแบบและฝึกฝนตัวเองเช่นเดียวกับที่คุณฝึกเครื่องจักรด้วยการป้อนข้อมูลด้วยคุณสมบัติที่หลากหลาย อัลกอริทึมของเครื่องระบุรูปแบบภายในข้อมูลและจัดประเภทเป็นหมวดหมู่เฉพาะ
การเรียนรู้ของเครื่องแบ่งออกเป็นสองประเภทใหญ่ ๆ คือการเรียนรู้แบบมีผู้สอนและไม่มีผู้ดูแล
การเรียนรู้ภายใต้การดูแลเป็นแนวคิดที่คุณมีเวกเตอร์อินพุต / ข้อมูลที่มีค่าเป้าหมายที่สอดคล้องกัน (เอาต์พุต) ในอีกทางหนึ่งการเรียนรู้แบบไม่ดูแลคือแนวคิดที่คุณมีเวกเตอร์อินพุต / ข้อมูลโดยไม่มีค่าเป้าหมายที่สอดคล้องกัน
ตัวอย่างของการเรียนรู้ภายใต้การดูแลคือการรับรู้ตัวเลขที่เขียนด้วยลายมือซึ่งคุณมีภาพของตัวเลขที่มีตัวเลขที่สอดคล้องกัน [0-9] และตัวอย่างของการเรียนรู้ที่ไม่ได้รับการจัดการคือการจัดกลุ่มลูกค้าโดยพฤติกรรมการซื้อ