การเรียนรู้ของเครื่องเทียบกับการเรียนรู้ลึก


11

ฉันสับสนเล็กน้อยจากความแตกต่างระหว่างคำว่า "การเรียนรู้ของเครื่องจักร" และ "การเรียนรู้ลึก" ฉันได้ Googled แล้วอ่านบทความมากมาย แต่ก็ยังไม่ชัดเจนสำหรับฉัน

คำจำกัดความที่รู้จักกันดีของ Machine Learning โดย Tom Mitchell คือ:

โปรแกรมคอมพิวเตอร์ที่มีการกล่าวถึงเรียนรู้จากประสบการณ์Eด้วยความเคารพในชั้นเรียนของงานบางอย่างTและวัดประสิทธิภาพPถ้าผลการดำเนินงานของ บริษัท ที่งานในTเป็นวัดโดยPช่วยเพิ่มการมีประสบการณ์E

ถ้าฉันใช้ปัญหาการจำแนกภาพของการจำแนกสุนัขและแมวเป็น taks Tของฉันจากคำจำกัดความนี้ฉันเข้าใจว่าถ้าฉันจะให้อัลกอริทึม ML เป็นรูปของสุนัขและแมว (ประสบการณ์E ) อัลกอริทึม ML สามารถเรียนรู้วิธี แยกความแตกต่างของภาพลักษณ์ใหม่ว่าเป็นสุนัขหรือแมว (โดยมีการวัดประสิทธิภาพPไว้ชัดเจน)

จากนั้นเรียนรู้อย่างลึกซึ้ง ฉันเข้าใจว่าการเรียนรู้เชิงลึกเป็นส่วนหนึ่งของการเรียนรู้ของเครื่องและคำจำกัดความข้างต้นมีไว้ ผลการปฏิบัติงานที่งานTช่วยเพิ่มการมีประสบการณ์E ไม่เป็นไรจนถึงตอนนี้

บล็อกนี้ระบุว่ามีความแตกต่างระหว่างการเรียนรู้ของเครื่องและการเรียนรู้ลึก ความแตกต่างตาม Adil คือในการเรียนรู้ด้วยเครื่อง (ดั้งเดิม) คุณสมบัติจะต้องมีการสร้างขึ้นด้วยมือ ตัวเลขต่อไปนี้ชี้แจงแถลงการณ์ของเขา

ป้อนคำอธิบายรูปภาพที่นี่

ฉันสับสนกับความจริงที่ว่าในการเรียนรู้ของเครื่อง (ดั้งเดิม) คุณสมบัติจะต้องถูกสร้างขึ้นด้วยมือ จากความหมายข้างต้นโดยทอมมิทเชลล์ฉันคิดว่าคุณสมบัติเหล่านี้จะได้รับการเรียนรู้จากประสบการณ์EและประสิทธิภาพP จะเรียนรู้อะไรได้บ้างในการเรียนรู้ของเครื่อง?

ในการเรียนรู้เชิงลึกฉันเข้าใจว่าจากประสบการณ์ที่คุณเรียนรู้คุณสมบัติและวิธีการที่พวกเขาเกี่ยวข้องกันเพื่อปรับปรุงประสิทธิภาพ ฉันสามารถสรุปได้ว่าในคุณสมบัติการเรียนรู้ของเครื่องต้องมีการสร้างขึ้นด้วยมือและสิ่งที่เรียนรู้คือการรวมกันของคุณสมบัติ? หรือฉันหายไปอย่างอื่น?


2
หนังสือเล่มนี้ครอบคลุมมากในGood Learning bookโดย Goodfellow et al ในบทแรก (บทนำ)
hbaderts

คำตอบ:


4

นอกจากสิ่งที่ Himanshu Rai กล่าวไว้การเรียนรู้ลึกเป็นฟิลด์ย่อยที่เกี่ยวข้องกับการใช้โครงข่ายประสาทเทียมโครงข่ายประสาทเหล่านี้พยายามเรียนรู้การกระจายพื้นฐานโดยการปรับเปลี่ยนน้ำหนักระหว่างชั้น ตอนนี้ให้พิจารณากรณีของการจดจำภาพโดยใช้การเรียนรู้ลึก: แบบจำลองโครงข่ายประสาทเทียมแบ่งออกเป็นเลเยอร์เลเยอร์เหล่านี้เชื่อมโยงกันด้วยลิงก์ที่เรียกว่าน้ำหนักเมื่อกระบวนการฝึกอบรมเริ่มขึ้นเลเยอร์เหล่านี้จะปรับน้ำหนักดังกล่าว และช่วยให้เลเยอร์ถัดไปสำหรับการประมวลผลจุดสำคัญที่ควรทราบคือเราไม่ได้บอกเลเยอร์อย่างชัดเจนเพื่อเรียนรู้การตรวจจับขอบหรือตาจมูกหรือใบหน้าโมเดลเรียนรู้ที่จะทำเช่นนั้น


8

ในฐานะที่เป็นพื้นที่การวิจัยการเรียนรู้เชิงลึกนั้นเป็นเพียงส่วนย่อยของการเรียนรู้ของเครื่องจักรเนื่องจากการเรียนรู้ของเครื่องเป็นสาขาย่อยของปัญญาประดิษฐ์

1) การเรียนรู้คุณสมบัติที่ไม่ได้รับการสนับสนุน

แนวคิดความแตกต่างหลักแรกระหว่าง " การเรียนรู้" แบบดั้งเดิม "(หรือ" ตื้น ") และการเรียนรู้เชิงลึกคือการเรียนรู้คุณสมบัติที่ไม่ได้รับการสนับสนุน

ดังที่คุณทราบแล้วว่าการฝึกอบรมโมเดลการเรียนรู้ของเครื่อง " ดั้งเดิม " สำเร็จแล้ว(เช่น SVM, XGBoost ... )สามารถทำได้หลังจากการประมวลผลก่อนล่วงหน้าและการดึงคุณสมบัติที่เหมาะสมเพื่อเลือกข้อมูลที่มีความหมายจากข้อมูล นั่นคือเวกเตอร์คุณลักษณะที่ดีมีคุณสมบัติที่แตกต่างระหว่างจุดข้อมูลที่มีป้ายกำกับที่แตกต่างกันและสอดคล้องกันระหว่างจุดข้อมูลที่มีป้ายกำกับเดียวกัน คุณสมบัติวิศวกรรมจึงเป็นกระบวนการของการเลือกคุณสมบัติด้วยตนเองจากผู้เชี่ยวชาญ นี่เป็น taks ที่สำคัญมาก แต่น่าเบื่อที่ต้องแสดง!

Unsupervised Feature Learning เป็นกระบวนการที่ตัวแบบเองเลือกคุณสมบัติโดยอัตโนมัติผ่านการฝึกอบรม โทโพโลยีของ Neural Network ที่จัดเรียงในเลเยอร์ที่เชื่อมต่อกันมีคุณสมบัติที่ดีในการทำแผนที่การแสดงข้อมูลระดับต่ำให้เป็นตัวแทนระดับสูง ผ่านการฝึกอบรมเครือข่ายสามารถ " ตัดสินใจ " ว่าส่วนใดของข้อมูลมีความสำคัญและส่วนใดของข้อมูลไม่ สิ่งนี้น่าสนใจเป็นพิเศษใน Computer Vision หรือการประมวลผลภาษาธรรมชาติซึ่งค่อนข้างยากที่จะเลือกด้วยตนเองหรือสร้างคุณสมบัติที่แข็งแกร่ง

การเรียนรู้คุณลักษณะที่ไม่ได้รับอนุญาตเครดิต: Tony Beltramelli (เครดิตรูปภาพ: Tony Beltramelli)

ตัวอย่างเช่นสมมติว่าเราต้องการจัดประเภทรูปภาพแมว การใช้ Deep Neural Net เราสามารถป้อนค่าพิกเซลแบบดิบที่จะถูกแมปกับชุดของน้ำหนักโดยเลเยอร์แรกจากนั้นน้ำหนักเหล่านี้จะถูกแมปกับน้ำหนักอื่น ๆ ในชั้นที่สองจนกระทั่งเลเยอร์สุดท้ายยอมให้น้ำหนักบางอย่าง ถูกแมปกับตัวเลขที่แสดงถึงปัญหาของคุณ (เช่น: ในกรณีนี้ความน่าจะเป็นของภาพที่มีแมว)

แม้ว่า Deep Neural Networks สามารถทำการเรียนรู้คุณสมบัติ Unsupervised ได้ แต่ก็ไม่ได้ป้องกันไม่ให้คุณทำวิศวกรรมฟีเจอร์ด้วยตัวเองเพื่อแสดงถึงปัญหาของคุณได้ดียิ่งขึ้น การเรียนรู้คุณลักษณะที่ไม่ได้รับอนุญาตการสกัดคุณสมบัติและวิศวกรรมคุณสมบัติไม่ได้เกิดขึ้นพร้อมกัน!

แหล่งที่มา:

2) การแยกเชิงเส้น

Deep Neural Networks สามารถแก้ปัญหาที่แยกไม่ได้เชิงเส้นตรงโดยการดัดพื้นที่ของฟีเจอร์เพื่อให้คุณสมบัติแยกกันเป็นเส้นตรง อีกครั้งสิ่งนี้เป็นไปได้ด้วยโครงสร้างเครือข่ายที่จัดระเบียบในอินพุตการแม็พเลเยอร์กับการแสดงข้อมูลใหม่

เลเยอร์ที่ซ่อนอยู่จะเรียนรู้การเป็นตัวแทนเพื่อให้สามารถแยกข้อมูลเป็นเส้นตรงเครดิต: Christopher Olah (เครดิตรูปภาพ: Christopher Olah)

แหล่งที่มา: http://colah.github.io/posts/2014-03-NN-Manifolds-Topology/

3) สถิติค่าคงที่

ในที่สุดเครือข่าย Neural Deep ล้ำกว่าอัลกอริทึมการเรียนรู้ของเครื่องแบบดั้งเดิมในบางโดเมนเพราะสถาปัตยกรรมบางอย่างมีการจัดแสดงสถิติ Invariance (เช่น: Invariance เชิงสถิติพิเศษกับเครือข่ายประสาท Convolutional และ Invarial สถิติ Invariance กับเครือข่ายประสาทซ้ำ

ตรวจสอบวิดีโอ Udacity นี้สำหรับรายละเอียดเพิ่มเติม: https://www.youtube.com/watch?v=5PH2Vot-tD4


4

แรงบันดาลใจจากไอน์สไตน์““ ถ้าคุณไม่สามารถอธิบายให้เด็กอายุหกขวบคุณไม่เข้าใจตัวเอง”

คำตอบทั้งหมดข้างต้นได้รับการอธิบายเป็นอย่างดี แต่หากมีใครกำลังมองหาง่ายต่อการจดจำความแตกต่างเชิงนามธรรมนี่คือคำตอบที่ดีที่สุดที่ฉันรู้:

ความแตกต่างที่สำคัญคือการเรียนรู้ของเครื่องจะทำการย่อยข้อมูลเท่านั้นในขณะที่การเรียนรู้ลึกสามารถสร้างและปรับปรุงข้อมูลได้ มันไม่ได้เป็นเพียงการทำนาย แต่ยังก่อให้เกิด

แหล่ง แน่นอนมันมีมากกว่านั้น แต่สำหรับผู้เริ่มต้นมันอาจทำให้สับสนเกินไป


-3

โอเคคิดแบบนี้ ในการเรียนรู้ด้วยเครื่อง algirithms เช่นการถดถอยเชิงเส้นหรือฟอเรสต์แบบสุ่มคุณให้อัลกอริทึมชุดของคุณสมบัติและเป้าหมายจากนั้นมันพยายามลดฟังก์ชั่นค่าใช้จ่ายให้น้อยที่สุดดังนั้นจึงไม่มีการเรียนรู้คุณสมบัติใหม่ ตอนนี้เมื่อคุณเรียนรู้อย่างลึกซึ้งคุณมีเลเยอร์อย่างน้อยหนึ่งชั้น (เกือบจะตลอดไป) ที่ซ่อนอยู่ด้วยจำนวนยูนิตที่กำหนดจำนวนเหล่านี้คือคุณสมบัติที่กำลังพูดถึง ดังนั้นอัลกอริทึมการเรียนรู้แบบลึกไม่เพียงแค่เรียนรู้ชุดของน้ำหนักในกระบวนการนั้นมันยังเรียนรู้ค่าสำหรับหน่วยที่ซ่อนอยู่ซึ่งเป็นคุณลักษณะระดับสูงที่ซับซ้อนของข้อมูลที่คุณได้รับ ดังนั้นในขณะที่การฝึกฝนเครื่องวานิลลาการเรียนรู้ความเชี่ยวชาญมากมายอยู่ในความสามารถของคุณในการกำหนดคุณสมบัติของอัลกอริทึมเนื่องจากอัลกอริทึมไม่ได้เรียนรู้ด้วยตนเอง ฉันหวังว่าฉันจะตอบคำถามของคุณ


คำถามอื่นอีก: ในตัวอย่าง CNNs ฟีเจอร์ (หรือตัวกรอง) ไม่ใช่สิ่งเดียวกับน้ำหนักหรือไม่
2835098

ไม่พวกมันเป็นน้ำหนักของชั้นสังวัตนา แต่ผลิตภัณฑ์ที่ได้จากการบิดเช่นแผนที่คุณลักษณะเป็นคุณสมบัติ
Himanshu Rai

ฉันไม่เห็นด้วย. ตัวแปรที่ซ่อนอยู่ยังมีอยู่ในฟอเรสต์แบบสุ่มและอัลกอริทึมการเพิ่ม และคุณยังคงสร้างคุณสมบัติในการเรียนรู้อย่างลึกซึ้ง เช่นเดียวกับพื้นที่เพาะปลูกในหนึ่งในอัลกอริทึมการจดจำรูปภาพที่ดีที่สุดในปี 2560
keiv.fly
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.