อะไรคือความแตกต่างระหว่าง Neural Network ระบบ Deep Learning และ Deep Belief Network


23

อะไรคือความแตกต่างระหว่าง Neural Network ระบบ Deep Learning และ Deep Belief Network

ในขณะที่ฉันจำเครือข่ายประสาทขั้นพื้นฐานของคุณเป็นสิ่งที่ค่อนข้างเป็น 3 ชั้นและฉันมีระบบความเชื่อลึกที่อธิบายว่าเป็นเครือข่ายประสาทที่ซ้อนกันอยู่ด้านบนของกันและกัน

ฉันไม่เคยได้ยินมาก่อนเกี่ยวกับ Deep Learning Systems แต่ฉันสงสัยอย่างมากว่ามันเป็นคำพ้องสำหรับ Deep Belief System มีใครยืนยันได้ไหม



ระบบความเชื่อลึกเป็นคำที่ฉันวิ่งเข้าไปพวกเขาอาจหรืออาจจะไม่ใช่คำพ้องความหมาย (การค้นหา google จะโยนบทความสำหรับระบบความเชื่อลึก)
Lyndon White

Deep Belief Network เป็นชื่อที่เป็นที่ยอมรับเพราะมันมาจาก Deep Boltzmann Network (และอาจสร้างความสับสนกับระบบการเผยแพร่ความเชื่อที่แตกต่างกันโดยสิ้นเชิงเนื่องจากมันเกี่ยวกับเครือข่าย Bayesian และทฤษฎีการตัดสินใจที่น่าจะเป็น)
gaborous

@gaborous Deep Belief Network เป็นชื่อที่ถูกต้อง (เอกสารที่ฉันได้รับเมื่อหลายปีก่อนที่แนะนำฉันให้พวกเขาต้องมีการพิมพ์ผิด) แต่จะมาจากเครือข่าย boltzman ลึกชื่อนั้นเองเป็น noncanonical (AFAIK ยินดีที่จะดูการอ้างอิง) DBN มาจาก Sigmoid Belief Networks และ RBM แบบซ้อน ฉันไม่คิดว่าจะใช้คำว่า Deep Boltzmann Network ในอีกทางหนึ่ง Deep Boltzmann Machine เป็นคำที่ใช้ แต่เครื่องจักร Deep Boltzmann ถูกสร้างขึ้นหลังจาก Deep Belief Networks
Lyndon White

@Ooxabox คุณพูดถูกฉันได้พิมพ์ผิดมันเป็น Deep Boltzmann Machines ถึงแม้ว่ามันควรจะเรียกว่า Deep Boltzmann Network (แต่แล้วตัวย่อจะเหมือนกันดังนั้นอาจเป็นเหตุผล) ฉันไม่ทราบว่าสถาปัตยกรรมอันลึกซึ้งใดที่ถูกคิดค้นขึ้นเป็นครั้งแรก แต่เครื่อง Boltzmann นั้นก่อนหน้า bm แบบกึ่ง จำกัด DBN และ DBM เป็นโครงสร้างเดียวกันจริง ๆ ยกเว้นว่าเครือข่ายพื้นฐานที่ใช้เป็นเลเยอร์ซ้ำคือ SRBM กับ BM
gaborous

คำตอบ:


10

แบบจำลองโครงข่ายประสาทเทียมมักถูก จำกัด อยู่เพียงไม่กี่ชั้นพูด 3 มานานหลายทศวรรษด้วยเหตุผลหลายประการรวมถึงหลักฐานทางคณิตศาสตร์ชื่อ Kolmogorovs thm ที่ระบุว่าพวกเขาสามารถฟังก์ชั่นโดยพลการทางทฤษฎีประมาณข้อผิดพลาดที่มีความผิดพลาดต่ำ

เครือข่ายหลายชั้นนอกนั้นไม่สามารถทำได้ / มีประสิทธิภาพผ่านเทคนิคการเรียนรู้ก่อนหน้า การพัฒนาที่คล้ายกันเกิดขึ้นในปี 2549 โดยนักวิจัย 3 คน Hinton, Le Cun, Bengio ที่สามารถฝึกฝนเลเยอร์ได้มากกว่า ปัญหาที่โดดเด่นในด้านนี้คือการรู้จำลายมือ

คำว่า "เครือข่ายความเชื่อลึก ๆ " ดูเหมือนว่าจะเกิดขึ้นในปี 2549 โดยฮินตันอ้างถึงเครือข่ายแบบเบย์ซึ่งมีแนวคิด / ทฤษฎี / การเชื่อมต่อ / คล้ายคลึงกับโครงข่ายประสาทเทียม "อัลกอริทึมการเรียนรู้ที่รวดเร็วสำหรับอวนที่เชื่ออย่างลึกซึ้ง"

ดูสไลด์ที่ 17 โดยเฉพาะงานนำเสนอนี้เครือข่ายประสาทลึก

ดังนั้นสนามการเรียนรู้ที่ลึกนั้นมีอายุเพียง ~ ½ทศวรรษและกำลังอยู่ระหว่างการวิจัยและพัฒนาอย่างรวดเร็ว Google, Facebook, Yahoo มีการริเริ่มการเรียนรู้เชิงลึกและการวิจัยและพัฒนาอย่างต่อเนื่อง


เว็บไซต์ทุ่มเทเพื่อการเรียนรู้อย่างลึกซึ้งโดยนักวิจัยในสาขา
vzn

14

โครงข่ายประสาทเทียมเป็นคลาสของอัลกอริทึมที่มีอัลกอริทึมหลายชนิดที่แตกต่างกันตามกราฟดังนั้นฉันจะไม่พูดถึงรายละเอียดที่นี่เกินกว่าที่คุณถามเพราะมันมีอะไรจะพูดมากเกินไป

เครือข่ายประสาทเทียมชนิดแรกคือเซลล์ประสาท McCulloch-Pitts ที่มีชื่อเสียงเป็นเส้นตรงซึ่งหมายความว่าพวกเขาสามารถแก้ปัญหาการตัดสินใจเชิงเส้นได้เท่านั้น (เช่นชุดข้อมูลที่สามารถแยกได้เป็นเส้นตรงโดยการวาดเส้น) เมื่อเวลาผ่านไปแบบจำลองโครงข่ายประสาทเชิงเส้นนี้เป็นที่รู้จักในนาม Perceptron หรือ Adaline (ขึ้นอยู่กับว่าคุณคำนวณการปรับปรุงตุ้มน้ำหนัก)

เครือข่ายเชิงเส้นเชิงเส้นประกอบด้วยกราฟสองส่วนซึ่งโหนดด้านซ้ายเป็นอินพุตและโหนดด้านขวาเป็นเอาต์พุต เฉพาะน้ำหนักของขอบระหว่างโหนดเหล่านี้เท่านั้นที่จะได้รับการเรียนรู้ (เกณฑ์การเปิดใช้งานโหนดสามารถปรับได้ แต่สิ่งนี้ไม่ค่อยเกิดขึ้น)

โครงข่ายประสาทขั้นพื้นฐานเช่น Adaline หรือ Perceptron (ไม่มีเลเยอร์ที่ซ่อนอยู่) ขอบเขตการตัดสินใจเชิงเส้น

ขั้นตอนใหญ่ถูกนำเมื่อตื้นเครือข่ายประสาทถูกคิดค้น: แทนที่จะมีเพียงฝ่ายกราฟเราจะใช้กราฟ 3partite: การป้อนข้อมูล "ชั้น" ส่งออก "ชั้น" และหนึ่ง "ชั้นที่ซ่อนอยู่"ระหว่างพวกเขา ขอบคุณเลเยอร์ที่ซ่อนอยู่ตอนนี้เครือข่ายสามารถทำการตัดสินใจที่ไม่ใช่เชิงเส้นและแก้ปัญหาเช่น XOR มาตรฐาน

เครือข่ายประสาทของแฮค เส้นทางการเปิดใช้งานตัวอย่างของ Xor Neural Network ขอบเขตการตัดสินใจเครือข่ายของ Xor

โปรดทราบว่าคำว่า "ตื้น" ประกาศเกียรติคุณย้อนหลังเมื่อเครือข่ายประสาทลึก (หรือที่เรียกว่าเครือข่ายประสาทn- ชั้น ) ถูกประดิษฐ์ขึ้น นี้คือการต่อต้านเครือข่ายประสาทมีเพียงชั้นที่ซ่อนอยู่หนึ่งที่มีเครือข่ายประสาทลึกกับ n ชั้นซ่อน ในขณะที่คุณสามารถเดาได้ว่าการใช้เลเยอร์ที่ซ่อนอยู่มากขึ้นช่วยให้สามารถตัดสินใจเกี่ยวกับชุดข้อมูลที่ซับซ้อนมากขึ้นเนื่องจากมีเลเยอร์จำนวนมากขึ้นเพื่อปรับเปลี่ยนการตัดสินใจ (กล่าวคือคุณกำลังเพิ่มมิติของขอบเขตการตัดสินใจ

โครงข่ายประสาท N-layer ขอบเขตการตัดสินใจที่ไม่เป็นเชิงเส้นที่ซับซ้อนโดยใช้โครงข่ายประสาทชั้นลึกเอ็น - เลเยอร์

คุณอาจถามว่า: ทำไมไม่มีใครลองใช้เครือข่ายประสาทหลายชั้น (ลึก) ก่อน? ในความเป็นจริงพวกเขาทำเร็วเท่าที่ 1975 โดย Fukushima กับCognitronและNeocognitron (ซึ่งอันที่จริงแล้วเป็นเครือข่ายประสาทเทียมที่เกี่ยวเนื่อง แต่นั่นเป็นอีกเรื่องหนึ่ง) อย่างไรก็ตามปัญหาคือไม่มีใครที่รู้วิธีที่จะเรียนรู้ได้อย่างมีประสิทธิภาพเครือข่ายดังกล่าวปัญหาใหญ่เป็นกู AutoEncoders ของ Hintonเปิดทางและหลังจากนั้นหน่วยแก้ไขเชิงเส้นของ LeCun ได้แก้ไขปัญหาให้ดี

เครือข่าย Deep Beliefs (DBN) เป็นอย่างไร พวกเขาเป็นเพียงเครื่องจักร Boltzmann กึ่ง จำกัด หลายชั้น ดังนั้นพวกเขาจึงเป็นชนิดของเครือข่ายประสาทลึก แต่มีรูปแบบที่แตกต่างกันพื้นฐานเครือข่าย (เช่น: ชั้นนี้เป็นรูปแบบที่ซ้ำแล้วซ้ำอีก): เครื่อง Boltzmann จะแตกต่างจากเครือข่ายอื่น ๆ ในการที่พวกเขาจะกำเนิดซึ่งหมายความว่าพวกเขามักจะ ใช้เพื่อเรียนรู้จากข้อมูลของคุณเพื่อสร้างมันขึ้นมาใหม่ ("สร้าง" มัน) ในขณะที่เครือข่ายนิวรัลลึก ๆ จะถูกใช้เพื่อแยกข้อมูลของคุณ (โดยการวาด "ขอบเขตการตัดสินใจ")

กล่าวอีกนัยหนึ่ง DNN นั้นยอดเยี่ยมในการจำแนก / ทำนายค่าจากชุดข้อมูลของคุณในขณะที่ DBN นั้นยอดเยี่ยมในการ "ซ่อมแซม" ข้อมูลที่เสียหาย (เมื่อฉันบอกว่าการซ่อมแซมไม่ใช่จากข้อมูลที่เสียหายเท่านั้น แต่ยังเป็นข้อมูลที่สมบูรณ์แบบด้วย ที่คุณต้องการแก้ไขเล็กน้อยเพื่อให้โปรเฟสเซอร์มากขึ้นเพื่อให้จดจำได้ง่ายขึ้นด้วยเครือข่ายประสาทอื่นเช่นตัวเลขที่เขียนด้วยมือ)

ในความเป็นจริงเพื่อสรุปอย่างเป็นระเบียบคุณสามารถพูดได้ว่า AutoEncoders เป็นรูปแบบที่ง่ายกว่าของ Deep Belief Network นี่คือตัวอย่างของ DBN ที่ได้รับการฝึกฝนให้จดจำใบหน้า แต่ไม่ใช่ตัวเลขตัวเลขจะจางหายไปโดยอัตโนมัติ (นี่คือผลกระทบ "การตรึง" ของ DBN):

ตัวอย่าง Deep Belief Network เกี่ยวกับการจดจำใบหน้า

ดังนั้นในท้ายที่สุด DBN และ DNN ไม่ตรงข้าม: สมบูรณ์ ตัวอย่างเช่นคุณสามารถจินตนาการระบบที่จะจดจำอักขระที่เขียนด้วยมือซึ่งจะป้อนรูปภาพของอักขระไปยัง DBN ก่อนเพื่อให้มีโปรเฟสเซอร์มากกว่าและจากนั้นให้ฟีดอิมเมจ stereotyped ไปยัง DNN ที่จะแสดงผลลัพธ์ของอักขระที่รูปภาพแทน

หมายเหตุสุดท้าย: Deep Belief Nets นั้นอยู่ใกล้กับ Deep Boltzmann Machines มาก: Deep Boltzmann Machines ใช้เลเยอร์ของ Boltzmann Machines (ซึ่งเป็นเครือข่ายประสาทสองทิศทางแบบสองทางหรือที่เรียกว่าเครือข่ายประสาทแบบเรียกซ้ำ) ในขณะที่ Deep Belief Nets ใช้ Boltzmann Machines แบบกึ่ง จำกัด จำกัด หมายความว่าพวกเขาจะเปลี่ยนเป็นทิศทางเดียวจึงช่วยให้ใช้ backpropagation เพื่อเรียนรู้เครือข่ายที่มีประสิทธิภาพมากกว่าการเรียนรู้เครือข่าย reccurent) ทั้งสองเครือข่ายใช้เพื่อจุดประสงค์เดียวกัน (การสร้างชุดข้อมูลใหม่) แต่ค่าใช้จ่ายในการคำนวณแตกต่างกัน (Deep Boltzmann Machines มีค่าใช้จ่ายในการเรียนรู้อย่างมีนัยสำคัญมากกว่าเนื่องจากมีลักษณะเกิดขึ้นอีก: มันยากที่จะ "คงที่" น้ำหนัก)

โบนัส: เกี่ยวกับ Convolutional Neural Networks (CNN) คุณจะพบข้อเรียกร้องที่ขัดแย้งและสับสนจำนวนมากและโดยปกติคุณจะพบว่าพวกเขาเป็นเพียงเครือข่ายประสาทลึก อย่างไรก็ตามดูเหมือนว่าฉันทามติจะใช้คำจำกัดความดั้งเดิมของ Neocognitron ของฟูกูชิม่า: CNN เป็น DNN ที่ถูกบังคับให้แยกคุณลักษณะต่าง ๆ ในระดับลำดับขั้นที่แตกต่างกันโดยการจัดทำข้อตกลงก่อนการเปิดใช้งาน (ซึ่ง DNN สามารถทำได้ตามธรรมชาติ โดยการตั้งค่าฟังก์ชั่น convolution / activation ที่แตกต่างกันในเลเยอร์ต่างๆของเครือข่ายอาจให้ผลลัพธ์ที่ดีกว่าอย่างน้อยนั่นก็คือการเดิมพันของ CNN):

คุณสมบัติของโครงข่ายประสาทลึก คุณสมบัติของโครงข่ายประสาทเทียม

และในที่สุดก็หาที่เข้มงวดมากขึ้นไทม์ไลน์ของปัญญาประดิษฐ์ให้ดูที่นี่


1
คำตอบที่ดี! ลักษณะสำคัญ (อาจกำหนดลักษณะ) ของเครือข่ายลึก convolutional คือแต่ละชั้นสอดคล้องกับการใช้การสนทนาแล้วใช้ฟังก์ชั่นการเปิดใช้งาน: มีเคอร์เนลและโหนดทั้งหมดในชั้นใช้เคอร์เนลเดียวกัน ลองนึกภาพอินพุตเป็นภาพ โดยทั่วไปคุณมีโหนดสำหรับแต่ละพิกเซลและมีการเชื่อมต่อที่มาจากพิกเซลใกล้เคียง เครือข่ายธรรมดาจะอนุญาตให้แต่ละพิกเซลมีรูปแบบน้ำหนักของตัวเองบนขอบขาเข้า เครือข่าย convolutional กำหนดความต้องการพิเศษว่าเป็นน้ำหนักที่เท่ากันทุกพิกเซลในภาพ
DW

ใช่คุณพูดถูกและนั่นเป็นชื่อที่มาจากไหน แต่โดยส่วนตัวแล้วฉันคิดว่านี่มักจะใช้เป็นแฮ็คในการสร้างเครือข่ายประสาทที่ลึกกว่าสิ่งอื่นใด (เมื่อการกำหนดลักษณะของเครือข่ายประสาทลึกนั้นเป็นวัตถุประสงค์ทั่วไปและไม่เชื่อเรื่องพระเจ้ากับชุดข้อมูล) ตัวอย่างเช่น HMAX ซึ่งเป็นซีเอ็นเอ็นชนิดหนึ่งใช้การคำนวณเพื่อคำนวณแผนที่ความแจ่มใสซึ่งเห็นได้ชัดว่าเป็นการแฮ็กเมื่อแผนที่ความดีในเครือข่ายประสาทชีววิทยานั้นไม่ได้คำนวณโดยใช้โปรแกรมแบบไดนามิก ...
gaborous

3

Deep Neural Networks เป็น Neural Networks ที่มีความลึกค่อนข้างสูง พวกมันเป็นคลาสย่อยของ Neural Networks แนวคิดนี้ย้อนกลับไปหลายทศวรรษแล้วและไม่ใช่เรื่องใหม่ มีอะไรใหม่คือเราคิดวิธีฝึกพวกมันในทางปฏิบัติ เหตุผลที่มันได้รับความนิยมอย่างมากเมื่อเร็ว ๆ นี้ก็คือการฝึกฝนพวกเขาให้เป็นไปได้และผู้คนใช้มันเพื่อเอาชนะอัลกอริทึมที่ทันสมัย DNN ต้องการข้อมูลจำนวนมากและพลังการคำนวณมากมายซึ่งไม่สามารถหาได้เมื่อหลายสิบปีที่แล้ว เจฟฟ์ฮินตันและนักเรียนและเพื่อนร่วมงานของเขาค้นพบวิธีการฝึกอบรมพวกเขาในช่วงทศวรรษที่ผ่านมาและใช้พวกเขาเพื่อเอาชนะอัลกอริทึมการเรียนรู้ของเครื่องจักรที่ทันสมัยในหลายสาขาที่นักวิจัยส่วนใหญ่รังเกียจแนวคิด

Belief Networks เป็นคลาสของ Probabilistic Graphical Models พวกมันจำลองกลุ่มตัวแปรสุ่มและการพึ่งพาโดยใช้กราฟ (มีหลายวิธีในการทำสิ่งนี้) ตัวแปรเหล่านั้นเองอาจมาจากการแจกแจงแบบมีพารามิเตอร์และอาจเป็นแบบจำลองโดยโครงข่ายประสาทเทียม (หรือแบบจำลองอื่นสำหรับการแทนค่าการแจกแจงแบบมีพารามิเตอร์) Deep Belief Networks เป็นเครือข่ายความเชื่อที่มีความลึกค่อนข้างสูง

เครือข่ายความเชื่อมีแนวโน้มที่จะกำเนิดเช่นเราสามารถใช้แบบจำลองที่ผ่านการฝึกอบรมเพื่อสร้างตัวอย่างจากการแจกแจง

โครงข่ายประสาทมีแนวโน้มที่จะเลือกปฏิบัติเราสามารถใช้พวกมันเพื่อคำนวณความน่าจะเป็นของอินพุตที่กำหนด (นี่คือรูปแมวหรือไม่ความน่าจะเป็นที่จะเป็นภาพแมวนั้นคืออะไร) แต่โดยปกติจะไม่ใช้การสุ่มตัวอย่าง รูปภาพของแมว)


ฉันไม่ใช่ผู้เชี่ยวชาญเกี่ยวกับ ML ดังนั้นให้นำสิ่งที่ฉันเขียนด้วยเกลือเม็ด
Kaveh

-1

เครือข่ายนิวรัลถูกนำมาใช้ในกรณีที่จำเป็นต้องใช้เลเยอร์ที่ซ่อนอยู่และสมการกำลังสองที่ใดก็ได้เนื่องจากการเรียนรู้อย่างลึกล้ำและเครือข่ายความเชื่อที่ลึกซึ้งนั้นถูกนำไปใช้


ดังนั้นทั้งสองต้องการเลเยอร์ที่ซ่อนอยู่หรือไม่ คุณสามารถทำหลายเลเยอร์ที่ซ่อนอยู่ใน NN ปกติได้ไหม เครือข่าย Boltzmann นี้คุณหมายถึงเครื่อง Boltzmann หรือไม่? แล้วความแตกต่างคืออะไร? ไม่ตอบคำถาม (หรืออาจเป็นได้ แต่ไม่ชัดเจนเกินไป)
Evil
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.