เครือข่ายประสาทเทียมคืออะไร *


15

เมื่อเราเจาะลึกลงไปในวรรณกรรมของNeural Networksเราจะหาวิธีอื่น ๆ ด้วยโทโพโลยีของนิวโรมอร์ฟิค (สถาปัตยกรรมแบบ "Neural-Network") และฉันไม่ได้พูดคุยเกี่ยวกับยูนิเวอร์แซประมาณทฤษฎีบท ตัวอย่างได้รับด้านล่าง

จากนั้นมันทำให้ฉันสงสัยว่า: อะไรคือความหมายของเครือข่ายประสาทเทียม? โทโพโลยีของมันดูเหมือนจะครอบคลุมทุกอย่าง


ตัวอย่าง:

หนึ่งในการระบุตัวแรกที่เราทำคือระหว่าง PCA และ Linear Autoencoder ที่มีตุ้มน้ำหนักในตัวเข้ารหัสและตัวถอดรหัส

นอกจากนี้ยังมีการระบุร่วมกันระหว่างตัวแบบเชิงเส้น (การถดถอยแบบโลจิสติกส์ในแบบพิเศษ) และแบบโครงข่ายประสาทเทียมโดยไม่มีเลเยอร์ที่ซ่อนอยู่และเลเยอร์เอาท์พุทเดี่ยว การระบุนี้เปิดหลายประตู

ซีรี่ส์ฟูริเยร์และเทย์เลอร์? ANNs SVM ? ANN กระบวนการแบบเกาส์ ANN (พร้อมเลเยอร์ที่ซ่อนเดี่ยวพร้อมยูนิตที่ซ่อนไม่ จำกัด )

และเช่นเดียวกับที่ง่าย ๆ เราสามารถรวมเวอร์ชันปกติโดยพลการกับฟังก์ชั่นการสูญเสียพิเศษของอัลกอริทึมเหล่านี้ลงในกรอบโครงข่ายประสาทเทียม

แต่ยิ่งเราขุดมากเท่าไหร่ ฉันเพิ่งเข้าสู่Deep Neural Decision Treesซึ่งทำให้การระบุสถาปัตยกรรม ANN ที่เฉพาะเจาะจงกับต้นไม้การตัดสินใจทำให้สามารถเรียนรู้สิ่งเหล่านี้ได้ด้วยวิธีการของ ANN (เช่นการไล่ระดับสีย้อนกลับของ Gradient Descent) จากนี้เราสามารถสร้างป่าสุ่มและต้นไม้ตัดสินใจเพิ่มไล่โทนสีจากทอพอโลยีโครงข่ายประสาทเทียมเพียงอย่างเดียว

หากทุกอย่างสามารถแสดงเป็นโครงข่ายใยประสาทเทียมอะไรคือตัวกำหนดเครือข่ายประสาทเทียม


กระดาษบนต้นไม้ตัดสินใจลึกประสาทนั้นค่อนข้างไกล ฟังก์ชั่นการเปิดใช้งานตามปกติคือฟังก์ชั่นมูลค่าจริงไม่ใช่ผลิตภัณฑ์ด้านนอก ดังนั้นพวกเขาจึงไม่ได้พูดถึง ANN จริง ๆ ตามที่เราคิด แต่โดยทั่วไปแล้วการคำนวณทางคณิตศาสตร์ที่ไม่ได้ใช้กันอย่างแพร่หลายหรือเป็นที่ยอมรับ เพื่อแสดง ANN แตกต่างจากแผนภูมิการตัดสินใจฉันเพียงแค่ชี้ให้เห็นว่า ANNs ทั้งหมดเป็นพารามิเตอร์ (มีพื้นที่พารามิเตอร์ จำกัด ) ในขณะที่ต้นไม้ไม่มีพารามิเตอร์ (มีพื้นที่พารามิเตอร์ที่ไม่มีที่สิ้นสุด)
olooney

@olooney ผลิตภัณฑ์ Kronecker ไม่ใช่ฟังก์ชันการเปิดใช้งานมันเป็นเพียงการดำเนินการกับเอาต์พุตของเลเยอร์ก่อนหน้า (เช่นการบิดหรือการดำเนินการอื่น ๆ ที่เรากำหนดไว้ในการเปิดใช้งาน) DNDT สามารถแสดงแผนผังการตัดสินใจใด ๆ และ DNDT ทุกรายการสามารถแสดงได้ด้วยแผนผังการตัดสินใจ
Firebug

1
@olooney ตามนิยามของฟังก์ชั่นการเปิดใช้งาน Softmax ไม่ใช่ฟังก์ชั่นการเปิดใช้งาน
Firebug

2
ฉันไม่แน่ใจทั้งหมดฉันเข้าใจแรงจูงใจของคำถามนี้ คำจำกัดความที่เป็นไปได้และหลวมของ ANN คือมันเป็นรูปแบบกราฟฟิคกำกับที่ใช้เซลล์ประสาท (เช่นฟังก์ชั่นการเปิดใช้งาน) เพื่อประมวลผลอินพุต / เอาท์พุตและใช้เวลาส่วนใหญ่ในการไล่ระดับสี เมื่อคุณพูดว่า "ทุกสิ่งสามารถแสดงเป็น ANN" คุณถามโดยเฉพาะว่ามีการทำแผนที่ที่แน่นอนระหว่างรุ่นอื่น ๆ ที่กล่าวถึงและ ANN หรือไม่? ปัญหาคือคุณจะต้องเจอกับขั้นตอนการฝึกอบรมที่ได้รับการดัดแปลงเพื่อให้ตรงกับการเพิ่มประสิทธิภาพ
อเล็กซ์อาร์

1
@Sycorax ฉันก็ทำเช่นกันทั้งเขาและฮินตันพูดถึงมัน ฉันต้องการที่จะให้โอกาสที่จะ answerers ในค่ายอื่น ๆ เพื่อให้แหล่งที่เชื่อถือ :)
Firebug

คำตอบ:


6

Jürgen Schmidhuber, " การเรียนรู้อย่างลึกล้ำในโครงข่ายประสาทเทียม: ภาพรวม " มีร่องรอยประวัติศาสตร์ของแนวคิดหลักในโครงข่ายประสาทและการเรียนรู้เชิงลึก ในมุมมองของเขาโครงข่ายประสาทเทียมจะปรากฏเป็นรูปแบบใด ๆ ที่สามารถกำหนดเป็นกราฟกำกับที่แต่ละโหนดแสดงถึงหน่วยการคำนวณบางอย่าง Schmidhuber เป็นนักวิจัยโครงข่ายประสาทที่มีชื่อเสียงและเขียนบทความต้นฉบับบนเครือข่าย LSTM กับ Sepp Hochreiter

องค์ประกอบที่แก้ไขได้ของระบบการเรียนรู้ที่รับผิดชอบต่อความสำเร็จหรือความล้มเหลว การเปลี่ยนแปลงใดที่ทำให้พวกเขาปรับปรุงประสิทธิภาพได้ สิ่งนี้เรียกว่าปัญหาการกำหนดเครดิตพื้นฐาน (Minsky, 1963) มีวิธีการกำหนดเครดิตทั่วไปสำหรับผู้แก้ปัญหาสากลที่เหมาะสมกับเวลาในความรู้สึกทางทฤษฎีต่าง ๆ (วินาที 6.8) อย่างไรก็ตามการสำรวจครั้งนี้จะมุ่งเน้นไปที่ขอบเขตที่แคบลง แต่ปัจจุบันเป็นสาขาย่อยของ Deep Learning (DL) ที่มีความสำคัญทางการค้าในเชิงลึกในโครงข่ายประสาทเทียม (NNs)

เครือข่ายนิวรัลมาตรฐาน (NN) ประกอบด้วยตัวประมวลผลที่เชื่อมต่อง่าย ๆ มากมายที่เรียกว่าเซลล์ประสาทซึ่งแต่ละตัวจะสร้างลำดับการเปิดใช้งานที่มีคุณค่าจริง เซลล์ประสาทนำเข้าได้รับการเปิดใช้งานผ่านเซ็นเซอร์รับรู้สภาพแวดล้อมเซลล์ประสาทอื่น ๆ จะเปิดใช้งานผ่านการเชื่อมต่อแบบถ่วงน้ำหนักจากเซลล์ประสาทที่ใช้งานก่อนหน้านี้ (รายละเอียดในวินาที 2) เซลล์ประสาทบางชนิดอาจมีอิทธิพลต่อสภาพแวดล้อมด้วยการกระตุ้นการกระทำ การเรียนรู้หรือการกำหนดเครดิตเป็นเรื่องเกี่ยวกับการหาน้ำหนักที่ทำให้ NN มีพฤติกรรมที่ต้องการเช่นการขับรถ ขึ้นอยู่กับปัญหาและวิธีการเชื่อมต่อของเซลล์ประสาทพฤติกรรมดังกล่าวอาจต้องใช้โซ่ยาวสาเหตุของขั้นตอนการคำนวณ (วินาที 3) ซึ่งแต่ละขั้นตอนการแปลง การเรียนรู้อย่างลึกซึ้งเกี่ยวกับการกำหนดเครดิตอย่างแม่นยำในหลาย ๆ ขั้นตอน

โมเดลที่คล้ายกับ NN ตื้น ๆ ที่มีระยะดังกล่าวไม่กี่รอบมานานหลายสิบปีหากไม่ใช่ศตวรรษ (วินาที 5.1) แบบจำลองที่มีชั้นของเซลล์ประสาทแบบไม่ต่อเนื่องหลายชั้นย้อนหลังไปอย่างน้อยในทศวรรษ 1960 (วินาที. 5.3) และ 1970 (วินาที. 5.5) วิธีการไล่ระดับสีที่มีประสิทธิภาพสำหรับการเรียนรู้แบบมีผู้สอนภายใต้การดูแล (SL) ในเครือข่ายที่ไม่ต่อเนื่องซึ่งมีความแตกต่างกันของความลึกตามอำเภอใจที่เรียกว่า backpropagation (BP) ได้รับการพัฒนาในปี 1960 และ 1970 อย่างไรก็ตามการฝึกอบรมเชิงลึกเกี่ยวกับ NNs ที่มีหลายเลเยอร์อย่างไรก็ตามพบว่าเป็นการยากในทางปฏิบัติในช่วงปลายทศวรรษ 1980 (Sec. 5.6) และได้กลายเป็นหัวข้อการวิจัยที่ชัดเจนโดยต้นปี 1990 (Sec. 5.9) DL เป็นไปได้จริงในระดับหนึ่งด้วยความช่วยเหลือของ Unsupervised Learning (UL) เช่นวินาที 5.10 (1991), วินาที 5.15 (2549) ในช่วงปี 1990 และ 2000 นั้นยังเห็นการปรับปรุง DL ที่ควบคุมอย่างหมดจด (Sec. 5) ในสหัสวรรษใหม่นั้น NN ลึก ๆ ได้ดึงดูดความสนใจอย่างกว้างขวางในที่สุดโดยการใช้วิธีการเรียนรู้ของเครื่องจักรทางเลือกอื่น ๆ เช่นเครื่องเคอร์เนล (Vapnik, 1995; Scholkopf et al., 1998) ในแอปพลิเคชันที่สำคัญมากมาย ในความเป็นจริงตั้งแต่ปี 2009 ผู้ดูแลเอ็นเอ็นลึกได้รับรางวัลชนะเลิศการแข่งขันการจดจำรูปแบบระหว่างประเทศ (เช่น Sec. 5.17, 5.19, 5.21, 5.22), บรรลุผลการจดจำรูปแบบภาพเหนือมนุษย์เป็นครั้งแรกในโดเมนที่ จำกัด (Sec. 5.19, 2011) NN แบบลึกยังมีความเกี่ยวข้องกับสาขาทั่วไปของการเรียนรู้การเสริมแรง (RL) อีกด้วยโดยที่ไม่มีครูผู้สอน (วินาทีที่ 6) ส่วนใหญ่โดยวิธีการเรียนรู้ที่ดีกว่าเครื่องจักรทางเลือกเช่นเครื่องเคอร์เนล (Vapnik, 1995; Scholkopf et al., 1998) ในแอปพลิเคชันที่สำคัญมากมาย ในความเป็นจริงตั้งแต่ปี 2009 ผู้ดูแลเอ็นเอ็นลึกได้รับรางวัลชนะเลิศการแข่งขันการจดจำรูปแบบระหว่างประเทศ (เช่น Sec. 5.17, 5.19, 5.21, 5.22), บรรลุผลการจดจำรูปแบบภาพเหนือมนุษย์เป็นครั้งแรกในโดเมนที่ จำกัด (Sec. 5.19, 2011) NN แบบลึกยังมีความเกี่ยวข้องกับสาขาทั่วไปของการเรียนรู้การเสริมแรง (RL) อีกด้วยโดยที่ไม่มีครูผู้สอน (วินาทีที่ 6) ส่วนใหญ่โดยวิธีการเรียนรู้ที่ดีกว่าเครื่องจักรทางเลือกเช่นเครื่องเคอร์เนล (Vapnik, 1995; Scholkopf et al., 1998) ในแอปพลิเคชันที่สำคัญมากมาย ในความเป็นจริงตั้งแต่ปี 2009 ผู้ดูแลเอ็นเอ็นลึกได้รับรางวัลชนะเลิศการแข่งขันการจดจำรูปแบบระหว่างประเทศ (เช่น Sec. 5.17, 5.19, 5.21, 5.22), บรรลุผลการจดจำรูปแบบภาพเหนือมนุษย์เป็นครั้งแรกในโดเมนที่ จำกัด (Sec. 5.19, 2011) NN แบบลึกยังมีความเกี่ยวข้องกับสาขาทั่วไปของการเรียนรู้การเสริมแรง (RL) อีกด้วยโดยที่ไม่มีครูผู้สอน (วินาทีที่ 6) บรรลุผลการจดจำรูปแบบภาพเหนือมนุษย์เป็นครั้งแรกในโดเมนที่ จำกัด (วินาที 5.19, 2011) NN แบบลึกยังมีความเกี่ยวข้องกับสาขาทั่วไปของการเรียนรู้การเสริมแรง (RL) อีกด้วยโดยที่ไม่มีครูผู้สอน (วินาทีที่ 6) บรรลุผลการจดจำรูปแบบภาพเหนือมนุษย์เป็นครั้งแรกในโดเมนที่ จำกัด (วินาที 5.19, 2011) NN แบบลึกยังมีความเกี่ยวข้องกับสาขาทั่วไปของการเรียนรู้การเสริมแรง (RL) อีกด้วยโดยที่ไม่มีครูผู้สอน (วินาทีที่ 6)

ในทางกลับกันฉันไม่แน่ใจว่าจำเป็นต้องทำกำไรเพื่อพยายามสร้างอนุกรมวิธานของถังที่ใช้ร่วมกันเฉพาะสำหรับกลยุทธ์การเรียนรู้ของเครื่อง ฉันคิดว่าเราสามารถพูดได้ว่ามีมุมมองจากแบบจำลองที่สามารถดูเป็นเครือข่ายประสาท ฉันไม่คิดว่ามุมมองนั้นจำเป็นต้องดีที่สุดหรือมีประโยชน์ในทุกบริบท ตัวอย่างเช่นฉันยังคงวางแผนที่จะอ้างถึงป่าแบบสุ่มและต้นไม้ที่เพิ่มระดับความลาดชันเป็น "ตระการตาต้นไม้" แทนที่จะแยกความแตกต่างออกไปและเรียกพวกเขาว่า "ต้นไม้เครือข่ายประสาท" ยิ่งไปกว่านั้น Schmidhuber แยกความแตกต่าง NNs จากเครื่องเคอร์เนล - แม้ว่าเครื่องเคอร์เนลมีการเชื่อมต่อบางอย่างกับ NNs - เมื่อเขาเขียน "ในสหัสวรรษใหม่เอ็นเอ็นลึก ๆ ได้ดึงดูดความสนใจอย่างกว้างขวางในที่สุด ส่วนใหญ่โดยวิธีการเรียนรู้ที่ดีกว่าเครื่องจักรทางเลือกเช่นเครื่องเคอร์เนล ... ในการใช้งานที่สำคัญมากมาย "


ดังนั้นโดยทั่วไปทุก ๆ โมเดลและฮิวริสติกที่รู้จักกันในการเรียนรู้ของเครื่องและสถิติในวันนี้จะถือว่าเป็น ANN โดย Schmidhuber ด้วยการตั้งชื่อที่โดดเด่นเพียงแค่ได้รับจากกลยุทธ์การเพิ่มประสิทธิภาพ
Firebug

1
ฉันได้รับจากมุมมองที่ใช้งานได้จริง แต่มันก็ไม่ได้เปลี่ยนความจริงที่ว่าสวยมากทุกรุ่นพูด ANN อย่างเคร่งครัด (ฉันไม่สามารถคิดแบบเดียวที่ไม่ได้)
Firebug

2
@Firebug คุณจะจัดรูปแบบการถดถอยใหม่อีกครั้งหรือวิธีการจัดกลุ่มแบบง่าย (k-mean และอื่น ๆ ) ที่ได้รับการฝึกฝนหรือวางใน 'สภาพแวดล้อมการเรียนรู้' เช่นนั้นเท่ากับ ANN คำจำกัดความนี้อย่างไร
Sextus Empiricus

1
@ Firebug ฉันไม่เห็นความจริงที่ว่า PCA สามารถแสดงให้เทียบเท่ากับ autoencoder เฉพาะทำให้ PCA "เครือข่ายประสาท" ใน PCA มาตรฐานเราไม่ได้ใช้การไล่ระดับสี
อะมีบาพูดว่า Reinstate Monica

1
@Firebug หากคุณกำหนด "NN" เป็น "โหนดการคำนวณที่เชื่อมต่อ" จากนั้นฉันเดาว่าการคำนวณใด ๆ คือ NN ไม่แน่ใจว่าเป็นของใช้ใด ๆ แต่ก็โอเค
อะมีบาพูดว่า Reinstate Monica

7

หากคุณต้องการคำจำกัดความพื้นฐานของ ANN คุณอาจบอกว่ามันเป็นแบบจำลองที่กำหนดทิศทางแบบกราฟิกโดยที่อินพุตและเอาต์พุตถูกประมวลผลที่แต่ละโหนดผ่านฟังก์ชั่นการเปิดใช้งานและส่วนใหญ่ใช้การไล่ระดับสีไล่ระดับ ดังนั้นคำถามจะกลายเป็นจริง: แบบจำลองใดบ้างที่สามารถแสดงเป็นแบบกราฟิกได้

ฉันไม่ใช่ผู้เชี่ยวชาญ แต่ฉันเชื่อว่าในทางทฤษฎีแล้ว ANN บางตัวสามารถแสดงให้เห็นว่าทัวริงสมบูรณ์ซึ่งหมายความว่าพวกเขาควรจะสามารถทำการคำนวณชุดใด ๆ ที่เป็นไปได้ (ด้วยจำนวนทรัพยากรที่เป็นไปได้ไม่ จำกัด

ฉันจะตีความคำถามของคุณด้วยวิธีต่อไปนี้:

สำหรับรุ่นใดก็ตามฉันสามารถตบแบบจำลอง ANN ร่วมกันเพื่อเลียนแบบโมเดลนั้นให้ใกล้เคียงที่สุดและในระยะเวลาที่เหมาะสมได้หรือไม่

โครงข่ายประสาทวานิลลาสามารถเลียนแบบต้นไม้ตัดสินใจโดยใช้การเปิดใช้งานขั้นตอนหนัก ๆ ปัญหาคือการเปิดใช้งานหน่วยดังกล่าวไม่มีการไล่ระดับสีดังนั้นการไล่ระดับสีตามปกติจะไม่ทำงาน คุณอาจพูดว่า "ไม่มีปัญหาเพียงแค่ใช้รูปแบบการไล่ระดับสีที่ปรับเปลี่ยนแล้ว" อย่างไรก็ตามนั่นยังไม่เพียงพอ เพื่อเป็นตัวอย่างที่ดีกว่าลองใช้ XGBOOST ซึ่งไม่ใช่แค่การไล่ระดับสีป่า มีงานพิเศษมากมายที่ต้องเลือกการแบ่งจุดการตัดการปรับให้เหมาะสมสำหรับความเร็ว ฯลฯ อาจมีการดัดแปลง ANN ที่คล้ายกันมากพอ แต่ก็ไม่ชัดเจนว่า ANN จะทำงานได้อย่างน้อย ดีและถ้ามันเหมาะที่จะทำงาน

(x)=อีx


2
ขอบคุณสำหรับคำตอบ! เกี่ยวกับคำถาม - "For any given model, can I slap together an ANN model to emulate that model, as close as possible, and in a reasonable amount of time?"ฉันกลัวที่จะบอกว่าไม่ใช่ประเด็น ประเด็นก็คือโทโพโลยีของ ANN นั้นโดยทั่วไปดูเหมือนจะครอบคลุมทุกอย่างและกลยุทธ์การปรับให้เหมาะสมดูเหมือนจะไม่สามารถระบุได้ว่าอะไรคืออะไรและไม่ใช่ ANN ดังนั้นคำถามที่กำหนด ANN คืออะไร เพราะมิฉะนั้นทุกอย่างจะมี ANN แสดงเป็นคำอื่น ๆ
Firebug

1
"A vanilla neural network can emulate a decision tree, by using heaviside step-activations. The problem is that such unit activations have zero gradient, so normal gradient descent won't work. You might say, "no problem, just use a modified form of gradient descent." However, that's still not enough. [...]"- ในขณะที่เราสามารถยืนยันได้การปรับให้เหมาะสมไม่ใช่ปัจจัยที่มีผลต่อคำจำกัดความของสิ่งที่ถือเป็น ANN หากคุณสามารถเขียนแผนผังการตัดสินใจทุกต้นเป็นเครือข่ายประสาท (และเราสามารถทำได้) จากนั้นเราสามารถพูดได้อย่างปลอดภัยว่า DT คือ (ประเภทของ) NN ในขณะที่การสนทนาไม่เป็นความจริง
Firebug

"If you want a basic definition of an ANN, you might say that it's a directed-graphical-model, where inputs and outputs are processed at each node via an activation function, and most of the time gradient descent is used to train it. So the question really becomes: what models out there can be expressed as graphical models?"- ฉันเห็นด้วยกับสิ่งนี้ จากนั้น "Neural Network" สามารถตีความได้ว่าเป็นรุ่นทั่วไปส่วนใหญ่บางทีอาจจะน้อยกว่า "Graph models" ซึ่งเป็น superset ของทั้ง Unirected และ Directed Graph Models บางทีคุณสามารถอธิบายเพิ่มเติมเกี่ยวกับเรื่องนี้;)
Firebug

2

บางทีชื่อที่แม่นยำยิ่งขึ้นสำหรับ ANNs ก็คือ "เครือข่ายที่แตกต่างกัน" ซึ่งก็คือฟังก์ชั่นที่ซับซ้อนที่สามารถปรับให้เหมาะสมโดยใช้การไล่ระดับสีหรือตัวแปร นี่เป็นคำจำกัดความทั่วไปที่เน้นความแตกต่าง แต่ไม่ได้บอกอะไรเกี่ยวกับความคิดหลักงานที่เหมาะสำหรับกรอบทางคณิตศาสตร์เป็นต้น

โปรดทราบว่าความแตกต่างนั้นเป็นลักษณะที่ไม่จำเป็นต้องมีหลัก ตัวอย่างเช่น SVM สามารถฝึกอบรมได้โดยใช้การไล่ระดับสีแบบไล่ระดับและแสดงคุณสมบัติของเครือข่ายประสาท / ความแตกต่าง แต่แนวคิดหลักคือการแยกข้อมูลโดยใช้ไฮเปอร์เพลน ตัวเข้ารหัสอัตโนมัติแบบหลายตัวแปรใช้ MLP สำหรับการเข้ารหัสและถอดรหัส แต่ฟังก์ชันที่คุณปรับให้เหมาะสมนั้นมาจากสถิติแบบเบย์และอื่น ๆ

นอกจากนี้ยังมีโมเดลสองสามแบบที่มักถูกเรียกว่าเครือข่ายประสาทเทียม แต่ไม่ได้ใช้ GD เพื่อการเรียนรู้ ตัวอย่างที่ดีคือ RBM ฉันเดาว่าฉลาก "โครงข่ายประสาทเทียม" ส่วนใหญ่จะถูกติดไว้ด้วยเหตุผลทางประวัติศาสตร์ - ในที่สุดผู้สร้าง RBM คือเจฟฟรีย์ฮินตันและฮินตันเป็นคนที่แต่งตัวประหลาดโครงข่ายประสาทใช่ไหม? อย่างไรก็ตามถ้าคุณวิเคราะห์แบบจำลองคุณจะเห็นว่าโครงสร้างของ RBM นั้นเป็นมาร์คอฟสุทธิฟังก์ชันต้นทุนที่ใช้พลังงานมาจากฟิสิกส์เชิงสถิติในช่วงต้นศตวรรษที่ 20 และการสุ่มตัวอย่าง MCMC / Gibbs ได้รับการพัฒนาแบบขนานและเป็นอิสระจากเครือข่ายประสาท .


2
การเรียนรู้ด้วยการไล่ระดับสีมีบทบาทสำคัญในความสำเร็จของ ANNs อย่างแน่นอน แต่ฉันไม่เห็นความแตกต่างว่าเป็นสิ่งจำเป็นสำหรับคำนิยามเพราะ ANN บางตัวไม่แตกต่างกัน ตัวอย่างเช่น ANN แรก (โมเดล McCulloch-Pitts) ใช้หน่วยขีด จำกัด ไบนารี หัวข้อการวิจัยในปัจจุบันคือวิธีการเรียนรู้ใน ANN ที่ไม่มีความแตกต่างเช่นอวนแบบกระจาย หรือสมมติว่าเราเริ่มต้นด้วย ANN แบบหาอนุพันธ์ได้ แต่จากนั้นประกาศว่าเราต้องการลดฟังก์ชันการสูญเสียที่ไม่สามารถแยกได้ มันไม่ใช่ ANN อีกต่อไปหรือ
user20160

นั่นเป็นเหตุผลที่ฉันเสนอคำนิยามทางเลือกที่ครอบคลุมฟีด - ฟาวด์, กำเริบ, เครือข่ายซ้ำ, วนซ้ำ, autoencoders, VAEs, GANs, ความสนใจและรุ่นอื่น ๆ อีกมากมายที่ปกติเราเรียกว่า "โครงข่ายประสาทเทียม" แต่ยกเว้นวิธีการอื่น ๆ หรือการสุ่มตัวอย่างที่ครอบคลุมมากกว่า PGM ตั้งแต่ปีพ. ศ. 2561 วิธีการเหล่านี้แตกต่างกันมากพวกเขาใช้วิธีการปรับให้เหมาะสมต่าง ๆ ห้องสมุดต่าง ๆ (แม้ว่าฉันจะนึกชื่อไม่ได้ดีกว่า "โครงข่ายประสาทเทียม" สำหรับ spiking nets เนื่องจากต่างจาก CNNs หรือ RNNs จริง ๆ สมอง).
แฟน

1

ฉันอาจลองอ้างถึงบางสิ่งที่ช่วยกำหนดโครงข่ายประสาทเทียม

  • กราฟการคำนวณที่มีพารามิเตอร์ที่ปรับได้
  • พารามิเตอร์ดังกล่าวสามารถปรับได้เพื่อให้สอดคล้องกับข้อมูล (จริงหรือจำลอง)
  • ฟังก์ชั่นวัตถุประสงค์ที่จะเพิ่มประสิทธิภาพมีส่วนเกี่ยวข้องโดยปริยายหรืออย่างชัดเจน สามารถเป็นพารามิเตอร์โกลบอลหรือโลคัล

ฉันค่อนข้างแน่ใจว่าสิ่งนี้ครอบคลุมเครือข่ายประสาททั้งหมดที่ใช้กันทั่วไปในวันนี้และบางอันที่ลึกลับ

มันไม่เชื่อเรื่องการปรับให้เหมาะสม (ถ้าเรากำหนดการเพิ่มประสิทธิภาพแบบไล่ระดับสีจากนั้นเครือข่ายที่พัฒนาแล้วจะไม่เป็นเครือข่ายประสาทเทียม)

มันไม่ได้พูดถึงเซลล์ประสาท / โหนดหรือเลเยอร์ (เครือข่ายประสาทบางวันนี้แทบจะไม่ได้รับการอธิบายโดยคำศัพท์เหล่านี้) แต่ฉันคิดว่าเราสามารถรวมสิ่งนั้นและเป็นข้อ จำกัด ได้อีกเล็กน้อย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.