นักวิทยาศาสตร์รู้หรือไม่ว่าเกิดอะไรขึ้นกับเครือข่ายประสาทเทียม?


69

นักวิทยาศาสตร์หรือผู้เชี่ยวชาญด้านการวิจัยทราบจากห้องครัวสิ่งที่เกิดขึ้นภายในเครือข่ายประสาทที่ "ลึก" ที่ซับซ้อนโดยมีการเชื่อมต่ออย่างน้อยหลายล้านจุดในทันที พวกเขาเข้าใจกระบวนการที่อยู่เบื้องหลังสิ่งนี้หรือไม่ (เช่นเกิดอะไรขึ้นภายในและมันทำงานอย่างไร) หรือเป็นประเด็นถกเถียง

ตัวอย่างเช่นการศึกษานี้พูดว่า:

แต่ไม่มีความเข้าใจที่ชัดเจนของเหตุผลที่พวกเขาดำเนินการให้ดีหรือวิธีการที่พวกเขาอาจจะดีขึ้น

ดังนั้นนี่หมายความว่านักวิทยาศาสตร์ไม่ทราบว่ารูปแบบเครือข่าย convolutional ที่ซับซ้อนทำงานอย่างไร


" ทำไมพวกเขาถึงทำงานได้ดีมาก " - พวกเขาทำงานได้ไม่ดีนัก เช่นเดียวกับเทคโนโลยีใหม่ส่วนใหญ่มีการรายงานความล้มเหลว
Tomáš Zato

คำตอบ:


51

มีวิธีการมากมายที่ทำให้เครือข่ายประสาทที่ผ่านการฝึกอบรมสามารถตีความได้มากขึ้นและน้อยลงเช่น "กล่องดำ" โดยเฉพาะเครือข่ายประสาทเทียมที่คุณพูดถึง

การแสดงการเปิดใช้งานและน้ำหนักของเลเยอร์

การเปิดใช้งานการสร้างภาพข้อมูลเป็นสิ่งแรกที่ชัดเจนและตรงไปตรงมา สำหรับเครือข่าย ReLU การเปิดใช้งานมักจะเริ่มต้นดูค่อนข้าง blobby และหนาแน่น แต่เมื่อการฝึกอบรมดำเนินการเปิดใช้งานมักจะเบาบางมากขึ้น (ค่าส่วนใหญ่เป็นศูนย์) และแปลเป็นภาษาท้องถิ่น บางครั้งสิ่งนี้แสดงให้เห็นว่าเลเยอร์ใดเน้นเฉพาะเมื่อเห็นภาพ

การทำงานที่ยอดเยี่ยมอีกประการเกี่ยวกับการเปิดใช้งานที่ฉันอยากพูดถึงคือdeepvisที่แสดงปฏิกิริยาของเซลล์ประสาททุกตัวในแต่ละชั้นรวมถึงการรวมกำไรและชั้นการทำให้เป็นมาตรฐาน นี่คือวิธีที่พวกเขาอธิบาย :

ในระยะสั้นเราได้รวบรวมวิธีการที่แตกต่างกันสองสามอย่างที่ช่วยให้คุณ "วิเคราะห์" สิ่งที่เซลล์ประสาทได้เรียนรู้ซึ่งจะช่วยให้คุณเข้าใจวิธีการทำงานของ DNN ได้ดียิ่งขึ้น

กลยุทธ์ทั่วไปที่สองคือการเห็นภาพน้ำหนัก (ตัวกรอง) สิ่งเหล่านี้มักจะตีความได้มากที่สุดในชั้น CONV แรกซึ่งดูโดยตรงที่ข้อมูลพิกเซลแบบดิบ แต่ก็เป็นไปได้ที่จะแสดงน้ำหนักตัวกรองที่ลึกลงไปในเครือข่าย ตัวอย่างเช่นชั้นแรกมักจะเรียนรู้ตัวกรองแบบ gabor ที่ตรวจจับขอบและ blobs

ตัวกรองชั้นแรก

การทดลองบดเคี้ยว

นี่คือความคิด สมมติว่า ConvNet จำแนกรูปภาพเป็นสุนัข เราจะมั่นใจได้อย่างไรว่ามันเป็นจริงขึ้นมาบนสุนัขในภาพเมื่อเทียบกับความหมายตามบริบทบางอย่างจากพื้นหลังหรือวัตถุเบ็ดเตล็ดอื่น ๆ ?

วิธีหนึ่งในการตรวจสอบว่าส่วนใดของภาพที่การคาดคะเนการจำแนกประเภทนั้นมาจากการวางแผนความน่าจะเป็นของคลาสที่น่าสนใจ (เช่นคลาสสุนัข) เป็นฟังก์ชันของตำแหน่งของวัตถุบดเคี้ยว หากเราวนซ้ำของภูมิภาคของภาพแทนที่ด้วยศูนย์ทั้งหมดและตรวจสอบผลการจัดหมวดหมู่เราสามารถสร้างแผนที่ความร้อนแบบสองมิติของสิ่งที่สำคัญที่สุดสำหรับเครือข่ายในภาพโดยเฉพาะ วิธีการนี้ใช้ในการสร้างภาพและทำความเข้าใจกับเครือข่าย Convolutional ของ Matthew Zeiler (ซึ่งคุณอ้างถึงในคำถามของคุณ):

การทดลองบดเคี้ยว

deconvolution

อีกวิธีหนึ่งคือการสังเคราะห์ภาพที่ทำให้เกิดเซลล์ประสาทโดยเฉพาะอย่างยิ่งการยิงโดยทั่วไปสิ่งที่เซลล์ประสาทกำลังมองหา ความคิดคือการคำนวณการไล่ระดับสีด้วยความเคารพต่อภาพแทนการไล่ระดับสีตามปกติด้วยความเคารพต่อน้ำหนัก ดังนั้นคุณเลือกเลเยอร์ตั้งค่าการไล่ระดับสีให้เป็นศูนย์ทั้งหมดยกเว้นหนึ่งเลเยอร์สำหรับหนึ่งเซลล์ประสาทและ backprop เป็นภาพ

Deconv ทำอะไรบางอย่างที่เรียกว่าbackpropagation แบบมีนำทางเพื่อสร้างภาพที่ดูดีขึ้น

วิธีการที่คล้ายกับเครือข่ายประสาทอื่น ๆ

ขอแนะนำโพสต์นี้โดย Andrej Karpathyซึ่งเขาเล่นบ่อยๆกับ Recurrent Neural Networks (RNN) ในท้ายที่สุดเขาใช้เทคนิคที่คล้ายกันเพื่อดูว่าเซลล์ประสาทเรียนรู้จริง:

เซลล์ประสาทที่เน้นสีในภาพนี้ดูเหมือนจะตื่นเต้นมากเกี่ยวกับ URL และปิดนอก URL LSTM มีแนวโน้มที่จะใช้เซลล์ประสาทนี้เพื่อจดจำว่ามันอยู่ใน URL หรือไม่

ข้อสรุป

ฉันได้กล่าวถึงเพียงเล็กน้อยของผลการวิจัยในพื้นที่นี้ มันใช้งานได้ดีและมีวิธีการใหม่ ๆ ที่ทำให้เกิดผลงานภายในโครงข่ายประสาทในแต่ละปี

เพื่อตอบคำถามของคุณมีบางสิ่งที่นักวิทยาศาสตร์ยังไม่รู้อยู่เสมอ แต่ในหลาย ๆ กรณีพวกเขามีภาพที่ดี (วรรณกรรม) เกี่ยวกับสิ่งที่เกิดขึ้นภายในและสามารถตอบคำถามได้มากมาย

ให้ฉันอ้างจากคำถามของคุณเพียงแค่เน้นความสำคัญของการวิจัยของการปรับปรุงความถูกต้องไม่เพียง แต่โครงสร้างภายในของเครือข่ายเช่นกัน ดังที่ Matt Zieler บอกในการสนทนาครั้งนี้บางครั้งการสร้างภาพข้อมูลที่ดีสามารถนำไปสู่ความแม่นยำที่ดีขึ้น


การมองเห็นภาพรู้หรือไม่? หรือว่าเป็นเพียงวิธีการที่ทันสมัยในการไม่รู้? บางทีการพัฒนาทางคณิตศาสตร์เป็นพื้นที่ที่ขาดความเข้มงวดและพอเพียง
FauChristian

1
@FauChristian คุณหายไปจากจุดที่นี่ น้ำหนักและการคำนวณทางคณิตศาสตร์ทั้งหมดภายในเครือข่ายนิวรัลนั้นเป็นที่รู้จักกันดีเหมือนกับรหัสการประกอบ นี่เป็นคำถาม การสร้างภาพช่วยให้เข้าใจว่าทำไม ops บางอย่างเกิดขึ้นและนำไปสู่ประสิทธิภาพที่ดี อีกครั้งเช่นเดียวกับอัลกอริทึมวิทยาศาสตร์คอมพิวเตอร์คลาสสิก นอกจากนี้ฉันขอแนะนำให้คุณอ่านบทความโดย Zieler ที่ al ที่กล่าวถึงในคำตอบ
Maxim

1
ฉันไม่ได้พลาดประเด็นเหล่านั้นเพราะเรียนเป็นปริญญาตรี ฉันขี้เกียจในความคิดเห็นของฉันแม้ว่า ตาราง b & w ที่เป็นตัวแทนของเมล็ดมีความน่าสนใจเฉพาะเมื่อมันแสดงเมทริกซ์ที่ค่อนข้างยุ่งเหยิงของสถานะเคอร์เนลการตรวจจับขอบหยัก การกระจายขนาดการกระจายเชิงมุมและการกระจายแบบเบ้คืออะไร ทำการกระจายเหล่านี้บ่งชี้ (a) over-fit เฉพาะกับชุดข้อมูลบางอย่างหรือ (b) รูปแบบทั่วไปที่สามารถแทนที่ด้วยบล็อกการทำงานที่มีประสิทธิภาพการคำนวณมากขึ้น ~~ เมื่อไม่สามารถบอกได้จากภาพ
FauChristian

1
ใช่การแจกแจงทั้งหมดเหล่านี้ (และอื่น ๆ อีกมากมาย) ไม่ได้ถูกคำนวณที่นี่ ไม่ได้หมายความว่าพวกเขาไม่สามารถหรือไม่ควรคำนวณ ไม่ได้หมายความว่าการตีความแบบจำลองไม่เกี่ยวข้องกับการสร้างภาพข้อมูล ฉันขอแนะนำให้คุณอ่าน "การสร้างภาพและการทำความเข้าใจกับเครือข่าย Convolutional" โดย Zieler ที่ al ซึ่งผู้เขียนได้กล่าวถึงในรายละเอียด
Maxim

เรามีสิ่งนั้นในห้องแล็บ ผู้ร่วมงานของฉันวิ่งผ่านตัวอย่างรหัสบางส่วน ฉันจะดูจากด้านสถิติ ขอบคุณ.
FauChristian

27

ขึ้นอยู่กับสิ่งที่คุณหมายถึงโดย "รู้ว่าเกิดอะไรขึ้น"

1/1+e1/1+e

อย่างไรก็ตามถ้าโดย 'รู้' คุณหมายถึงการทำนายผลลัพธ์ของ ANN ที่เฉพาะเจาะจง (กล่องดำ)โดยวิธีอื่นอุปสรรคก็คือการปรากฏตัวของความโกลาหลใน ANN ที่มีระดับความเป็นอิสระสูง

ที่นี่ยังมีบางงานที่ค่อนข้างล่าสุดโดยฮอดลิปสันในการทำความเข้าใจ ANNs ผ่าน การสร้างภาพ


13

ตอบสั้น ๆ คือไม่มี

การตีความแบบจำลองเป็นพื้นที่ที่มีการใช้งานมากเกินไปและร้อนแรงมากในการวิจัยปัจจุบัน (คิดว่าโฮลี่เกรลหรือบางอย่าง) ซึ่งได้รับการยกมาไม่นานเนื่องจากความสำเร็จของการเรียนรู้แบบลึกในงานต่างๆ ปัจจุบันโมเดลเหล่านี้เป็นเพียงกล่องดำและเรารู้สึกไม่สะดวกใจกับมัน ...

นี่คือแหล่งข้อมูลทั่วไป (และล่าสุด ณ เดือนธันวาคม 2017) ในหัวข้อ:

และในระดับปฏิบัติมากขึ้น (รหัส ฯลฯ ):

เมื่อไม่นานมานี้มีความสนใจที่จะเริ่มสร้างพื้นฐานทางทฤษฎีสำหรับการเรียนรู้โครงข่ายประสาท ในบริบทนี้ David Donoho ผู้บุกเบิกทางสถิติที่มีชื่อเสียงและผู้มีประสบการณ์ด้านการกดอัดนั้นเพิ่งเริ่มเปิดสอนหลักสูตรที่ Stanford ทฤษฎีการเรียนรู้ลึก (STATS 385)โดยมีเนื้อหาเกือบทั้งหมดออนไลน์ แนะนำเป็นอย่างยิ่ง ...

อัปเดต :


สวัสดี ดูเหมือนว่าจะเป็นคำตอบที่ดี แต่คุณต้องทำความสะอาดและจัดระเบียบเล็กน้อย ทรัพยากรแรกควรเป็นประโยชน์และทั่วไปมากที่สุด จากนั้นคุณสามารถแสดงรายการทรัพยากรเฉพาะและรายงานการวิจัยได้มากขึ้น IMHO และหลังจากนั้นคุณสามารถแสดงรายการเช่นกระทู้ Twitter หรืออะไรก็ได้
nbro

10

ไม่แน่ใจว่านี่คือสิ่งที่คุณกำลังค้นหาหรือไม่ แต่ Google แตกรูปภาพจากเครือข่ายเมื่อถูกป้อนด้วยสัญญาณรบกวนสีขาว

ดูInceptionism: Going ลึกลงไปในโครงข่ายประสาทเทียม (บล็อก Google Research)

ประเภทนี้แสดงให้เห็นถึงสิ่งที่เครือข่ายรู้


8

ฉันกลัวว่าฉันไม่มีการอ้างอิงเฉพาะที่มีประโยชน์ แต่ฉันเคยเห็น / ได้ยินคำพูดจากผู้เชี่ยวชาญเช่น Andrew Ng และ Geoffrey Hinton ที่พวกเขาพูดอย่างชัดเจนว่าเราไม่เข้าใจเครือข่ายประสาท นั่นก็คือเราเข้าใจบางสิ่งบางอย่างของวิธีการที่พวกเขาทำงาน (เช่นคณิตศาสตร์ที่อยู่เบื้องหลังการขยายพันธุ์หลัง) แต่เราไม่เข้าใจจริงๆว่าทำไมพวกเขาทำงาน มันเป็นความแตกต่างที่ละเอียดอ่อน แต่ประเด็นก็คือไม่เราไม่เข้าใจรายละเอียดที่ลึกที่สุดว่าคุณไปจากน้ำหนักที่มากไปจนถึงการพูดการจดจำแมวที่เล่นกับลูกบอล

อย่างน้อยในแง่ของการรับรู้ภาพคำอธิบายที่ดีที่สุดที่ฉันเคยได้ยินคือเลเยอร์ต่อเนื่องของเครือข่ายประสาทเทียมเรียนรู้คุณสมบัติที่ซับซ้อนมากขึ้นประกอบด้วยคุณลักษณะที่ละเอียดยิ่งขึ้นจากระดับก่อนหน้านี้ กล่าวคือเลเยอร์แรกอาจรู้จัก "เส้นขอบ" หรือ "เส้นตรง" เลเยอร์ถัดไปอาจเรียนรู้รูปทรงเรขาคณิตเช่น "กล่อง" หรือ "สามเหลี่ยม" จากนั้นเลเยอร์ที่สูงขึ้นอาจเรียนรู้ "จมูก" หรือ "ตา" ตามคุณสมบัติก่อนหน้านี้จากนั้นเลเยอร์ที่สูงขึ้นยังเรียนรู้ "ใบหน้า" ขึ้นจาก "ตา", "จมูก", "ขากรรไกร" ฯลฯ แต่ถึงอย่างนั้นฉันก็ยังเข้าใจว่ามันเป็นสมมุติฐานและ / หรือไม่เข้าใจในรายละเอียดที่สมบูรณ์


2
ฉันสนใจที่จะอ่านคำพูดที่เกิดขึ้นจริง ในระดับแนวคิดที่กว้างที่สุดเหตุใดจึงเป็น "พวกมันเป็นตัวประมาณฟังก์ชั่นสากลที่ได้รับการฝึกฝนเพื่อลดข้อผิดพลาดในปัญหาการถดถอย"
NietzscheanAI

ฉันจะดูว่าฉันสามารถติดตามพวกเขาลง ฉันค่อนข้างมั่นใจว่าข้อความจากเจฟฟรีย์ฮินตันที่ฉันคิดว่าเป็นในวิดีโอ .. ทั้งจากหลักสูตร Coursera หรือวิดีโอที่เขามีบน Youtube หากฉันสามารถค้นหาได้ฉันจะแก้ไขคำตอบของฉันและเชื่อมโยงเข้า
mindcrime

ฉันยังไม่ลืม ฉันจะพยายามหาพวกเขาเมื่อฉันมีเวลาว่าง ฉันคิดว่าอย่างน้อยหนึ่งในสิ่งที่ฉันคิดว่ามาจากวิดีโอที่เป็นส่วนหนึ่งของหลักสูตร Coursera
mindcrime

การศึกษานี้สามารถช่วยในการอ้างอิงเดียวกัน: 'อย่างไรก็ตามไม่มีความเข้าใจที่ชัดเจนว่าทำไมพวกเขาถึงทำงานได้ดีหรืออาจปรับปรุงได้อย่างไร'
kenorb

4

นี่คือคำตอบโดย Carlos E. Perez กับคำถามอะไรคือทฤษฎีที่อยู่เบื้องหลังการเรียนรู้อย่างลึกซึ้ง?

[ ... ]

คณิตศาสตร์พื้นฐานของการเรียนรู้เชิงลึกมีอยู่เป็นเวลาหลายสิบปี แต่ผลลัพธ์ที่น่าประทับใจที่เราเห็นในวันนี้เป็นส่วนหนึ่งของฮาร์ดแวร์ที่เร็วกว่ามากข้อมูลและการปรับปรุงที่เพิ่มขึ้นในวิธีการต่างๆ

การเรียนรู้แบบลึกโดยทั่วไปสามารถกำหนดกรอบเป็นปัญหาการเพิ่มประสิทธิภาพที่วัตถุประสงค์เป็นหน้าที่ของข้อผิดพลาดของแบบจำลอง ปัญหาการปรับให้เหมาะสมนี้เป็นเรื่องยากมากที่จะแก้ปัญหาพิจารณาว่าพื้นที่พารามิเตอร์ของแบบจำลอง (เช่นน้ำหนักของเครือข่ายประสาท) นำไปสู่ปัญหาในมิติที่สูงมาก อัลกอริทึมการปรับให้เหมาะสมอาจใช้เวลานานมากในการสำรวจพื้นที่นี้ นอกจากนี้ยังมีความเชื่อที่ไม่สามารถตรวจสอบได้ว่าปัญหานั้นไม่ได้มีการนูนและการคำนวณจะติดอยู่ใน minima ท้องถิ่นตลอดไป

[ ... ]

ทฤษฏีว่าทำไมเครื่องจักรมาบรรจบกันกับตัวดึงดูดหรือกล่าวอีกนัยหนึ่งว่าเรียนรู้ที่จะรู้จักรูปแบบที่ซับซ้อนยังไม่เป็นที่รู้จัก

สรุปแล้วเรามีความคิดบางอย่าง แต่เรายังไม่แน่ใจ


3

นักวิทยาศาสตร์รู้หรือไม่ว่าเกิดอะไรขึ้นกับเครือข่ายประสาทเทียม?

ใช่

นักวิทยาศาสตร์หรือผู้เชี่ยวชาญด้านการวิจัยทราบจากห้องครัวสิ่งที่เกิดขึ้นภายในเครือข่ายประสาทที่ "ลึก" ที่ซับซ้อนโดยมีการเชื่อมต่ออย่างน้อยหลายล้านจุดในทันที

ฉันเดา "รู้จากครัว" หมายถึง "รู้รายละเอียด" หรือไม่?

ผมขอให้คุณเปรียบเทียบชุด:

  1. วิศวกรเครื่องบินทราบจากห้องครัวว่าเกิดอะไรขึ้นภายในเครื่องบินหรือไม่
  2. ผู้ออกแบบชิปทราบรายละเอียดว่าเกิดอะไรขึ้นกับชิปที่เขาออกแบบ
  3. วิศวกรโยธารู้ทุกอย่างเกี่ยวกับบ้านที่เขาสร้างหรือไม่?

ปีศาจอยู่ในรายละเอียด แต่จุดสำคัญที่นี่คือมันเกี่ยวกับโครงสร้างเทียม จะไม่ปรากฏแบบสุ่ม คุณต้องการความรู้มากมายเพื่อให้ได้สิ่งที่มีประโยชน์ สำหรับเครือข่ายประสาทฉันจะบอกว่าใช้เวลาประมาณ 40 ปีนับจากการตีพิมพ์แนวคิดสำคัญ (Rosenblatt perceptron, 1957) ไปยังแอปพลิเคชันแรก (US Postal Service, 1989) และจากที่นั่นอีก 13 ปีของการใช้งาน reserach ไปยังระบบที่น่าประทับใจจริงๆ (ImageNet 2012)

สิ่งที่เรารู้ดีสุดคือวิธีการทำงานของการฝึกอบรม เพราะมันจะต้องมีการดำเนินการ ดังนั้นในโครงสร้างที่เล็กมากเรารู้ในรายละเอียด

นึกถึงคอมพิวเตอร์ นักออกแบบชิปรู้ดีว่าชิปทำงานอย่างไร แต่พวกเขาจะมีความคิดคร่าวๆว่าระบบปฏิบัติการ Linux ทำงานอย่างไร

อีกตัวอย่างหนึ่งคือฟิสิกส์และเคมี: ฟิสิกส์อธิบายถึงแกนกลางของจักรวาล นั่นหมายความว่าพวกเขารู้ทุกอย่างเกี่ยวกับเคมีเช่นกัน? ไม่มีทาง! นักฟิสิกส์ "สมบูรณ์แบบ" สามารถอธิบายทุกอย่างในวิชาเคมีได้ แต่มันก็ไร้ประโยชน์ เขาต้องการข้อมูลมากขึ้นไม่สามารถข้ามส่วนที่ไม่เกี่ยวข้องได้ เพียงเพราะเขา "ซูมเข้า" มากเกินไป - พิจารณารายละเอียดซึ่งในทางปฏิบัติไม่น่าสนใจหรือสำคัญ โปรดทราบว่าความรู้ของนักฟิสิกส์นั้นไม่ผิด บางทีอาจจะสามารถอนุมานความรู้จากนักเคมีจากมันได้ แต่ความเข้าใจ "ระดับสูง" นี้เกี่ยวกับการมีปฏิสัมพันธ์ของโมเลกุลหายไป

ความเข้าใจที่สำคัญจากทั้งสองตัวอย่างชั้นนามธรรม: คุณสามารถสร้างความซับซ้อนจากโครงสร้างที่เรียบง่าย

มีอะไรอีกบ้าง?

เรารู้ดีว่าอะไรคือหลักการที่สามารถทำได้กับโครงข่ายประสาทเทียมที่เราออกแบบ:

  • เครือข่ายประสาทเทียมที่ออกแบบมาเพื่อเล่นโก - ไม่ว่าจะซับซ้อนเพียงใด - จะไม่สามารถเล่นหมากรุกได้อีกด้วย แน่นอนคุณสามารถเพิ่มเลเยอร์สิ่งที่เป็นนามธรรมรอบ ๆ มันและรวมสิ่งต่างๆเข้าด้วยกัน แต่วิธีนี้ต้องการมนุษย์
  • โครงข่ายประสาทเทียมที่ออกแบบมาสำหรับสุนัขที่แยกความแตกต่างจากแมวที่มีเพียง pudels และแมวเปอร์เซียมีแนวโน้มที่จะทำงานได้ไม่ดีเมื่อต้องตัดสินใจสำหรับ Yorkshire Terriers

โอ้และแน่นอนเรามีวิธีการวิเคราะห์สำหรับโครงข่ายประสาทเทียม ผมเขียนวิทยานิพนธ์ปริญญาโทของฉันเกี่ยวกับการวิเคราะห์และการเพิ่มประสิทธิภาพของโครงข่ายประสาทเทียม Convolutional สถาปัตยกรรม ในบริบทนี้LIME (คำอธิบายแบบจำลอง - ผู้ไม่เชื่อเรื่องพระเจ้าในท้องที่) เป็นสิ่งที่ดี:

ป้อนคำอธิบายรูปภาพที่นี่


1
ส่วนใหญ่ของพวกเขาได้รับอิทธิพลจากแบบจำลองทางชีวภาพ .. บอกว่านักวิทยาศาสตร์สร้าง NN ของเป็นปัญหาเป็นเรื่องยากที่จะเชื่อ ... โดยเฉพาะอย่างยิ่งเมื่อไม่มีใครมีความคิดว่าทำไมสถาปัตยกรรมเฉพาะหรือชุดของพารามิเตอร์ที่ใช้งานได้ดี ปัญหาที่ได้รับ ... ฉันไม่ได้พูดถึงพารามิเตอร์ที่แน่นอน แต่ดูเหมือนว่าจะไม่มีความรู้สึกทั่วไปเกี่ยวกับว่าพารามิเตอร์ใดที่สามารถใช้งานได้โดยประมาณสำหรับปัญหาที่กำหนด (ปัญหาได้รับการกำหนดไว้อย่างดี) .. ดังนั้นไม่มีนักวิทยาศาสตร์ NN
DuttaA

นึกถึงวิศวกรรถยนต์ / เครื่องบินในช่วงต้น คุณจะบอกว่าพวกเขาไม่รู้ว่าเกิดอะไรขึ้นภายในเครื่องบิน / รถยนต์ของพวกเขาเพราะพวกเขาไม่ได้สร้างพวกเขาเพราะรูปร่างของพวกเขาไม่ใช่อากาศพลศาสตร์?
Martin Thoma

1
Ofc ... ไม่รู้อะไรเนื่องจากขาดเทคโนโลยี ... เป็นสิ่งที่แตกต่างจากที่ไม่รู้ทฤษฎี .. ฉันเชื่อว่ามันเป็นเทคโนโลยีในกรณีเครื่องบิน .. ในขณะที่ที่นี่เราไม่สามารถประมวลผลทางคณิตศาสตร์ .. ลืมเทคโนโลยี
DuttaA

1

ฉันแค่อยากจะเพิ่มบางสิ่ง:

มันขึ้นอยู่กับสิ่งที่คุณหมายถึงโดยนักวิทยาศาสตร์:

ฉันเป็นนักศึกษาปริญญาเอกสาขาวิศวกรรมไฟฟ้าและฉันเห็นนักวิจัยจำนวนมากทำงานกับ ANN ในปัญหาเช่นการถดถอยการควบคุมการทำนายการควบคุมแบบปรับตัวและปัญหาการจำแนก

คุณสามารถสังเกตเห็นได้ชัดเจนว่าพวกเขาขาดทักษะการเขียนโค้ดเป็นข้อเสียเปรียบครั้งใหญ่และพวกเขาไม่เข้าใจจริงๆว่าเกิดอะไรขึ้นใน ANN ตอนนี้ฉันไม่ได้พูดถึงDeepพวกเขาต่อสู้ทำความเข้าใจกับสิ่งง่าย ๆ เช่น ADALINE และ ANFIS! ทั้งหมดที่คุณได้ยินพวกเขาพูดคือ: ให้ข้อมูลและมันจะปรับตัว!


1
แม้ว่าคุณจะมีแนวความคิดที่ถูกต้อง แต่คุณสามารถได้รับคะแนนโหวตบางส่วนและอาจเป็นประโยชน์ในเชิงสร้างสรรค์หากคุณเขียนคำตอบของคุณใหม่เพื่อเป็นการสังเกตการณ์ทางสังคมวิทยาแทนที่จะเป็นคำด่าแบบอวดรู้
FauChristian
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.