ปัญญาประดิษฐ์ deep-learning

8

นักวิทยาศาสตร์รู้หรือไม่ว่าเกิดอะไรขึ้นกับเครือข่ายประสาทเทียม?

นักวิทยาศาสตร์หรือผู้เชี่ยวชาญด้านการวิจัยทราบจากห้องครัวสิ่งที่เกิดขึ้นภายในเครือข่ายประสาทที่ "ลึก" ที่ซับซ้อนโดยมีการเชื่อมต่ออย่างน้อยหลายล้านจุดในทันที พวกเขาเข้าใจกระบวนการที่อยู่เบื้องหลังสิ่งนี้หรือไม่ (เช่นเกิดอะไรขึ้นภายในและมันทำงานอย่างไร) หรือเป็นประเด็นถกเถียง ตัวอย่างเช่นการศึกษานี้พูดว่า: แต่ไม่มีความเข้าใจที่ชัดเจนของเหตุผลที่พวกเขาดำเนินการให้ดีหรือวิธีการที่พวกเขาอาจจะดีขึ้น ดังนั้นนี่หมายความว่านักวิทยาศาสตร์ไม่ทราบว่ารูปแบบเครือข่าย convolutional ที่ซับซ้อนทำงานอย่างไร

69 neural-networks deep-learning convolutional-neural-networks explainable-ai

3

เครือข่ายประสาทสามารถจัดการกับขนาดอินพุตที่แตกต่างกันอย่างไร

เท่าที่ฉันจะบอกได้เครือข่ายประสาทมีจำนวนเซลล์ประสาทคงที่ในชั้นข้อมูลเข้า หากใช้โครงข่ายประสาทในบริบทเช่น NLP ประโยคหรือบล็อกข้อความที่มีขนาดแตกต่างกันจะถูกป้อนเข้าเครือข่าย ขนาดอินพุตที่แตกต่างกันอย่างไรจะกระทบยอดกับขนาดคงที่ของเลเยอร์อินพุตของเครือข่าย กล่าวอีกนัยหนึ่งเครือข่ายเช่นนี้มีความยืดหยุ่นเพียงพอที่จะจัดการกับอินพุตที่อาจอยู่ที่ใดก็ได้ตั้งแต่หนึ่งคำไปจนถึงหลายหน้าของข้อความ หากสมมติฐานของฉันเกี่ยวกับจำนวนเซลล์ประสาทนำเข้าที่กำหนดไม่ถูกต้องและมีการเพิ่มเซลล์ประสาทขาเข้าใหม่เข้า / ออกจากเครือข่ายเพื่อให้ตรงกับขนาดอินพุตฉันไม่เห็นว่าจะสามารถฝึกอบรมสิ่งเหล่านี้ได้อย่างไร ฉันยกตัวอย่าง NLP แต่ปัญหามากมายมีขนาดอินพุตที่คาดเดาไม่ได้ ฉันสนใจวิธีการทั่วไปในการจัดการกับสิ่งนี้ สำหรับรูปภาพมันชัดเจนว่าคุณสามารถขึ้น / ลงตัวอย่างเป็นขนาดคงที่ แต่สำหรับข้อความดูเหมือนว่าจะเป็นวิธีที่เป็นไปไม่ได้เนื่องจากการเพิ่ม / ลบข้อความเปลี่ยนความหมายของอินพุตต้นฉบับ

42 neural-networks machine-learning deep-learning convolutional-neural-networks natural-language-processing

21

คอมพิวเตอร์ดิจิทัลสามารถเข้าใจถึงความไม่สิ้นสุดได้หรือไม่?

ในฐานะมนุษย์เราสามารถคิดได้อย่างไม่มีที่สิ้นสุด โดยหลักการแล้วหากเรามีทรัพยากรเพียงพอ (เวลา ฯลฯ ) เราสามารถนับหลายสิ่งได้อย่างมากมาย (รวมถึงนามธรรมเช่นหมายเลขหรือของจริง) ตัวอย่างเช่นอย่างน้อยเราสามารถพิจารณาจำนวนเต็มของบัญชี เราสามารถคิดว่าเป็นหลักและ "เข้าใจ" จำนวนมากมายที่แสดงบนหน้าจอ ทุกวันนี้เราพยายามออกแบบปัญญาประดิษฐ์ที่มีความสามารถอย่างน้อยมนุษย์ อย่างไรก็ตามฉันติดอยู่กับอินฟินิตี้ ฉันพยายามหาวิธีที่จะสอนรูปแบบ (ลึกหรือไม่) เพื่อทำความเข้าใจกับอินฟินิตี้ ฉันกำหนด "ความเข้าใจ" ในแนวทางการใช้งานตัวอย่างเช่นหากคอมพิวเตอร์สามารถแยกความแตกต่างของตัวเลขหรือสิ่งต่าง ๆ ได้ 10 อย่างก็หมายความว่ามันเข้าใจสิ่งต่าง ๆ เหล่านี้จริง ๆ นี่คือวิธีการตรงไปตรงมาขั้นพื้นฐานเพื่อ ดังที่ฉันได้กล่าวไปแล้วมนุษย์เข้าใจถึงอนันต์เพราะอย่างน้อยพวกมันก็สามารถนับจำนวนเต็มได้ จากมุมมองนี้ถ้าฉันต้องการสร้างแบบจำลองจริง ๆ แล้วเป็นฟังก์ชั่นในแง่นามธรรมรูปแบบนี้จะต้องแยกความแตกต่างจำนวนมากมาย เนื่องจากคอมพิวเตอร์เป็นเครื่องดิจิตอลที่มีขีดความสามารถ จำกัด ในการจำลองฟังก์ชันที่ไม่มีที่สิ้นสุดฉันจะสร้างแบบจำลองที่สร้างความแตกต่างของจำนวนเต็มจำนวนอนันต์ได้อย่างไร? ตัวอย่างเช่นเราสามารถใช้โมเดลการมองเห็นในการเรียนรู้เชิงลึกที่จดจำตัวเลขบนการ์ด รุ่นนี้จะต้องกำหนดหมายเลขให้กับบัตรแต่ละใบเพื่อแยกความแตกต่างของจำนวนเต็ม เนื่องจากมีจำนวนเต็มจำนวนอนันต์โมเดลจะกำหนดจำนวนที่แตกต่างกันให้กับแต่ละจำนวนเต็มเช่นมนุษย์บนคอมพิวเตอร์ดิจิทัลได้อย่างไร หากมันไม่สามารถแยกแยะสิ่งที่ไม่มีที่สิ้นสุดมันจะเข้าใจความไม่สิ้นสุดได้อย่างไร ถ้าฉันคำนึงถึงจำนวนจริงปัญหาจะยากขึ้นมาก อะไรคือจุดที่ฉันขาดหายไป มีทรัพยากรใดบ้างที่มุ่งเน้นที่เรื่องหรือไม่

39 deep-learning philosophy agi

1

ห้องสมุดใดที่คุณอยากแนะนำให้เริ่มต้นด้วยการเรียนรู้อย่างลึกซึ้ง

คุณต้องการแนะนำห้องสมุด (TensorFlow หรือ Keras) สำหรับแนวทางแรกในการเรียนรู้อย่างลึกซึ้ง ฉันเป็นนักเรียนประสาทวิทยาศาสตร์ที่พยายามเป็นครั้งแรกในวิธีการคำนวณถ้าเรื่องนั้นสำคัญ

35 deep-learning tensorflow keras getting-started software-evaluation

3

เหตุใด Lisp จึงเป็นภาษาที่ดีสำหรับ AI

ฉันเคยได้ยินมาก่อนจากนักวิทยาศาสตร์คอมพิวเตอร์และนักวิจัยในพื้นที่ของ AI ว่า Lisp เป็นภาษาที่ดีสำหรับการวิจัยและพัฒนาปัญญาประดิษฐ์ สิ่งนี้ยังใช้ได้หรือไม่กับการเพิ่มจำนวนของโครงข่ายประสาทและการเรียนรู้ที่ลึก อะไรคือเหตุผลของพวกเขาสำหรับเรื่องนี้? ระบบการเรียนรู้แบบลึกในปัจจุบันมีภาษาอะไรในปัจจุบัน

30 neural-networks machine-learning deep-learning research programming-languages

8

ใน CNN ตัวกรองใหม่แต่ละตัวมีน้ำหนักแตกต่างกันสำหรับแต่ละช่องสัญญาณหรือมีน้ำหนักเท่ากันของตัวกรองแต่ละตัวที่ใช้ในช่องสัญญาณอินพุตหรือไม่

ความเข้าใจของฉันคือชั้นของเครือข่ายประสาทเทียมแบบ Convolutional มีสี่มิติคือ input_channels, filter_height, filter_width, number_of_filters ยิ่งไปกว่านั้นฉันเข้าใจว่าตัวกรองใหม่แต่ละตัวมีความซับซ้อนมากกว่า input_channels ทั้งหมด (หรือคุณสมบัติ / แผนที่เปิดใช้งานจากเลเยอร์ก่อนหน้า) อย่างไรก็ตามกราฟิกด้านล่างจาก CS231 จะแสดงตัวกรองแต่ละตัว (สีแดง) ที่ใช้กับช่องเดี่ยวแทนที่จะใช้ตัวกรองเดียวกันที่ใช้ข้ามช่องสัญญาณ ดูเหมือนว่านี่จะบ่งบอกว่ามีตัวกรองแยกต่างหากสำหรับช่อง EACH (ในกรณีนี้ฉันสมมติว่าเป็นช่องสามสีของภาพที่ป้อน แต่สิ่งเดียวกันจะใช้กับช่องสัญญาณทั้งหมด) นี่คือความสับสน - มีตัวกรองที่ไม่ซ้ำกันที่แตกต่างกันสำหรับแต่ละช่องสัญญาณเข้าหรือไม่? ที่มา: http://cs231n.github.io/convolutional-networks/ ภาพด้านบนดูเหมือนจะขัดแย้งกับข้อความที่ตัดตอนมาจาก"พื้นฐานการเรียนรู้ลึก"ของ O'reilly : "... ตัวกรองไม่เพียงทำงานบนแผนที่คุณลักษณะเดียวเท่านั้นพวกเขาทำงานบนไดรฟ์ข้อมูลแผนที่ทั้งหมดที่สร้างขึ้นในเลเยอร์เฉพาะ ... ด้วยเหตุนี้คุณสมบัติแผนที่จะต้องสามารถทำงานได้มากกว่าโวลุ่ม ไม่ใช่แค่พื้นที่ " ... นอกจากนี้มันเป็นความเข้าใจของฉันที่ภาพด้านล่างนี้แสดงให้เห็นว่าตัวกรองTHE SAMEนั้นได้รับการโน้มน้าวใจเหนือช่องสัญญาณอินพุตทั้งสาม (ขัดแย้งกับสิ่งที่แสดงในกราฟิก CS231 ด้านบน):

28 deep-learning convolutional-neural-networks image-recognition

9

ปัญญาประดิษฐ์มีความเสี่ยงต่อการแฮ็กหรือไม่

กระดาษข้อ จำกัด ของการเรียนรู้อย่างลึกล้ำในการตั้งค่าของฝ่ายตรงข้ามสำรวจว่าเครือข่ายประสาทอาจเสียหายโดยผู้โจมตีที่สามารถจัดการชุดข้อมูลที่เครือข่ายประสาทเทียมฝึกอบรมได้ การทดลองของผู้เขียนกับโครงข่ายประสาทเทียมนั้นหมายถึงการอ่านตัวเลขที่เขียนด้วยลายมือเพื่อบ่อนทำลายความสามารถในการอ่านโดยการบิดเบือนตัวอย่างของตัวเลขที่เขียนด้วยลายมือที่เครือข่ายประสาทเทียมได้รับการฝึกฝน ฉันกังวลว่านักแสดงที่เป็นอันตรายอาจลองแฮ็ค AI ตัวอย่างเช่น การปลอมแปลงยานพาหนะของตนเองเพื่อแปลความหมายสัญญาณหยุดเทียบกับการ จำกัด ความเร็ว ข้ามการจดจำใบหน้าเช่นสิ่งที่อยู่ในเครื่อง ATM การข้ามตัวกรองสแปม การวิเคราะห์ความเชื่อมั่นของคนโง่จากบทวิจารณ์ภาพยนตร์โรงแรม ฯลฯ ผ่านเครื่องมือตรวจจับความผิดปกติ แกล้งทำคำสั่งเสียง เครื่องจำแนกประเภทการเรียนรู้การทำนายทางการแพทย์ สิ่งที่มีผลต่อฝ่ายตรงข้ามอาจส่งผลกระทบต่อโลก เราจะป้องกันได้อย่างไร

27 neural-networks deep-learning philosophy generative-adversarial-networks ai-safety

4

เครือข่ายที่ลึกสามารถผ่านการฝึกอบรมเพื่อพิสูจน์ทฤษฎีบทได้หรือไม่?

สมมติว่าเรามีหลักฐานจำนวนมากในแคลคูลัสภาคแสดงคำสั่งแรก สมมติว่าเรามีสัจพจน์คอลลารีและทฤษฎีบทในสาขาคณิตศาสตร์ในรูปแบบนั้นด้วย พิจารณาข้อเสนอแต่ละข้อที่ได้รับการพิสูจน์แล้วและร่างของทฤษฎีที่มีอยู่โดยรอบข้อเสนอนั้นเป็นตัวอย่างในชุดฝึกอบรมและหลักฐานที่ดีที่รู้จักกันดีสำหรับข้อเสนอดังกล่าวเป็นฉลากที่เกี่ยวข้อง ในตอนนี้ให้พิจารณาเครือข่ายประดิษฐ์ที่ออกแบบมาเพื่อฝึกฝนในชุดตัวอย่างนี้โดยเฉพาะและตั้งค่าพารามิเตอร์ไฮเปอร์ไว้อย่างถูกต้อง เป็นไปได้ไหมที่จะฝึกอบรมเครือข่ายประดิษฐ์ที่ลึกลงไปในลักษณะที่การนำเสนอของข้อเสนอใหม่และทฤษฎีที่มีอยู่รอบ ๆ มันนำเสนอในภาคแสดงคำสั่งแรกที่แคลคูลัสที่อินพุตจะสร้างหลักฐานที่เอาท์พุท? (แน่นอนว่าหลักฐานดังกล่าวควรได้รับการตรวจสอบด้วยตนเอง) หากสัดส่วนของการพิสูจน์ที่ดีส่งผลให้มีสูงเพียงพออาจเป็นไปได้ไหมที่จะสร้างอัลกอริทึมทางพันธุกรรมที่เสนอข้อเสนอไปยังเครือข่ายลึกที่ผ่านการฝึกอบรม เป็นไปได้ไหม เป็นไปได้ไหมที่จะใช้การออกแบบเครือข่ายแบบลึกนี้เพื่อแก้ปัญหาการคาดการณ์ของโคลลาตซ์หรือการคาดการณ์ของรีมันน์

21 neural-networks deep-learning math automated-theorem-proving

6

ฟังก์ชั่นการเปิดใช้งานในเครือข่ายประสาทคืออะไร?

มันก็บอกว่าฟังก์ชั่นการเปิดใช้งานในเครือข่ายประสาทช่วยแนะนำที่ไม่เป็นเชิงเส้น สิ่งนี้หมายความว่า? การไม่เป็นเชิงเส้นหมายความว่าอะไรในบริบทนี้ การแนะนำของความไม่เป็นเส้นตรงนี้ช่วยได้อย่างไร มีฟังก์ชั่นการเปิดใช้งานอื่น ๆ อีกหรือไม่?

18 neural-networks deep-learning

3

ทำความเข้าใจกับฟังก์ชั่นการสูญเสียของ GAN

ฉันกำลังพยายามทำความเข้าใจเกี่ยวกับฟังก์ชั่นการสูญเสีย GAN ตามที่ระบุไว้ในการทำความเข้าใจกับเครือข่ายผู้ให้คำปรึกษาทั่วไป (โพสต์บล็อกที่เขียนโดย Daniel Seita) ในการสูญเสียข้ามเอนโทรปีมาตรฐานเรามีเอาต์พุตที่ทำงานผ่านฟังก์ชั่น sigmoid และการจำแนกเลขฐานสองเป็นผลลัพธ์ เซียต้าระบุ ดังนั้นสำหรับ [แต่ละจุดข้อมูลและป้ายกำกับเราจะได้ฟังก์ชันการสูญเสียต่อไปนี้ ...x1x1x_1 H( ( x1, y1) , D ) = - y1เข้าสู่ระบบD ( x1) - ( 1 - y1) บันทึก( 1 - D ( x1) )H((x1,Y1),D)=-Y1เข้าสู่ระบบ⁡D(x1)-(1-Y1)เข้าสู่ระบบ⁡(1-D(x1)) H((x_1, y_1), D) = -y_1 \log D(x_1) - (1 - y_1) \log (1 …

17 neural-networks machine-learning deep-learning loss-functions generative-adversarial-networks

4

ปัญหาเกี่ยวกับและทางเลือกในการเรียนรู้แบบลึก?

ในช่วง 50 ปีที่ผ่านมาความนิยมเพิ่มขึ้น / ลดลง / เพิ่มขึ้นของอวนประสาทได้ทำหน้าที่เป็น 'บารอมิเตอร์' สำหรับการวิจัย AI ชัดเจนจากคำถามในเว็บไซต์นี้ที่ผู้คนสนใจที่จะใช้การเรียนรู้อย่างลึก (DL) กับปัญหาที่หลากหลาย ฉันมีสองคำถาม: ผู้ปฏิบัติการ - สิ่งใดที่คุณพบว่าเป็นอุปสรรคสำคัญในการใช้ 'ออกจากกล่อง' กับปัญหาของคุณ? นักวิจัย - เทคนิคใดที่คุณใช้ (หรือพัฒนาขึ้น) ที่อาจช่วยแก้ไขปัญหาในทางปฏิบัติ พวกเขาอยู่ใน DL หรือพวกเขาเสนอแนวทางอื่นหรือไม่?

17 deep-learning

5

เครือข่ายประสาทสามารถนำมาใช้ในการทำนายจำนวนสุ่มหลอกต่อไปได้หรือไม่

มันเป็นไปได้ที่จะเลี้ยงเครือข่ายประสาทที่ส่งออกจากเครื่องกำเนิดไฟฟ้าจำนวนสุ่มและคาดหวังว่ามันเรียนรู้คร่ำเครียด (หรือเครื่องกำเนิดไฟฟ้า) ฟังก์ชั่นเพื่อที่จะสามารถคาดการณ์สิ่งที่จะเป็นต่อไปสร้างตัวเลขสุ่มหลอก ? สิ่งนี้มีอยู่แล้วใช่ไหม หากการวิจัยได้ทำไปแล้วในเรื่องนี้หรือบางสิ่งที่เกี่ยวข้อง (จากการทำนายตัวเลขสุ่มหลอก) ทุกคนสามารถชี้ให้ฉันไปยังแหล่งข้อมูลที่ถูกต้องได้หรือไม่? ขณะนี้ฉันกำลังดูห้องสมุดนี้และลิงก์ที่เกี่ยวข้อง https://github.com/Vict0rSch/deep_learning/tree/master/keras/recurrent

17 deep-learning unsupervised-learning prediction lstm

3

วิธีจัดการกับภาพขนาดใหญ่ใน CNN

สมมติว่ามีภาพขนาด 10K ขนาด 2400 x 2400 ที่จำเป็นต้องใช้ใน CNN.Acc กับมุมมองของฉันคอมพิวเตอร์ทั่วไปที่ผู้คนใช้จะถูกใช้งาน ตอนนี้คำถามคือทำอย่างไรถึงจะจัดการกับภาพขนาดใหญ่เช่นนี้ได้โดยไม่มีสิทธิ์ในการสุ่มตัวอย่าง นี่คือข้อกำหนดของระบบ: - Ubuntu 16.04 RAM 64 GB GPU 16 GB 8 GB HDD 500 GB 1) มีเทคนิคใดบ้างในการจัดการภาพขนาดใหญ่ที่ต้องผ่านการฝึกอบรม? 2) ขนาดชุดใดที่เหมาะสมที่จะใช้? 3) มีข้อควรระวังในการใช้หรือเพิ่มหรือลดทรัพยากรฮาร์ดแวร์ที่ฉันสามารถทำได้หรือไม่?

15 neural-networks deep-learning image-recognition convolutional-neural-networks

6

ความแตกต่างระหว่างการเรียนรู้ของเครื่องและการเรียนรู้อย่างลึกซึ้งคืออะไร?

บางคนสามารถอธิบายความแตกต่างระหว่างการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกให้ฉันได้หรือไม่ เป็นไปได้หรือไม่ที่จะเรียนรู้การเรียนรู้อย่างลึกซึ้งโดยไม่ต้องเรียนรู้ด้วยเครื่อง?

15 machine-learning deep-learning comparison

2

การเรียนรู้อย่างครึกครื้นเกินเหตุเมื่อใด

ตัวอย่างเช่นสำหรับการจำแนกอีเมลเป็นสแปมมันคุ้มค่าหรือไม่ - จากมุมมองของเวลา / ความถูกต้อง - เพื่อใช้การเรียนรู้อย่างลึกซึ้ง (ถ้าเป็นไปได้) แทนที่จะใช้อัลกอริทึมการเรียนรู้ของเครื่องอื่น การเรียนรู้เชิงลึกจะทำให้อัลกอริทึมการเรียนรู้ของเครื่องจักรอื่น ๆ เช่นไร้เดียงสาเบย์ไม่จำเป็นหรือไม่?

15 machine-learning deep-learning classification applications comparison

คำถามติดแท็ก deep-learning