คำตอบที่รวดเร็ว
เมื่อ Intel ได้รับเนอร์วาน่าพวกเขาแสดงความเชื่อว่า analog VLSI มีที่อยู่ในชิป neuromorphic ของอนาคตอันใกล้1, 2, 33
ไม่ว่าจะเป็นเพราะความสามารถในการใช้ประโยชน์จากเสียงควอนตัมธรรมชาติในวงจรอนาล็อกได้ง่ายขึ้นยังไม่เป็นที่เปิดเผยต่อสาธารณะ มีโอกาสมากขึ้นเนื่องจากจำนวนและความซับซ้อนของฟังก์ชั่นการเปิดใช้งานแบบขนานที่สามารถบรรจุลงในชิป VLSI เดียว อะนาล็อกมีคำสั่งของขนาดความได้เปรียบเหนือดิจิตอลในแง่นั้น
น่าจะเป็นประโยชน์สำหรับสมาชิก AI Stack Exchange ที่จะมาถึงความเร็วในการวิวัฒนาการของเทคโนโลยีที่ระบุอย่างยิ่งนี้
แนวโน้มที่สำคัญและไม่ใช่แนวโน้มใน AI
ในการเข้าถึงคำถามนี้ทางวิทยาศาสตร์เป็นการดีที่สุดที่จะเปรียบเทียบทฤษฎีสัญญาณอะนาล็อกและดิจิตอลโดยไม่มีอคติของแนวโน้ม
ผู้ที่ชื่นชอบปัญญาประดิษฐ์สามารถค้นพบสิ่งต่างๆมากมายบนเว็บเกี่ยวกับการเรียนรู้อย่างลึกซึ้งการแยกคุณลักษณะการจดจำรูปภาพและห้องสมุดซอฟต์แวร์เพื่อดาวน์โหลดและเริ่มการทดลองทันที มันเป็นวิธีที่เท้าของพวกเขาเปียกโชกไปด้วยเทคโนโลยีมากที่สุด แต่การแนะนำให้รู้จักกับ AI อย่างรวดเร็วก็มีข้อเสียเช่นกัน
เมื่อรากฐานทางทฤษฎีของการปรับใช้ AI ที่ประสบความสำเร็จในช่วงต้นของผู้บริโภคยังไม่เป็นที่เข้าใจรูปแบบสมมติฐานที่ขัดแย้งกับรากฐานเหล่านั้น ตัวเลือกที่สำคัญเช่นเซลล์ประสาทเทียมแบบอะนาล็อกเครือข่ายที่ถูกแทงและข้อเสนอแนะแบบเรียลไทม์จะถูกมองข้าม การปรับปรุงรูปแบบความสามารถและความน่าเชื่อถือนั้นลดลง
ความกระตือรือร้นในการพัฒนาเทคโนโลยีควรมีอารมณ์อย่างน้อยก็เท่ากับความคิดที่สมเหตุสมผล
การบรรจบกันและความมั่นคง
ในระบบที่มีความแม่นยำและเสถียรภาพผ่านการป้อนกลับทั้งค่าสัญญาณอะนาล็อกและดิจิตอลเป็นเพียงการประมาณการเท่านั้น
- ค่าดิจิตอลในอัลกอริทึมการบรรจบกันหรืออย่างแม่นยำมากขึ้นกลยุทธ์ที่ออกแบบมาเพื่อการบรรจบกัน
- ค่าสัญญาณอนาล็อกในวงจรแอมพลิฟายเออร์ที่มีเสถียรภาพ
การทำความเข้าใจความเท่าเทียมกันระหว่างการบรรจบกันผ่านการแก้ไขข้อผิดพลาดในอัลกอริธึมดิจิตอลและความเสถียรที่เกิดจากการป้อนกลับในเครื่องมือวัดแบบอะนาล็อกเป็นสิ่งสำคัญในการคิดคำถามนี้ สิ่งเหล่านี้เป็นแนวที่ใช้ศัพท์แสงร่วมสมัยพร้อมดิจิตอลทางด้านซ้ายและอนาล็อกทางด้านขวา
┌───────────────────────────────┬───────────────── ─────────────┐
Artificial * มุ้งเทียมดิจิตอล * │ * มุ้งเทียมอะนาล็อก * │
├───────────────────────────────┼───────────────── ─────────────┤
propag การส่งต่อไปข้างหน้า path เส้นทางสัญญาณหลัก│
├───────────────────────────────┼───────────────── ─────────────┤
function ฟังก์ชันข้อผิดพลาด│ฟังก์ชันข้อผิดพลาด│
├───────────────────────────────┼───────────────── ─────────────┤
│คอนเวอร์เจนท์│เสถียร│
├───────────────────────────────┼───────────────── ─────────────┤
│ความอิ่มตัวของการไล่ระดับสี│ความอิ่มตัวของอินพุต│
├───────────────────────────────┼───────────────── ─────────────┤
function ฟังก์ชั่นการเปิดใช้งาน function ฟังก์ชั่นการถ่ายโอนไปข้างหน้า│
└───────────────────────────────┴───────────────── ─────────────┘
ความนิยมของวงจรดิจิตอล
ปัจจัยหลักในการเพิ่มความนิยมของวงจรดิจิตอลคือการบรรจุเสียง วงจรดิจิตอล VLSI วันนี้มีเวลาเฉลี่ยนานถึงความล้มเหลว (เวลาเฉลี่ยระหว่างอินสแตนซ์เมื่อพบค่าบิตที่ไม่ถูกต้อง)
การกำจัดสัญญาณรบกวนเสมือนทำให้วงจรดิจิตอลมีความได้เปรียบที่สำคัญกว่าวงจรอนาล็อกสำหรับการวัดการควบคุมแบบ PID การคำนวณและการใช้งานอื่น ๆ ด้วยวงจรดิจิตอลเราสามารถวัดได้ถึงทศนิยมห้าหลักของความถูกต้องควบคุมด้วยความแม่นยำที่น่าทึ่งและคำนวณ accuracy ถึงหนึ่งพันหลักของความถูกต้องซ้ำและเชื่อถือได้
เป็นหลักเกี่ยวกับการบินการป้องกันขีปนาวุธและการตอบโต้งบประมาณที่เพิ่มความต้องการการผลิตเพื่อให้บรรลุการประหยัดจากขนาดในการผลิตวงจรดิจิตอล ความต้องการความละเอียดในการแสดงผลและความเร็วในการแสดงผลกำลังผลักดันให้ GPU ใช้เป็นโปรเซสเซอร์สัญญาณดิจิตอลในขณะนี้
กองกำลังทางเศรษฐกิจส่วนใหญ่เป็นสาเหตุของการเลือกการออกแบบที่ดีที่สุดหรือไม่? เครือข่ายที่ใช้ระบบดิจิตอลเป็นเครือข่ายที่ใช้ประโยชน์จากอสังหาริมทรัพย์ที่มีค่าของ VLSI หรือไม่? นั่นคือความท้าทายของคำถามนี้และมันก็เป็นคำถามที่ดี
ความเป็นจริงของ IC Complexity
ดังที่ได้กล่าวไว้ในความคิดเห็นมันต้องใช้ทรานซิสเตอร์นับหมื่นเพื่อนำไปใช้ในซิลิคอนซึ่งเป็นเซลล์ประสาทเทียมเครือข่ายอิสระที่ใช้ซ้ำได้ นี่เป็นสาเหตุหลักมาจากการคูณเวกเตอร์เมทริกซ์ที่นำไปสู่แต่ละเลเยอร์การเปิดใช้งาน ใช้เวลาเพียงไม่กี่โหลทรานซิสเตอร์ต่อเซลล์ประสาทเทียมเพื่อใช้การคูณเวกเตอร์เมทริกซ์และอาร์เรย์ของเครื่องขยายสัญญาณการดำเนินงานของเลเยอร์ แอมพลิฟายเออร์ในการดำเนินงานสามารถออกแบบมาเพื่อทำหน้าที่ต่าง ๆ เช่นขั้นตอนไบนารี, sigmoid, soft plus, ELU และ ISRLU
สัญญาณรบกวนแบบดิจิตอลจากการปัดเศษ
การส่งสัญญาณดิจิตอลนั้นไม่มีสัญญาณรบกวนเนื่องจากสัญญาณดิจิตอลส่วนใหญ่จะถูกปัดเศษดังนั้นการประมาณ ความอิ่มตัวของสัญญาณในการแพร่กระจายย้อนกลับก่อนปรากฏเป็นเสียงรบกวนดิจิตอลที่เกิดขึ้นจากการประมาณนี้ ความอิ่มตัวเพิ่มเติมจะเกิดขึ้นเมื่อสัญญาณถูกปัดเศษเป็นตัวแทนเลขฐานสองเดียวกันเสมอ
โวลต์อีknยังไม่มีข้อความ
v = ∑ยังไม่มีข้อความn = 01n2k + e + N- n
โปรแกรมเมอร์บางครั้งพบผลกระทบของการปัดเศษในจำนวนจุดลอยตัว IEEE ที่มีความแม่นยำสองเท่าหรือเดี่ยวเมื่อคำตอบที่คาดว่าจะเป็น 0.2 ปรากฏเป็น 0.20000000000001 หนึ่งในห้าไม่สามารถแสดงด้วยความแม่นยำสมบูรณ์แบบเป็นเลขฐานสองเพราะ 5 ไม่ใช่ตัวคูณของ 2
Science Over Media Hype และแนวโน้มยอดนิยม
E= m c2
ในการเรียนรู้ของเครื่องจักรเช่นเดียวกับผลิตภัณฑ์เทคโนโลยีมีตัววัดคุณภาพหลักสี่ประการ
- ประสิทธิภาพ (ซึ่งขับเคลื่อนความเร็วและประหยัดการใช้งาน)
- ความเชื่อถือได้
- ความถูกต้อง
- ความเข้าใจ (ซึ่งเป็นตัวขับเคลื่อนการบำรุงรักษา)
บางครั้ง แต่ไม่เสมอไปความสำเร็จของผู้หนึ่งจะประนีประนอมกันซึ่งในกรณีนี้จะต้องเกิดความสมดุล การไล่ระดับสีเป็นกลยุทธ์คอนเวอร์เจนซ์ที่สามารถรับรู้ได้ในอัลกอริทึมแบบดิจิทัลที่สร้างความสมดุลให้กับทั้งสี่นี้ซึ่งเป็นเหตุผลว่าทำไมมันจึงเป็นกลยุทธ์ที่โดดเด่นในการฝึกอบรม perceptron แบบหลายชั้นและในเครือข่ายลึกจำนวนมาก
สี่สิ่งเหล่านี้เป็นศูนย์กลางของงานไซเบอร์เนติกส์ยุคแรกของ Norbert Wiener ก่อนที่จะมีวงจรดิจิตอลครั้งแรกใน Bell Labs หรือฟลิปฟล็อปแรกที่รับรู้ด้วยหลอดสุญญากาศ คำว่าไซเบอร์เนติกส์นั้นมาจากภาษากรีกκυβερνήτης (ออกเสียงkyvernítis ) หมายถึงผู้บังคับการเรือซึ่ง ruder และใบเรือต้องชดเชยลมและกระแสน้ำที่เปลี่ยนแปลงตลอดเวลาและเรือจำเป็นต้องมาบรรจบกันที่ท่าเรือหรือท่าเรือที่ต้องการ
wiew เป็นตัวขับเคลื่อนแนวโน้มของคำถามนี้อาจล้อมรอบความคิดว่า VLSI สามารถทำได้เพื่อให้เกิดการประหยัดจากขนาดสำหรับเครือข่ายอะนาล็อกหรือไม่ แต่เกณฑ์ที่ผู้เขียนกำหนดไว้ก็คือ แม้ว่าจะไม่ใช่กรณีดังกล่าวข้างต้นทรานซิสเตอร์จำนวนน้อยลงจะต้องผลิตเลเยอร์เครือข่ายเทียมที่มีวงจรแอนะล็อกมากกว่าดิจิตอล ด้วยเหตุผลดังกล่าวมันถูกต้องตามกฎหมายที่จะตอบคำถามสมมติว่า VLSI analog นั้นมีความเป็นไปได้อย่างมากในราคาที่สมเหตุสมผลหากความสนใจมุ่งไปที่การทำให้สำเร็จ
การออกแบบเครือข่ายอะนาล็อกประดิษฐ์
กำลังทำการสืบสวนอวนเทียมทั่วโลกรวมถึงกิจการร่วมค้าของ IBM / MIT, Nirvana, Google, กองทัพอากาศสหรัฐฯของ Intel ตั้งแต่ปี 1992 5 , Tesla และอื่น ๆ อีกมากมายบางคนระบุไว้ในข้อคิดเห็นและภาคผนวกของสิ่งนี้ คำถาม.
ความสนใจในอะนาล็อกสำหรับเครือข่ายประดิษฐ์นั้นเกี่ยวข้องกับจำนวนของฟังก์ชั่นการเปิดใช้งานแบบขนานที่เกี่ยวข้องกับการเรียนรู้สามารถพอดีกับหน่วยสี่เหลี่ยมจัตุรัสของ VLSI ชิปอสังหาริมทรัพย์ ขึ้นอยู่กับจำนวนทรานซิสเตอร์ที่ต้องการ เมทริกการลดทอน (เมทริกซ์การเรียนรู้พารามิเตอร์) 4ต้องการการคูณเวกเตอร์เมทริกซ์ซึ่งต้องใช้ทรานซิสเตอร์จำนวนมากและดังนั้นจึงเป็นชิ้นสำคัญของ VLSI อสังหาริมทรัพย์
จะต้องมีห้าองค์ประกอบการทำงานที่เป็นอิสระในเครือข่าย perceptron พื้นฐานหลายชั้นถ้ามันจะสามารถใช้ได้สำหรับการฝึกอบรมแบบขนานอย่างเต็มที่
- การคูณเวกเตอร์เมทริกซ์ที่ทำให้ค่าแอมพลิจูดของการแพร่กระจายไปข้างหน้าระหว่างฟังก์ชั่นการเปิดใช้งานของแต่ละชั้น
- การเก็บรักษาพารามิเตอร์
- ฟังก์ชั่นการเปิดใช้งานสำหรับแต่ละชั้น
- การเก็บรักษาเอาต์พุตเลเยอร์การเปิดใช้งานเพื่อนำไปใช้ในการเผยแพร่กลับ
- อนุพันธ์ของฟังก์ชั่นการเปิดใช้งานสำหรับแต่ละชั้น
ในวงจรอะนาล็อกด้วยความขนานที่มากขึ้นโดยธรรมชาติในวิธีการส่งสัญญาณ 2 และ 4 อาจไม่จำเป็น ทฤษฎีความคิดเห็นและการวิเคราะห์ฮาร์มอนิกจะถูกนำไปใช้กับการออกแบบวงจรโดยใช้ตัวจำลองเช่น Spice
คพีc ( ∫r )r ( t , c )เสื้อผมผมWผม τพีτaτd
c = cพีc ( ∫r ( t , c )dt )( ∑ผม- 2i = 0( τพีWผมWฉัน- 1+ τaWผม+ τdWผม) + τaWผม- 1+ τdWผม- 1)
สำหรับค่าทั่วไปของวงจรเหล่านี้ในวงจรรวมแบบอะนาล็อกปัจจุบันเรามีค่าใช้จ่ายสำหรับชิป VLSI อะนาล็อกที่แปลงค่าเมื่อเวลาผ่านไปเป็นค่าอย่างน้อยสามคำสั่งของขนาดที่ต่ำกว่าของชิปดิจิทัลที่มีการฝึกอบรมที่เท่าเทียมกัน
จัดการกับการฉีดเสียงรบกวนโดยตรง
คำถามนี้กล่าวว่า "เรากำลังใช้การไล่ระดับสี (จาโคเบียน) หรือแบบจำลองระดับที่สอง (Hessian) เพื่อประเมินขั้นตอนต่อไปในอัลกอริทึมแบบมาบรรจบกันและเพิ่มเสียงรบกวน [หรือ] การฉีดหลอก พื้นผิวในระหว่างการบรรจบกัน "
เหตุผลที่ทำให้เกิดสัญญาณรบกวนแบบสุ่มหลอกเข้าไปในอัลกอริธึมการบรรจบกันในระหว่างการฝึกอบรมและในเวลาจริงเครือข่ายผู้เข้าร่วมใหม่ (เช่นเครือข่ายเสริม) เป็นเพราะการดำรงอยู่ของท้องถิ่นน้อยที่สุดในพื้นผิวที่แตกต่างกัน พื้นผิว minima ทั่วโลกเป็นสถานะที่ดีที่สุดของเครือข่ายประดิษฐ์ ท้องถิ่นน้อยที่สุดอาจไม่เหมาะสม
พื้นผิวนี้แสดงให้เห็นถึงฟังก์ชั่นข้อผิดพลาดของพารามิเตอร์ (สองในกรณีที่ง่ายขึ้นอย่างมาก6 ) และปัญหาของ minima ท้องถิ่นซ่อนการดำรงอยู่ของ minima ทั่วโลก จุดต่ำในพื้นผิวเป็นตัวแทนของ minima ที่จุดวิกฤติของภูมิภาคท้องถิ่นของการลู่เข้าการฝึกที่เหมาะสม 7,8
ฟังก์ชันข้อผิดพลาดเป็นเพียงการวัดความไม่เสมอภาคระหว่างสถานะเครือข่ายปัจจุบันระหว่างการฝึกอบรมและสถานะเครือข่ายที่ต้องการ ในระหว่างการฝึกอบรมเครือข่ายประดิษฐ์เป้าหมายคือการค้นหาความแตกต่างระดับต่ำสุดของโลก พื้นผิวดังกล่าวมีอยู่ไม่ว่าจะเป็นข้อมูลตัวอย่างที่มีข้อความหรือไม่มีป้ายกำกับและไม่ว่าเกณฑ์การสำเร็จการฝึกอบรมจะอยู่ภายในหรือภายนอกกับเครือข่ายเทียม
หากอัตราการเรียนรู้มีขนาดเล็กและสถานะเริ่มต้นอยู่ที่จุดเริ่มต้นของพื้นที่พารามิเตอร์การบรรจบกันโดยใช้การไล่ระดับสีแบบไล่ระดับจะมาบรรจบกับหลุมซ้ายสุดซึ่งเป็นค่าต่ำสุดในท้องถิ่นไม่ใช่ค่าต่ำสุดทั่วโลกทางด้านขวา
แม้ว่าผู้เชี่ยวชาญที่เริ่มต้นเครือข่ายประดิษฐ์เพื่อการเรียนรู้นั้นฉลาดพอที่จะเลือกจุดกึ่งกลางระหว่างสอง minima การไล่ระดับสีที่จุดนั้นยังคงลาดเอียงไปทางซ้ายมือขั้นต่ำและการบรรจบกันจะมาถึงสถานะการฝึกอบรมที่ไม่เหมาะสม หากการฝึกอบรมมีความสำคัญอย่างยิ่งซึ่งเป็นสิ่งสำคัญการฝึกอบรมจะล้มเหลวเพื่อให้ได้ผลลัพธ์คุณภาพการผลิต
ทางออกหนึ่งที่ใช้คือการเพิ่มเอนโทรปีให้กับกระบวนการคอนเวอร์เจนซ์ซึ่งมักจะเป็นการฉีดเอาท์พุทแบบลดทอนของตัวสร้างตัวเลขสุ่มหลอก อีกวิธีที่ใช้กันไม่บ่อยก็คือการแยกกระบวนการฝึกอบรมและลองฉีดเอนโทรปีจำนวนมากในกระบวนการบรรจบที่สองเพื่อให้มีการค้นหาแบบอนุรักษ์นิยมและการค้นหาแบบค่อนข้างจะทำงานพร้อมกัน
มันเป็นความจริงที่เสียงควอนตัมในวงจรอะนาล็อกที่เล็กมากนั้นมีความสม่ำเสมอของสเปกตรัมสัญญาณจากเอนโทรปีมากกว่าเครื่องกำเนิดไฟฟ้าแบบหลอกเทียมแบบดิจิตอลและทรานซิสเตอร์ที่ต้องการคุณภาพเสียงที่สูงขึ้น ไม่ว่าจะเป็นความท้าทายของการทำเช่นนี้ในการใช้งาน VLSI ที่ได้รับการเอาชนะนั้นยังไม่ได้รับการเปิดเผยโดยห้องปฏิบัติการวิจัยที่ฝังอยู่ในรัฐบาลและ บริษัท ต่างๆ
- องค์ประกอบสุ่มดังกล่าวจะใช้ในการฉีดจำนวนแบบสุ่มที่วัดได้เพื่อเพิ่มความเร็วในการฝึกอบรมและความน่าเชื่อถือจะมีภูมิคุ้มกันต่อเสียงรบกวนภายนอกเพียงพอในระหว่างการฝึกซ้อมหรือไม่?
- พวกเขาจะได้รับการป้องกันอย่างเพียงพอจากการพูดคุยภายในหรือไม่
- ความต้องการจะเกิดขึ้นซึ่งจะลดต้นทุนของการผลิต VLSI อย่างเพียงพอเพื่อให้ถึงจุดใช้งานที่มากขึ้นนอกสถานประกอบการวิจัยที่ได้รับทุนสูง
ความท้าทายทั้งสามนั้นเป็นไปได้ มีอะไรที่น่าสนใจและน่าสนใจมากคือนักออกแบบและผู้ผลิตอำนวยความสะดวกในการควบคุมเส้นทางสัญญาณอะนาล็อกและฟังก์ชั่นการเปิดใช้งานแบบดิจิตอลเพื่อให้ได้การฝึกอบรมความเร็วสูง
เชิงอรรถ
[1] https://ieeexplore.ieee.org/abstract/document/8401400/
[2] https://spectrum.ieee.org/automaton/robotics/artificial-intelligence/analog-and-neuromorphic-chips-will-rule-robotic-age
[3] https://www.roboticstomorrow.com/article/2018/04/whats-the-difference-between-analog-and-neuromorphic-chips-in-robots/11820
[4] การลดทอนหมายถึงการทวีคูณของสัญญาณเอาต์พุตจากการดำเนินการหนึ่งครั้งโดยพารามิเตอร์ที่ฝึกได้เพื่อให้มีการรวมส่วนเพิ่มเติมกับผู้อื่นสำหรับการป้อนข้อมูลไปยังการเปิดใช้งานของเลเยอร์ที่ตามมา แม้ว่านี่จะเป็นศัพท์ฟิสิกส์ แต่ก็มักจะใช้ในงานวิศวกรรมไฟฟ้าและเป็นคำที่เหมาะสมในการอธิบายการทำงานของการคูณเวกเตอร์เมทริกซ์ที่บรรลุสิ่งที่ในวงการศึกษาน้อยเรียกว่าการถ่วงน้ำหนักชั้นเลเยอร์
[5] http://www.dtic.mil/dtic/tr/fulltext/u2/a256621.pdf
[6] มีพารามิเตอร์มากกว่าสองตัวในเครือข่ายประดิษฐ์ แต่มีเพียงสองพารามิเตอร์เท่านั้นที่ปรากฎในภาพประกอบนี้เนื่องจากพล็อตสามารถเข้าใจได้ใน 3-D และเราต้องการหนึ่งในสามมิติสำหรับค่าฟังก์ชันข้อผิดพลาด
Z= ( x - 2 )2+ ( y- 2 )2+ 60 - 401 + ( y- 1.1 )2+ ( x - 0.9 )2√- 40( 1 + ( ( y- 2.2 )2+ ( x - 3.1 )2)4)
[8] คำสั่ง gnuplot ที่เกี่ยวข้อง:
set title "Error Surface Showing How Global Optimum Can be Missed"
set xlabel "x"
set ylabel "y"
set pm3d at b
set ticslevel 0.8
set isosample 40,40
set xrange [0:4]
set yrange [0:4]
set nokey
splot (x-2)**2 + (y-2)**2 + 60 \
- 40 / sqrt(1+(y-1.1)**2+(x-0.9)**2) \
- 40 / (1+(y-2.2)**2+(x-3.1)**2)**4