เรียงลำดับตัวเลขโดยใช้เลเยอร์ที่ซ่อนเพียง 2 ชั้น


10

ฉันกำลังอ่านลำดับขั้นตอนสำคัญของการเรียนรู้กับโครงข่ายประสาทโดย Ilya Sutskever และ Quoc Le ในหน้าแรกจะกล่าวสั้น ๆ ว่า:

A surprising example of the power of DNNs is their ability to sort
N N-bit numbers using only 2 hidden layers of quadratic size 

ทุกคนสามารถสรุปวิธีการเรียงลำดับตัวเลขโดยใช้เลเยอร์ที่ซ่อนเพียง 2 ชั้นได้หรือไม่?

คำตอบ:


3

ในการทำวิจัยบางอย่างฉันพบกระดาษที่พิสูจน์ได้ว่าสามารถเรียงลำดับได้สูงสุด 3 เลเยอร์และวิธีแก้ปัญหาของพวกเขานั้นเหมาะสมที่สุดหากคุณ จำกัด ขนาดของเครือข่ายให้เป็นชื่อพหุนาม wrt ตามจำนวนอินพุต:

เครือข่ายประสาทเชิงลึกที่มีประสิทธิภาพสำหรับการแบ่งและปัญหาที่เกี่ยวข้องดูทฤษฎีบท 7 ในหน้า 955 (หน้า 10 ใน PDF)


1
ขอขอบคุณที่ค้นหาบทความที่เกี่ยวข้อง! ที่จริงแล้วกระดาษนี้ทำการเรียงลำดับด้วย "ความลึก" 3 ซึ่งดูเหมือนจะหมายถึงเพียงสองชั้นที่ซ่อนอยู่ ดูการอ้างอิง 14 ที่พวกเขาพึ่งพาสำหรับขอบเขตล่าง "วงจรเกณฑ์ของความลึกที่ถูก จำกัด " igi-web.tugraz.at/people/maass/psfiles/34o.pdf (เช่น ResearchGate) หน้า 131-132 (3 -4 ในรูปแบบ pdf)
Ben Reiniger

1

ฉันคิดว่าจะมีน้ำหนักขึ้นมาด้วยตนเองเพื่อทำงานให้แน่ชัด แต่บางทีประเด็นก็คือสามารถฝึกฝนได้? ตัวอย่างสองตัวอย่าง:

วิธีการเรียงลำดับหมายเลขโดยใช้ Convolutional Neural Network

https://github.com/primaryobjects/nnsorting

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.