เป็นไปได้หรือไม่ที่จะให้กฎประมาณหัวแม่มือเกี่ยวกับขนาดของโครงข่ายประสาทที่สามารถใช้งานได้กับ GPU ระดับผู้บริโภคทั่วไป ? ตัวอย่างเช่น:
การเกิดขึ้นของการเคลื่อนที่ (การเสริมแรง)กระดาษฝึกอบรมเครือข่ายโดยใช้การกระตุ้น tanh ของเซลล์ประสาท พวกเขามี 3 ชั้น NN กับ 300,200,100 หน่วยสำหรับภาพถ่ายวอล์คเกอร์ แต่พวกเขาไม่รายงานฮาร์ดแวร์และเวลา ...
แต่กฎของหัวแม่มือสามารถพัฒนาได้หรือไม่? ยังขึ้นอยู่กับผลลัพธ์เชิงประจักษ์ในปัจจุบันเช่น:
หน่วย X ที่ใช้การเปิดใช้งาน sigmoid สามารถเรียกใช้การเรียนรู้แบบ Y ต่อชั่วโมงใน 1,060
หรือใช้ฟังก์ชั่นการเปิดใช้งาน a แทน b ทำให้ประสิทธิภาพลดลงครั้ง
หากนักเรียน / นักวิจัย / จิตใจอยากรู้อยากเห็นกำลังจะซื้อ GPU สำหรับเล่นกับเครือข่ายเหล่านี้คุณจะตัดสินใจได้อย่างไรว่าคุณจะได้รับ เห็นได้ชัดว่า 1060 เป็นตัวเลือกงบประมาณระดับรายการ แต่จะประเมินได้อย่างไรหากไม่ฉลาดกว่าที่จะได้รับเน็ตบุ๊กเร็วแทนที่จะสร้างเดสก์ท็อปพลังงานสูงและใช้จ่าย $ ตามความต้องการโครงสร้างพื้นฐานคลาวด์
แรงจูงใจสำหรับคำถาม: ฉันเพิ่งซื้อ 1,060 และ (ฉลาดเพื่อถามคำถามหลังจากนั้น huh) สงสัยว่าฉันควรจะเก็บ $ และสร้างบัญชี Google Cloud และถ้าฉันสามารถรันการจำลองวิทยานิพนธ์หลักของฉันบน GPU