คำถามติดแท็ก neural-networks

สำหรับคำถามเกี่ยวกับเครือข่ายประดิษฐ์เช่น MLPs, CNNs, RNNs, LSTM และเครือข่าย GRU ตัวแปรของพวกเขาหรือส่วนประกอบของระบบ AI อื่น ๆ ที่มีคุณสมบัติเป็นเครือข่ายประสาทในส่วนที่ได้รับแรงบันดาลใจจากเครือข่ายประสาทชีวภาพ

3
เสียงรบกวนส่งผลกระทบต่อลักษณะทั่วไปอย่างไร
การเพิ่มเสียงในข้อมูลช่วยปรับปรุงความสามารถในการเรียนรู้ของเครือข่ายหรือไม่? มันสร้างความแตกต่างหรือไม่หรือขึ้นอยู่กับปัญหาที่กำลังแก้ไข? มันส่งผลกระทบต่อกระบวนการทั่วไปอย่างไร?

3
ฉันจะทำให้เครือข่ายของฉันปฏิบัติต่อการหมุนเวียนของอินพุตอย่างเท่าเทียมกันได้อย่างไร
ฉันพยายามตั้งโปรแกรมระบบของตัวเองเพื่อใช้งานเครือข่ายประสาท เพื่อลดจำนวนโหนดที่ต้องการแนะนำให้ทำการหมุนของอินพุตอย่างเท่าเทียมกัน เครือข่ายของฉันมีเป้าหมายที่จะเรียนรู้และทำนายเกมแห่งชีวิตของคอนเวย์โดยดูที่ทุกตารางและพื้นที่โดยรอบในตารางและให้ผลลัพธ์สำหรับตารางนั้น อินพุตของมันคือสตริง 9 บิต: ด้านบนแสดงเป็น 010 001 111 อย่างไรก็ตามมีการหมุนของรูปร่างนี้อีกสามแบบและทั้งหมดนั้นสร้างผลลัพธ์เดียวกัน: โทโพโลยีเครือข่ายของฉันคือโหนดอินพุต 9 โหนดและโหนดเอาต์พุต 1 โหนดสำหรับสถานะถัดไปของจัตุรัสกลางในอินพุต ฉันจะสร้างเลเยอร์ที่ซ่อนไว้เพื่อให้แต่ละรอบการหมุนเหมือนกันได้อย่างไรโดยลดจำนวนอินพุตที่เป็นไปได้ลงเหลือหนึ่งในสี่ของต้นฉบับ แก้ไข: นอกจากนี้ยังมีการพลิกการหมุนแต่ละครั้งซึ่งให้ผลลัพธ์เหมือนกัน การรวมสิ่งเหล่านี้จะทำให้อินพุตของฉันลดลง 1 / 8th ด้วยเครื่องร่อนจุดมุ่งหมายของฉันคือให้อินพุตทั้งหมดเหล่านี้ได้รับการปฏิบัติเหมือนกันทุกประการ สิ่งนี้จะต้องทำด้วยการประมวลผลล่วงหน้าหรือฉันสามารถรวมเข้ากับเครือข่ายได้หรือไม่

1
ทำไมเครือข่ายประสาทเทียมที่ผสานของ AlphaGo Zero จึงมีประสิทธิภาพมากกว่าเครือข่ายประสาทเทียมสองเครือข่ายแยกกัน
AlphaGo Zeroมีการปรับปรุงหลายอย่างเมื่อเทียบกับรุ่นก่อน รายละเอียดทางสถาปัตยกรรมของ Alpha Go Zero สามารถดูได้ในเอกสารสูตรนี้ การปรับปรุงอย่างใดอย่างหนึ่งคือการใช้เครือข่ายประสาทเดี่ยวที่คำนวณความน่าจะเป็นในการย้ายและค่าสถานะในเวลาเดียวกันในขณะที่รุ่นเก่าใช้เครือข่ายประสาทสองแยก มันแสดงให้เห็นว่าเครือข่ายประสาทที่ผสานมีประสิทธิภาพมากขึ้นตามเอกสาร: มันใช้เครือข่ายประสาทเทียมเดียวมากกว่าสองเครือข่าย AlphaGo เวอร์ชันก่อนหน้านี้ใช้ "นโยบายเครือข่าย" เพื่อเลือกการเล่นครั้งต่อไปและ "เครือข่ายค่า" เพื่อทำนายผู้ชนะของเกมจากแต่ละตำแหน่ง สิ่งเหล่านี้รวมอยู่ใน AlphaGo Zero เพื่อให้สามารถฝึกอบรมและประเมินผลได้อย่างมีประสิทธิภาพยิ่งขึ้น นี้ดูเหมือนง่าย counter กับผมเพราะจากมุมมองการออกแบบซอฟต์แวร์นี้ละเมิดหลักการแยกของความกังวล นั่นเป็นเหตุผลที่ฉันสงสัยว่าทำไมการผสานนี้ได้รับการพิสูจน์แล้วว่ามีประโยชน์ เทคนิคนี้ - การรวมงานที่แตกต่างกันในโครงข่ายประสาทเทียมเดียวเพื่อปรับปรุงประสิทธิภาพ - สามารถนำไปใช้กับเครือข่ายประสาทอื่น ๆ โดยทั่วไปหรือต้องใช้เงื่อนไขบางอย่างในการทำงานหรือไม่?

4
เครือข่ายประสาทสามารถทำงานตามแนวคิดของระยะทางได้หรือไม่
ลองนึกภาพเกมที่มีหน้าจอสีดำแยกจากพิกเซลสีแดงและพิกเซลสีน้ำเงิน ให้เกมนี้กับมนุษย์พวกเขาจะเห็นว่าการกดปุ่มลูกศรจะย้ายจุดสีแดง สิ่งต่อไปที่พวกเขาจะพยายามคือย้ายพิกเซลสีแดงไปยังพิกเซลสีน้ำเงิน มอบเกมนี้ให้กับ AI โดยจะสุ่มย้ายพิกเซลสีแดงจนกว่าจะมีผู้ลองล้านครั้งในภายหลังโดยบังเอิญย้ายไปที่พิกเซลสีน้ำเงินเพื่อรับรางวัล หาก AI มีแนวคิดระยะห่างระหว่างพิกเซลสีแดงและสีน้ำเงินมันอาจพยายามลดระยะห่างนี้ หากไม่มีการเขียนโปรแกรมในแนวคิดของระยะทางหากเราใช้พิกเซลของเกมเราสามารถคำนวณจำนวนเช่น "เอนโทรปี" ซึ่งจะต่ำกว่าเมื่อพิกเซลอยู่ห่างกันมากกว่าเมื่ออยู่ใกล้กันหรือไม่ ควรทำงานกับการกำหนดค่าพิกเซลอื่น ๆ เช่นเกมที่มีสามพิกเซลในที่ที่ดีและอีกอันไม่ดี เพียงเพื่อให้โครงข่ายประสาทมีความรู้สึกว่าหน้าจอเป็นอย่างไร จากนั้นให้ตั้งเป้าหมาย NN เช่น "พยายามทำให้เอนโทรปีของคณะกรรมการน้อยลงและพยายามรับรางวัล" มีอะไรคล้ายกับเรื่องนี้ในการวิจัยปัจจุบันหรือไม่?

3
การใช้โครงข่ายประสาทเทียมเพื่อจดจำรูปแบบในเมทริกซ์
ฉันพยายามที่จะพัฒนาโครงข่ายประสาทเทียมซึ่งสามารถระบุคุณสมบัติการออกแบบในแบบจำลอง CAD (เช่นสล็อต, หัวหน้า, หลุม, กระเป๋า, ขั้นตอน) ข้อมูลอินพุตที่ฉันต้องการใช้สำหรับเครือข่ายคือเมทริกซ์ anxn (โดยที่ n คือจำนวนใบหน้าในโมเดล CAD) '1' ในสามเหลี่ยมด้านขวาบนของเมทริกซ์แสดงถึงความสัมพันธ์ที่นูนระหว่างสองใบหน้าและ '1' ในสามเหลี่ยมล่างซ้ายแสดงถึงความสัมพันธ์แบบเว้า ศูนย์ทั้งสองตำแหน่งหมายความว่าใบหน้าไม่ได้อยู่ติดกัน ภาพด้านล่างเป็นตัวอย่างของเมทริกซ์ดังกล่าว ให้บอกว่าฉันตั้งค่าขนาดรุ่นสูงสุดไว้ที่ 20 ใบหน้าและใช้การเติมเต็มสำหรับสิ่งที่เล็กกว่านั้นเพื่อให้อินพุตกับเครือข่ายมีขนาดคงที่ ฉันต้องการที่จะรับรู้ถึง 5 คุณสมบัติการออกแบบที่แตกต่างกันและดังนั้นจึงมี 5 เซลล์ประสาทเอาท์พุท - [สล็อต, กระเป๋า, หลุม, เจ้านาย, ขั้นตอน] ฉันจะพูดถูกไหมว่านี่เป็นปัญหาของ 'การจดจำรูปแบบ' ตัวอย่างเช่นถ้าฉันจัดหาเครือข่ายด้วยรูปแบบการฝึกอบรมจำนวนมาก - พร้อมกับฉลากที่อธิบายถึงคุณลักษณะการออกแบบที่มีอยู่ในโมเดลเครือข่ายจะเรียนรู้ที่จะจดจำรูปแบบ adjacency เฉพาะที่แสดงในเมทริกซ์ซึ่งเกี่ยวข้องกับคุณสมบัติการออกแบบบางอย่างหรือไม่ ฉันเป็นผู้เริ่มต้นที่สมบูรณ์ในการเรียนรู้ของเครื่องและฉันพยายามที่จะเข้าใจว่าวิธีการนี้จะใช้งานได้หรือไม่ - หากต้องการข้อมูลเพิ่มเติมใด ๆ เพื่อทำความเข้าใจปัญหาแสดงความคิดเห็น ข้อมูลหรือความช่วยเหลือใด ๆ จะได้รับการชื่นชมขอบคุณ

1
AI ที่สามารถสร้างโปรแกรม
ฉันได้มองหาตัวแทนที่ชาญฉลาดของVivในการพัฒนา ตามสิ่งที่ฉันเข้าใจ AI นี้สามารถสร้างรหัสใหม่และเรียกใช้งานโดยยึดตามแบบสอบถามจากผู้ใช้ สิ่งที่ฉันอยากรู้คือ AI นี้สามารถเรียนรู้การสร้างรหัสตามแบบสอบถามได้อย่างไร อัลกอริธึมการเรียนรู้ของเครื่องจักรชนิดใดที่เกี่ยวข้องในกระบวนการนี้ สิ่งหนึ่งที่ฉันพิจารณาคือการทำลายชุดข้อมูลของโปรแกรมทีละขั้นตอน ตัวอย่างเช่น: รหัสที่จะใช้ค่าเฉลี่ยของ 5 คำ 1 - เพิ่มทั้ง 5 คำด้วยกัน 2 - หารด้วย 5 จากนั้นฉันจะฝึกอัลกอริทึมให้แปลงข้อความเป็นรหัส นั่นคือเท่าที่ฉันได้คิดออก ยังไม่ได้ลองอะไรเลยเพราะฉันไม่แน่ใจว่าจะเริ่มที่ไหนดี ใครมีความคิดเห็นเกี่ยวกับวิธีการใช้ Viv? นี่คือการสาธิตของ Viv

3
เครือข่ายประสาทและความหลากหลายของมันเป็นหนทางเดียวที่จะเข้าถึงปัญญาประดิษฐ์ที่แท้จริงได้หรือไม่?
จากความรู้ของฉันการศึกษาปัญญาประดิษฐ์ในปัจจุบันส่วนใหญ่ใช้โครงข่ายประสาทบางชนิดหรือบางรุ่น ตัวอย่างที่ดีคือ alphago ของ DeepMind ซึ่งฉันเชื่อว่าเป็นเครือข่ายประสาทลึกสำหรับการมองเห็น CNN, ข้อความ, เพลงและคุณสมบัติอื่น ๆ ที่สั่งของ RNN เป็นต้น แต่สำหรับแอปพลิเคชันการเรียนรู้ของเครื่องเรามีเครือข่ายประสาทเทียม แอปพลิเคชันอื่น ๆ ดังนั้นเครือข่ายนิวรัลและสายพันธุ์ของมันจึงเป็นหนทางเดียวที่จะเข้าถึงปัญญาประดิษฐ์ "ของจริง"?

1
จะเกิดอะไรขึ้นเมื่อฉันผสมฟังก์ชั่นการเปิดใช้งาน
มีฟังก์ชั่นการเปิดใช้งานหลายอย่างเช่น ReLU, sigmoid หรือ tanhtanh\tanh. จะเกิดอะไรขึ้นเมื่อฉันผสมฟังก์ชั่นการเปิดใช้งาน ฉันเพิ่งพบว่า Google ได้พัฒนาฟังก์ชั่นเปิดใช้งาน Swish ซึ่งเป็น (x * sigmoid) โดยการเปลี่ยนฟังก์ชั่นการเปิดใช้งานมันสามารถเพิ่มความแม่นยำให้กับปัญหาเครือข่ายประสาทขนาดเล็กเช่นปัญหา XOR ได้หรือไม่?

2
การเปิดใช้งานเซลล์ประสาทในเครือข่ายประสาทหมายความว่าอย่างไร
ฉันเพิ่งสะดุดแนวคิดของการครอบคลุมเซลล์ประสาทซึ่งเป็นอัตราส่วนของเซลล์ประสาทที่เปิดใช้งานและเซลล์ประสาททั้งหมดในเครือข่ายประสาท แต่มันหมายถึงอะไรสำหรับเซลล์ประสาทที่จะ "เปิดใช้งาน"? ฉันรู้ว่าฟังก์ชั่นการเปิดใช้งานคืออะไร แต่การเปิดใช้งานหมายถึงอะไรเช่นในกรณีของ ReLU หรือฟังก์ชัน sigmoid

1
อะไรคือข้อดีของ ReLU เทียบกับ Leaky ReLU และ Parametric ReLU (ถ้ามี)?
ฉันคิดว่าข้อดีของการใช้ Leaky ReLU แทนที่จะเป็น ReLU คือด้วยวิธีนี้เราไม่สามารถไล่ระดับสีได้ Parametric ReLU มีข้อได้เปรียบเดียวกันกับความแตกต่างเพียงอย่างเดียวที่ความชันของเอาต์พุตสำหรับอินพุตเชิงลบเป็นพารามิเตอร์ที่เรียนรู้ได้ใน Leaky ReLU มันเป็นพารามิเตอร์ อย่างไรก็ตามฉันไม่สามารถบอกได้ว่ามีหลายกรณีที่สะดวกกว่าที่จะใช้ ReLU แทน Leaky ReLU หรือ Parametric ReLU

4
รูปแบบที่มีศักยภาพในการแทนที่เครือข่ายประสาทในอนาคตอันใกล้คืออะไร?
มีแบบจำลองที่เป็นไปได้ที่มีศักยภาพในการแทนที่โครงข่ายประสาทเทียมในอนาคตอันใกล้นี้หรือไม่? และเราต้องการมันด้วยหรือไม่ อะไรคือสิ่งที่แย่ที่สุดเกี่ยวกับการใช้โครงข่ายประสาทเทียมในแง่ของประสิทธิภาพ?

2
ใช้ AI หรือ Neural Network สำหรับตรวจจับโลโก้
ฉันพยายามตรวจสอบโลโก้ช่องทีวีในไฟล์วิดีโอดังนั้นเพียงแค่ใส่.mp4วิดีโอตรวจสอบว่ามีโลโก้นั้นอยู่ในเฟรมที่ระบุหรือพูดว่าเฟรมแรกหรือไม่ เรามีโลโก้นั้นล่วงหน้า (แม้ว่าอาจจะไม่ใช่ขนาดเดียวกัน 100%) และตำแหน่งจะถูกแก้ไขเสมอ ฉันมีวิธีการจับคู่รูปแบบอยู่แล้ว แต่ต้องใช้รูปแบบเป็น 100% ขนาดเดียวกัน ฉันต้องการใช้ Deep Learning และ Neural Network เพื่อให้บรรลุเป้าหมายนั้น ฉันจะทำสิ่งนั้นได้อย่างไร ฉันเชื่อว่า CNN สามารถมีประสิทธิภาพที่สูงขึ้นได้หรือไม่

3
ทำไมน้ำหนักเริ่มต้นในเครือข่ายประสาทเทียมจึงถูกสุ่ม?
นี่อาจฟังดูไร้สาระสำหรับคนที่มีประสบการณ์มากมายกับเครือข่ายประสาท แต่มันรบกวนจิตใจฉัน ... ฉันหมายถึงการสุ่มน้ำหนักเริ่มต้นอาจให้ผลลัพธ์ที่ดีกว่าซึ่งจะค่อนข้างใกล้เคียงกับเครือข่ายที่ผ่านการฝึกอบรมที่ควรมีลักษณะอย่างไร แต่อาจตรงข้ามกับที่ควรจะเป็นในขณะที่ 0.5 หรือค่าเฉลี่ยอื่น ๆ สำหรับช่วงน้ำหนักที่สมเหตุสมผล ค่าดูเหมือนจะเป็นการตั้งค่าเริ่มต้นที่ดี ... ทำไมน้ำหนักเริ่มต้นสำหรับเซลล์ประสาทจึงถูกสุ่มมากกว่า 0.5 สำหรับพวกเขาทั้งหมด?

4
สอน Neural Network ให้เล่นเกมไพ่
ฉันกำลังเขียนเอ็นจิ้นเพื่อเล่นเกมการ์ดเนื่องจากยังไม่มีเอ็นจิ้นสำหรับเกมนี้โดยเฉพาะ ฉันหวังว่าจะสามารถแนะนำโครงข่ายประสาทเทียมให้กับเกมได้ในภายหลังและให้เรียนรู้ที่จะเล่นเกม ฉันกำลังเขียนเอ็นจิ้นในลักษณะที่เป็นประโยชน์สำหรับผู้เล่น AI มีจุดเลือกและที่จุดเหล่านั้นรายการของตัวเลือกที่ถูกต้องจะถูกนำเสนอ การเลือกแบบสุ่มจะสามารถเล่นเกม (แม้ว่าจะไม่ดี) ฉันได้เรียนรู้มากมายเกี่ยวกับเครือข่ายประสาท (ส่วนใหญ่ NEAT และ HyperNEAT) และสร้างการใช้งานของฉันเอง ฉันยังไม่แน่ใจว่าจะสร้าง AI ที่ดีที่สุดที่สามารถพิจารณาตัวแปรทั้งหมดในเกมประเภทใดประเภทหนึ่งเหล่านี้ได้ มีวิธีการทั่วไปหรือไม่? ฉันรู้ว่า Keldon เขียน AI ที่ดีสำหรับ RftG ซึ่งมีความซับซ้อนในระดับที่เหมาะสมฉันไม่แน่ใจว่าเขาจะสร้าง AI ได้อย่างไร คำแนะนำใด ๆ? เป็นไปได้ไหม มีตัวอย่างที่ดีของสิ่งนี้หรือไม่? อินพุตถูกแมปอย่างไร? แก้ไข: ฉันดูออนไลน์และเรียนรู้ว่าเครือข่ายประสาททำงานอย่างไรและโดยปกติแล้วพวกเขาเกี่ยวข้องกับการจดจำรูปภาพหรือควบคุมเอเจนต์ธรรมดา ฉันไม่แน่ใจว่าจะนำไปใช้กับการเลือกด้วยบัตรที่มีการทำงานร่วมกันที่ซับซ้อนหรือไม่ ทิศทางใดต่อสิ่งที่ฉันควรมองเข้าไปจะได้รับการชื่นชมอย่างมาก เกี่ยวกับเกม: เกมคล้ายกับ Magic: The Gathering มีผู้บัญชาการที่มีสุขภาพและความสามารถ ผู้เล่นมีกลุ่มพลังงานที่พวกเขาใช้เพื่อวางลูกน้องและคาถาบนกระดาน มิเนียนมีสุขภาพค่าโจมตีค่าใช้จ่ายและอื่น ๆ การ์ดยังมีความสามารถซึ่งไม่สามารถระบุได้อย่างง่ายดาย ไพ่จะถูกเล่นจากมือไพ่ใหม่จะถูกดึงมาจากสำรับ สิ่งเหล่านี้จะเป็นประโยชน์สำหรับการพิจารณาโครงข่ายประสาท

2
วิธีการฝึกอบรม chatbot
ฉันต้องการที่จะเริ่มการทดลองกับเครือข่ายประสาทและเป็นปัญหาของเล่นฉันต้องการฝึกอบรมหนึ่งเพื่อแชทเช่นใช้บอทแชทเช่น cleverbot ไม่ฉลาดเท่าไร ฉันมองไปรอบ ๆ เพื่อดูเอกสารบางอย่างและฉันพบว่าบทช่วยสอนทั่วไปเกี่ยวกับงานทั่วไป สิ่งที่ฉันค้นพบเพียงแค่เปิดเผยผลลัพธ์โดยไม่ให้ข้อมูลเชิงลึกเกี่ยวกับการใช้งาน สิ่งที่ทำทำมันค่อนข้างตื้น (หน้าเอกสารคู่มือเทนเซอร์ไหลใน seq2seq ขาด imho) ตอนนี้ฉันรู้สึกว่าฉันอาจเข้าใจหลักการมากกว่าหรือน้อยกว่า แต่ฉันไม่แน่ใจและฉันก็ไม่แน่ใจด้วยว่าจะเริ่มอย่างไร ดังนั้นฉันจะอธิบายว่าฉันจะจัดการกับปัญหาได้อย่างไรและฉันต้องการคำติชมเกี่ยวกับวิธีการแก้ปัญหานี้โดยบอกฉันว่าฉันเข้าใจผิดตรงไหนและอาจมีลิงค์ไปยังคำอธิบายโดยละเอียดและความรู้เชิงปฏิบัติเกี่ยวกับกระบวนการ ชุดข้อมูลที่ฉันจะใช้สำหรับงานนี้คือการถ่ายโอนข้อมูลประวัติการใช้งาน Facebook และ Whatsapp ทั้งหมดของฉัน ฉันไม่รู้ว่ามันจะใหญ่แค่ไหน แต่อาจจะยังไม่ใหญ่พอ ภาษาเป้าหมายไม่ใช่ภาษาอังกฤษดังนั้นฉันจึงไม่รู้จะรวบรวมตัวอย่างการสนทนาที่มีความหมายได้อย่างรวดเร็ว ฉันจะสร้างเวกเตอร์ที่คิดจากแต่ละประโยค ยังไม่รู้ความจริง ฉันพบตัวอย่างที่ดีสำหรับ word2vec บนเว็บไซต์ deeplearning4j แต่ไม่มีสำหรับประโยค ฉันเข้าใจว่าคำว่าเวกเตอร์ถูกสร้างขึ้นอย่างไรและทำไม แต่ฉันไม่สามารถหาคำอธิบายที่ครบถ้วนสมบูรณ์สำหรับเวกเตอร์ประโยคได้ การใช้เวกเตอร์ความคิดเป็นอินพุตและเอาต์พุตฉันจะฝึกโครงข่ายประสาท ฉันไม่รู้ว่ามันควรมีกี่เลเยอร์และอันไหนต้องเป็นเลเยอร์ lstm จากนั้นควรมีโครงข่ายใยประสาทเทียมอื่นที่สามารถแปลงเวกเตอร์คิดเป็นลำดับของอักขระที่เขียนประโยค ฉันอ่านว่าฉันควรใช้การขยายเพื่อชดเชยความยาวประโยคที่แตกต่างกัน แต่ฉันพลาดวิธีเข้ารหัสอักขระ (codepoints เพียงพอหรือไม่)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.