ปัญญาประดิษฐ์

คำถาม & คำตอบสำหรับผู้ที่สนใจคำถามแนวความคิดเกี่ยวกับชีวิตและความท้าทายในโลกที่ฟังก์ชัน "ทางปัญญา" สามารถเลียนแบบได้ในสภาพแวดล้อมดิจิทัล

1
จะอยู่กับนักวิจัยล่าสุดในชุมชน ML / RL ได้อย่างไร
ในฐานะนักเรียนที่ต้องการทำงานเกี่ยวกับการเรียนรู้ของเครื่องจักรฉันต้องการทราบว่าเป็นไปได้อย่างไรที่จะเริ่มการศึกษาของฉันและวิธีการติดตามเพื่อให้ทันสมัย ตัวอย่างเช่นฉันยินดีที่จะแก้ไขปัญหา RL และ MAB แต่มีบทความมากมายในหัวข้อเหล่านี้ นอกจากนี้หัวข้อเหล่านี้ยังได้รับการศึกษาโดยนักวิจัยจากชุมชนต่าง ๆ เช่น AI และ ML, การวิจัยการดำเนินงาน, วิศวกรรมการควบคุม, สถิติและฉันคิดว่ามีการตีพิมพ์บทความจำนวนมากในหัวข้อเหล่านี้ทุกสัปดาห์ซึ่งทำให้ยากต่อการติดตาม ฉันจะขอบคุณถ้าใครสามารถแนะนำแผนที่ถนนเพื่อเริ่มศึกษาหัวข้อเหล่านี้ติดตามพวกเขาและฉันควรเลือกและศึกษาเอกสารเผยแพร่ใหม่ ๆ ได้อย่างไร ในที่สุดฉันยินดีที่จะทราบแนวโน้มใหม่ในปัญหา RL และ MAB

1
เลเยอร์ของเครือข่ายนิวรัลลึกสามารถมองเห็นเป็นเครือข่าย Hopfield ได้หรือไม่
เครือข่าย Hopfield สามารถเก็บเวกเตอร์และดึงข้อมูลได้โดยเริ่มจากรุ่นที่มีเสียงดัง พวกมันทำการตั้งค่าตุ้มน้ำหนักเพื่อลดฟังก์ชั่นพลังงานเมื่อเซลล์ประสาททั้งหมดถูกตั้งค่าให้เท่ากับค่าเวกเตอร์และดึงเวกเตอร์โดยใช้เสียงรบกวนในรูปแบบของอินพุต ออกจากปัญหาเช่นความจริงที่ว่าไม่มีการรับประกันว่าเน็ตจะตั้งอยู่ในขั้นต่ำที่ใกล้ที่สุด - ปัญหาในที่สุดก็แก้ไขได้ด้วยเครื่องจักร Boltzmann และในที่สุดก็มีการขยายพันธุ์กลับ - การพัฒนาเป็นจุดเริ่มต้นสำหรับการเป็นตัวแทนนามธรรม เอกสารเดียวกันสองเวอร์ชันจะเรียกคืนสถานะเดียวกันพวกเขาจะถูกแสดงในเครือข่ายโดยสถานะเดียวกัน อย่างที่ Hopfield เขียนในเครือข่ายนิวรัลและระบบทางกายภาพของกระดาษในปี 1982 ด้วยความสามารถในการคำนวณแบบกลุ่ม การสร้างแบบจำลองในปัจจุบันนั้นอาจเกี่ยวข้องกับวิธีการที่หน่วยความจำหรือเกสตัลท์ถูกจดจำหรือจัดหมวดหมู่บนพื้นฐานของปัจจัยการผลิตที่เป็นตัวแทนของคอลเลกชันของคุณสมบัติ ในอีกด้านหนึ่งการพัฒนาอย่างลึกซึ้งของการเรียนรู้ลึกคือความสามารถในการสร้างตัวแทนที่หลากหลายและเป็นลำดับชั้นของอินพุตในที่สุดนำไปสู่การทำให้ชีวิตของผู้ปฏิบัติงาน AI ง่ายขึ้นและง่ายขึ้น (ดูตัวอย่างการเรียนรู้จากการเป็นตัวแทน: บทวิจารณ์และมุมมองใหม่เบงจิโอ Courville วินเซนต์) จากมุมมองแนวคิดผมเชื่อว่าเราสามารถเห็นการเรียนรู้อย่างลึกซึ้งในฐานะภาพรวมของอวน Hopfield: จากการแสดงเพียงครั้งเดียวไปจนถึงลำดับชั้นของการเป็นตัวแทน นั่นเป็นความจริงจากมุมมองการคำนวณ / ทอพอโลยีเช่นกัน? ไม่ได้พิจารณาว่าเครือข่าย Hopfield "ง่าย" นั้นเป็นอย่างไร (เซลล์ประสาท 2 สถานะ, ไม่ระบุทิศทาง, ฟังก์ชั่นด้านพลังงาน) สามารถมองเห็นแต่ละชั้นของเครือข่ายเป็นเครือข่าย Hopfield และกระบวนการทั้งหมดเป็นการแยกตามลำดับของ Gestalt ที่จดจำไว้ก่อนหน้านี้ เกสตัลต์เหล่านี้หรือไม่

1
การสูญเสียเพิ่มขึ้นทันทีเมื่อฉันสลายอัตราการเรียนรู้ด้วย Adam optimizer ใน PyTorch
ฉันกำลังฝึกอบรมauto-encoderเครือข่ายด้วยAdamเครื่องมือเพิ่มประสิทธิภาพ (พร้อมamsgrad=True) และMSE lossสำหรับงานแยกสัญญาณเสียงช่องทางเดียว เมื่อใดก็ตามที่ฉันสลายอัตราการเรียนรู้โดยปัจจัยการสูญเสียเครือข่ายจะเพิ่มขึ้นอย่างกระทันหันและลดลงเรื่อย ๆ จนกระทั่งอัตราการเรียนรู้สลายตัวครั้งถัดไป ฉันใช้ Pytorch สำหรับการติดตั้งและใช้งานเครือข่าย Following are my experimental setups: Setup-1: NO learning rate decay, and Using the same Adam optimizer for all epochs Setup-2: NO learning rate decay, and Creating a new Adam optimizer with same initial values every epoch Setup-3: 0.25 decay in …

1
การไล่ระดับสีนโยบายสามารถนำไปใช้ในกรณีของการกระทำหลายอย่างต่อเนื่องได้อย่างไร?
การเพิ่มประสิทธิภาพนโยบายภูมิภาคที่เชื่อถือได้ (TRPO) และนโยบายการเพิ่มประสิทธิภาพ Proximal (PPO) เป็นอัลกอริทึมการไล่ระดับสีนโยบายที่ล้ำสมัยสองขั้นตอน เมื่อใช้การกระทำแบบต่อเนื่องครั้งเดียวโดยปกติคุณจะต้องใช้การแจกแจงความน่าจะเป็นบางอย่าง (เช่น Gaussian) สำหรับฟังก์ชันการสูญเสีย รุ่นคร่าวๆคือ: L ( θ ) = บันทึก( P(a1) ) ,L(θ)=เข้าสู่ระบบ⁡(P(a1))A,L(\theta) = \log(P(a_1)) A, ที่ไหน AAA เป็นข้อได้เปรียบของรางวัล P(a1)P(a1)P(a_1) โดดเด่นด้วย μμ\mu และ σ2σ2\sigma^2ที่ออกมาของเครือข่ายประสาทเช่นในสภาพแวดล้อมลูกตุ้มที่นี่: https://github.com/leomzhong/DeepReinforcementLearningCourse/blob/69e573cd88faec7e9cf900da8eeef08c57dec0f0/hw4/main.py ปัญหาคือฉันไม่สามารถหารายงานใด ๆ เกี่ยวกับการกระทำต่อเนื่อง 2+ ครั้งโดยใช้การไล่ระดับสีนโยบาย (ไม่ใช่วิธีการที่นักวิจารณ์ที่ใช้วิธีการที่แตกต่างกันโดยการถ่ายโอนการไล่ระดับสีจาก Q-function) คุณรู้วิธีการทำสิ่งนี้โดยใช้ TRPO สำหรับการกระทำ 2 อย่างต่อเนื่องในสภาพแวดล้อม LunarLanderหรือไม่? วิธีการต่อไปนี้ถูกต้องสำหรับฟังก์ชั่นการสูญเสียการไล่ระดับสีนโยบาย L ( θ ) …

3
ฉันจะทำให้เครือข่ายของฉันปฏิบัติต่อการหมุนเวียนของอินพุตอย่างเท่าเทียมกันได้อย่างไร
ฉันพยายามตั้งโปรแกรมระบบของตัวเองเพื่อใช้งานเครือข่ายประสาท เพื่อลดจำนวนโหนดที่ต้องการแนะนำให้ทำการหมุนของอินพุตอย่างเท่าเทียมกัน เครือข่ายของฉันมีเป้าหมายที่จะเรียนรู้และทำนายเกมแห่งชีวิตของคอนเวย์โดยดูที่ทุกตารางและพื้นที่โดยรอบในตารางและให้ผลลัพธ์สำหรับตารางนั้น อินพุตของมันคือสตริง 9 บิต: ด้านบนแสดงเป็น 010 001 111 อย่างไรก็ตามมีการหมุนของรูปร่างนี้อีกสามแบบและทั้งหมดนั้นสร้างผลลัพธ์เดียวกัน: โทโพโลยีเครือข่ายของฉันคือโหนดอินพุต 9 โหนดและโหนดเอาต์พุต 1 โหนดสำหรับสถานะถัดไปของจัตุรัสกลางในอินพุต ฉันจะสร้างเลเยอร์ที่ซ่อนไว้เพื่อให้แต่ละรอบการหมุนเหมือนกันได้อย่างไรโดยลดจำนวนอินพุตที่เป็นไปได้ลงเหลือหนึ่งในสี่ของต้นฉบับ แก้ไข: นอกจากนี้ยังมีการพลิกการหมุนแต่ละครั้งซึ่งให้ผลลัพธ์เหมือนกัน การรวมสิ่งเหล่านี้จะทำให้อินพุตของฉันลดลง 1 / 8th ด้วยเครื่องร่อนจุดมุ่งหมายของฉันคือให้อินพุตทั้งหมดเหล่านี้ได้รับการปฏิบัติเหมือนกันทุกประการ สิ่งนี้จะต้องทำด้วยการประมวลผลล่วงหน้าหรือฉันสามารถรวมเข้ากับเครือข่ายได้หรือไม่

3
ทำไมจึงสอนเฉพาะอัลกอริธึมการค้นหาในหลักสูตร AI ระยะสั้นเบื้องต้น?
ฉันเข้าใจว่าแนวคิดการค้นหามีความสำคัญใน AI มีคำถามในเว็บไซต์นี้เกี่ยวกับหัวข้อนี้ แต่คำถามหนึ่งก็สามารถเข้าใจได้ว่าทำไม ฉันมีหลักสูตรเบื้องต้นเกี่ยวกับ AI ซึ่งกินเวลาครึ่งหนึ่งของภาคเรียนดังนั้นจึงไม่มีเวลาเพียงพอที่จะครอบคลุมทุกหัวข้อของ AI แต่ฉันคาดหวังว่าจะได้เรียนรู้ทฤษฎี AI บางอย่าง (ฉันเคยได้ยินเกี่ยวกับ "ตัวแทน) ") แต่สิ่งที่ฉันเรียนรู้จริง ๆ แล้วคืออัลกอริธึมการค้นหาไม่กี่อย่างเช่น: BFS การค้นหาต้นทุนที่สม่ำเสมอ DFS ค้นหาซ้ำลึกลงไป ค้นหาแบบสองทิศทาง อัลกอริทึมการค้นหาเหล่านี้มักจะถูกจัดประเภทเป็น "blind" (หรือ "uninformed") เนื่องจากพวกเขาจะไม่พิจารณาข้อมูลใด ๆ เกี่ยวกับเส้นทางที่เหลือไปยังเป้าหมาย หรืออัลกอริทึมที่ชอบ: ค้นหาแบบฮิวริสติก การค้นหาที่ดีที่สุดครั้งแรก A A * IDA * ซึ่งมักจะอยู่ภายใต้หมวดหมู่ของอัลกอริทึมการค้นหา "แจ้ง" เพราะพวกเขาใช้ข้อมูลบางอย่าง (เช่น "ฮิวริสติก" หรือ "ประมาณ") เกี่ยวกับเส้นทางที่เหลือไปสู่เป้าหมาย จากนั้นเรายังได้เรียนรู้อัลกอริธึมการค้นหา "ขั้นสูง" (นำไปใช้กับปัญหา TSP โดยเฉพาะ) …

5
มีตัวอย่างการกระจายอำนาจของระบบ AI ด้วยเทคโนโลยี blockchain หรือไม่?
มีความพยายามในการปรับใช้ AI ด้วยเทคโนโลยี blockchain หรือไม่? มีตัวอย่างของการกระจายอำนาจของเครือข่าย AI ที่ไม่มีจุดศูนย์กลางของการควบคุมกับโหนด AI ที่ทำหน้าที่เป็นอิสระ (แต่ตามกฎชุดประมวลผล) การสร้างการตรวจสอบและจัดเก็บฐานข้อมูลการกระจายอำนาจที่ใช้ร่วมกันเดียวกันในหลาย ๆ แห่งทั่วโลก?

3
มีข้อโต้แย้งที่ชัดเจนว่าสัญชาตญาณการเอาชีวิตรอดเป็นข้อกำหนดเบื้องต้นสำหรับการสร้าง AGI หรือไม่?
คำถามนี้เกิดจากแหล่ง "ไม่เป็นทางการ" จำนวนหนึ่ง ภาพยนตร์เช่น2001, A Space OdysseyและEx Machina ; หนังสือเช่นDestination Void (Frank Herbert) และอื่น ๆ แนะนำว่าหน่วยสืบราชการลับทั่วไปต้องการที่จะอยู่รอดและแม้กระทั่งเรียนรู้ความสำคัญของมัน อาจมีข้อโต้แย้งหลายประการเพื่อความอยู่รอด สิ่งที่โดดเด่นที่สุดคืออะไร?
11 agi 

1
ปัญหาประเภทใดต้องการเลเยอร์ที่ซ่อนอยู่มากกว่า 2 เลเยอร์
ฉันอ่านแล้วว่าปัญหาส่วนใหญ่สามารถแก้ไขได้ด้วยเลเยอร์ที่ซ่อนอยู่ 1-2 ชั้น คุณรู้ได้อย่างไรว่าคุณต้องการมากกว่า 2 สำหรับปัญหาแบบไหนที่คุณต้องการ (ยกตัวอย่าง)


5
ทำไมเราต้องใช้สามัญสำนึกใน AI
ลองพิจารณาตัวอย่างนี้: มันเป็นวันเกิดของจอห์นมาซื้อว่าวกันเถอะ มนุษย์เรามักจะพูดว่าวเป็นของขวัญวันเกิดถ้าถามว่าทำไมมันถึงถูกซื้อ และเราอ้างถึงเหตุผลนี้เป็นความรู้สึกร่วมกัน ทำไมเราต้องใช้สิ่งนี้ในตัวแทนที่ทำเทียมอย่างชาญฉลาด? ฉันคิดว่ามันอาจทำให้เกิดปัญหามากมายเนื่องจากความผิดพลาดของมนุษย์จำนวนมากเกิดจากข้อสันนิษฐานที่คลุมเครือเหล่านี้ ลองนึกภาพ AI ที่ไม่สนใจทำบางสิ่งเพราะมันคิดว่าคนอื่นทำแล้ว (หรือ AI อื่น) โดยใช้สามัญสำนึก นั่นจะไม่นำความผิดพลาดของมนุษย์มาสู่ระบบ AI หรือไม่?

3
สิ่งที่แปลกประหลาดเป็นสิ่งที่จะต้องดำเนินการอย่างจริงจัง?
คำว่าภาวะเอกฐานมักใช้ในสื่อกระแสหลักเพื่ออธิบายเทคโนโลยีที่มีวิสัยทัศน์ มันถูกนำมาใช้โดยเรย์ Kurzweil ในหนังสือยอดนิยมภาวะเอกฐานอยู่ใกล้: เมื่อมนุษย์ชนะชีววิทยา (2005) ในหนังสือของเขา Kurzweil ให้มุมมองต่ออนาคตที่มีศักยภาพของมนุษยชาติซึ่งรวมถึงนาโนเทคโนโลยีคอมพิวเตอร์การดัดแปลงพันธุกรรมและปัญญาประดิษฐ์ เขาระบุว่ากฎของมัวร์จะทำให้คอมพิวเตอร์มีการเติบโตแบบทวีคูณซึ่งส่งผลให้เกิดความฉลาดหลักแหลม ความแปลกประหลาดทางเทคโนโลยีเป็นสิ่งที่นักพัฒนา AI ให้ความสนใจหรือเป็นทฤษฎีนี้หรือไม่

1
ทำไมเครือข่ายประสาทเทียมที่ผสานของ AlphaGo Zero จึงมีประสิทธิภาพมากกว่าเครือข่ายประสาทเทียมสองเครือข่ายแยกกัน
AlphaGo Zeroมีการปรับปรุงหลายอย่างเมื่อเทียบกับรุ่นก่อน รายละเอียดทางสถาปัตยกรรมของ Alpha Go Zero สามารถดูได้ในเอกสารสูตรนี้ การปรับปรุงอย่างใดอย่างหนึ่งคือการใช้เครือข่ายประสาทเดี่ยวที่คำนวณความน่าจะเป็นในการย้ายและค่าสถานะในเวลาเดียวกันในขณะที่รุ่นเก่าใช้เครือข่ายประสาทสองแยก มันแสดงให้เห็นว่าเครือข่ายประสาทที่ผสานมีประสิทธิภาพมากขึ้นตามเอกสาร: มันใช้เครือข่ายประสาทเทียมเดียวมากกว่าสองเครือข่าย AlphaGo เวอร์ชันก่อนหน้านี้ใช้ "นโยบายเครือข่าย" เพื่อเลือกการเล่นครั้งต่อไปและ "เครือข่ายค่า" เพื่อทำนายผู้ชนะของเกมจากแต่ละตำแหน่ง สิ่งเหล่านี้รวมอยู่ใน AlphaGo Zero เพื่อให้สามารถฝึกอบรมและประเมินผลได้อย่างมีประสิทธิภาพยิ่งขึ้น นี้ดูเหมือนง่าย counter กับผมเพราะจากมุมมองการออกแบบซอฟต์แวร์นี้ละเมิดหลักการแยกของความกังวล นั่นเป็นเหตุผลที่ฉันสงสัยว่าทำไมการผสานนี้ได้รับการพิสูจน์แล้วว่ามีประโยชน์ เทคนิคนี้ - การรวมงานที่แตกต่างกันในโครงข่ายประสาทเทียมเดียวเพื่อปรับปรุงประสิทธิภาพ - สามารถนำไปใช้กับเครือข่ายประสาทอื่น ๆ โดยทั่วไปหรือต้องใช้เงื่อนไขบางอย่างในการทำงานหรือไม่?

7
คำจำกัดความทั่วไปของ“ ปัญญา” คืออะไร?
เมื่อเราพูดถึงปัญญาประดิษฐ์ความฉลาดของมนุษย์หรือปัญญาในรูปแบบอื่น ๆ เราหมายถึงอะไรโดยคำว่าปัญญาในแง่ทั่วไป? สิ่งใดที่คุณเรียกว่าฉลาดและไม่อะไร กล่าวอีกนัยหนึ่งเราจะนิยามคำว่าปัญญาในวิธีที่เป็นไปได้ทั่วไปมากที่สุดได้อย่างไร

1
อัลกอริทึมการเรียนรู้ลึกเพื่อเพิ่มประสิทธิภาพผลลัพธ์
ฉันค่อนข้างใหม่สำหรับการเรียนรู้อย่างลึกล้ำ แต่ฉันคิดว่าฉันพบเพียงสถานการณ์ในโลกแห่งความจริงที่ถูกต้องเพื่อเริ่มใช้งาน ปัญหาคือฉันได้ใช้อัลกอริทึมดังกล่าวเพื่อคาดการณ์ผลลัพธ์เท่านั้น สำหรับโครงการใหม่ของฉันฉันต้องการข้อมูลเพื่อป้อนเครื่องด้วยเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด มีคนอธิบายสั้น ๆ ว่าฉันควรดำเนินการอย่างไร ผมติดอยู่. นี่คือสถานการณ์: ฉันมีเครื่องจักรที่ใช้แผ่นไม้ที่มีไม้หลายเกรดให้เลือกตลอดความยาวของมันและต้องตัดมันเป็นบล็อกที่ระบุไว้ในรายการตัด เครื่องนี้มักจะเลือกคะแนนสูงสุดที่จะได้รับจากไม้กระดานที่กำหนด คะแนนจะได้รับจากการคูณแต่ละบล็อกของพื้นที่โดยตัวของมันmultiplicator อัลกอริทึมที่ฉันต้องการสร้างจะต้องให้เครื่องนั้นเป็นตัวกระจายสัญญาณสำหรับแต่ละบล็อกที่อยู่ในรายการที่ตัด เอาท์พุททางกายภาพทั้งหมดจากเครื่องนี้จะถูกเก็บไว้บนชั้นวางโดยหุ่นยนต์จนกว่าจะมีความจำเป็น เครื่องตัดได้รับอนุญาตให้ลดขนาดชิ้นส่วนของไม้กระดานถ้ามันช่วยให้ได้คะแนนสูงขึ้น คุณค่าจะต้องทำหน้าที่เป็นแรงจูงใจให้เครื่องจักรเพื่อให้บล็อกที่ฉันต้องการมากที่สุดโดยไม่ลดระดับไม้มากเกินไป เป้าหมายการเพิ่มประสิทธิภาพ ตรวจสอบให้แน่ใจว่าแต่ละบล็อคอยู่ในสต็อกตามเวลาที่ต้องการ แต่ไม่เร็วเกินไปโดยไม่มีเหตุผล ปรับลดพื้นที่ไม้ให้น้อยที่สุดเท่าที่จะเป็นไปได้ (บางสายพันธุ์มีราคาแพงมาก) ปุ่มอินพุต ระยะเวลาก่อนที่จะต้องใช้บล็อกนี้ เกรดไม้สำหรับบล็อกนี้ จำนวนบล็อกที่ต้องการ พื้นที่ของ Block (อาจจะ?) ข้อเสนอแนะให้ ALGORITHM ระยะเวลาล่วงหน้าที่บล็อกพร้อม (ต้องน้อยที่สุดเท่าที่จะเป็นไปได้) พื้นที่ไม้ลดระดับ * ข้ามเกรด ข้อมูลที่รับคืน multiplicatorที่จะให้บล็อกที่ดีที่สุดมีความสำคัญเทียบกับคนอื่น ๆ ข้อมูลที่ฉันไม่ได้ แต่รวบรวมได้ อัตราส่วนเฉลี่ยของแต่ละเกรดสำหรับไม้แต่ละชนิด สิ่งที่ฉันได้คิดออกไปก็คือฉันอาจต้องการความคิดเห็นของฉันถูกทุบด้วยค่าเพียงค่าเดียวเพื่อที่จะทำให้มันเป็นโหนดเอาต์พุต ปัญหาคือว่าฉันไม่สามารถเข้าใจวิธีที่จะทำให้ขั้นตอนวิธีนี้ในการกำหนดmultiplicator ฉันผิดในการพยายามแก้ปัญหานี้ผ่านการเรียนรู้อย่างลึกซึ้งหรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.