คำถามติดแท็ก artificial-intelligence

คำถามเกี่ยวกับการออกแบบและคุณสมบัติของตัวแทนที่ทำหน้าที่ในสภาพแวดล้อมแบบไดนามิกและตัดสินใจไปสู่เป้าหมายบางอย่างโดยผู้ใช้ไม่สามารถควบคุมได้

3
อัลกอริทึมการค้นพบทั่วไปทำอย่างไรเปรียบเทียบกับกระบวนการของมนุษย์
นี่อาจเป็นเส้นขอบของวิทยาศาสตร์พุทธิปัญญา แต่ฉันอยากรู้ว่ากระบวนการตามด้วยขั้นตอนวิธีการค้นพบโดยทั่วไป (เช่นA * ) เปรียบเทียบกับกระบวนการที่มนุษย์ใช้ในสถานการณ์ที่แตกต่างกัน (รับข้อมูลเดียวกัน) กระบวนการเหล่านี้คล้ายกันหรือไม่

2
Least-Constraining-Value คืออะไร
ในปัญหาความพึงพอใจของข้อ จำกัด ฮิวริสติกสามารถนำมาใช้เพื่อปรับปรุงประสิทธิภาพของตัวแก้ปัญหาแบบ bactracking ฮิวริสติกที่ได้รับโดยทั่วไปสามตัวสำหรับนักแก้ปัญหาการย้อนรอยอย่างง่ายคือ: ค่าต่ำสุดที่เหลืออยู่ (จำนวนค่ายังคงใช้ได้สำหรับตัวแปรนี้) ฮิวริสติกระดับ (จำนวนตัวแปรอื่น ๆ ที่ได้รับผลกระทบจากตัวแปรนี้) Least-constraining-value (ค่าใดจะทำให้ค่าอื่น ๆ ส่วนใหญ่สำหรับตัวแปรอื่น ๆ ) สองอันแรกค่อนข้างชัดเจนและใช้งานง่าย ก่อนอื่นให้เลือกตัวแปรที่มีค่าน้อยที่สุดในโดเมนและหากมีความสัมพันธ์ให้เลือกตัวแปรที่มีผลต่อตัวแปรอื่น ๆ ส่วนใหญ่ ด้วยวิธีนี้หากขั้นตอนหลักในตัวแก้ปัญหาเลือกการมอบหมายที่ไม่ดีคุณมีโอกาสพบได้เร็วขึ้นและประหยัดเวลาหากคุณเลือกตัวแปรที่มีค่าน้อยที่สุดที่เหลือซึ่งส่งผลต่อสิ่งอื่น ๆ ส่วนใหญ่ สิ่งเหล่านี้เรียบง่ายชัดเจนและใช้งานง่าย ค่าที่ จำกัด น้อยที่สุดไม่ได้กำหนดไว้อย่างชัดเจนทุกที่ที่ฉันมอง ปัญญาประดิษฐ์: วิธีการที่ทันสมัย (Russel & Norvig) เพิ่งพูดว่า: มันชอบค่าที่ออกกฎตัวเลือกน้อยที่สุดสำหรับตัวแปรใกล้เคียงในกราฟข้อ จำกัด การค้นหา "ค่า จำกัด อย่างน้อยที่สุด" ปรากฏเฉพาะการนำเสนอภาพนิ่งของมหาวิทยาลัยจำนวนมากตามหนังสือเล่มนี้เท่านั้นโดยไม่มีข้อมูลเพิ่มเติมเกี่ยวกับวิธีการทำอัลกอริธึม ตัวอย่างเดียวที่ให้สำหรับฮิวริสติกนี้คือกรณีที่ตัวเลือกหนึ่งค่ากำจัดตัวเลือกทั้งหมดสำหรับตัวแปรข้างเคียงและตัวเลือกอื่นไม่ได้ ปัญหาของตัวอย่างนี้คือมันเป็นกรณีเล็กน้อยซึ่งจะถูกกำจัดทันทีเมื่อการตรวจสอบการมอบหมายที่อาจเกิดขึ้นนั้นสอดคล้องกับข้อ จำกัด ของปัญหา ดังนั้นในตัวอย่างทั้งหมดที่ฉันสามารถหาได้ฮิวริสติกที่มีข้อ จำกัด น้อยที่สุดไม่ได้มีประโยชน์ต่อประสิทธิภาพของตัวแก้ปัญหา แต่อย่างใดยกเว้นผลกระทบเล็กน้อยจากการเพิ่มการตรวจสอบซ้ำซ้อน สิ่งเดียวที่ฉันคิดได้ก็คือการทดสอบการกำหนดค่าที่เป็นไปได้ของตัวแปรข้างเคียงสำหรับการมอบหมายแต่ละครั้งและนับจำนวนการมอบหมายที่เป็นไปได้ของเพื่อนบ้านที่มีอยู่สำหรับการมอบหมายที่เป็นไปได้ของแต่ละตัวแปรจากนั้นเรียงลำดับค่าสำหรับตัวแปรนี้ …

1
ความหมายของปัจจัยส่วนลดต่อการเรียนรู้เสริมแรง
หลังจากอ่านความสำเร็จของgoogle deepmind ในเกมของอาตาริฉันพยายามเข้าใจ q-learning และ q-Networks แต่ฉันสับสนเล็กน้อย ความสับสนเกิดขึ้นในแนวคิดของปัจจัยส่วนลด สรุปโดยย่อของสิ่งที่ฉันเข้าใจ โครงข่ายประสาทเทียมแบบฝังลึกจะใช้ในการประเมินมูลค่าของค่าที่คาดหวังที่เหมาะสมที่สุดของการกระทำ เครือข่ายต้องลดฟังก์ชั่นการสูญเสียให้น้อยที่สุด โดยที่ E s ′ [ y | s , a ]คือ E [ r + γ m a x a ′ Q ( s ′ , a ′ ; θ - i ) | s,a] โดยที่Qคือค่าคะแนนสะสมและrคือค่าคะแนนสำหรับการกระทำที่เลือก s,aและ sLi=Es,a,r[(Es′[y|s,a]−Q(s,a;θi))2]Li=Es,a,r[(Es′[y|s,a]−Q(s,a;θi))2] L_i=\mathbb{E}_{s,a,r}\left[(\mathbb{E}_{s'}\left[y|s,a\right]-Q(s,a;\theta_i))^2\right] …

2
เครื่องมือแก้เขาวงกตสายตาสั้นที่เหมาะสมที่สุด
ฉันหลงกลไปกับการสาธิตเขาวงกตของ Google Blockyและจดจำกฎเดิม ๆ ว่าหากคุณต้องการแก้ปัญหาเขาวงกตเพียงแค่ถือมือซ้ายไว้กับกำแพง มันใช้งานได้สำหรับเขาวงกตที่เชื่อมต่อง่าย ๆ และสามารถใช้งานได้โดยตัวแปลงสัญญาณไฟไนต์ จำกัด ให้หุ่นยนต์ของเราเป็นตัวแทนของทรานสดิวเซอร์โดยดำเนินการดังต่อไปนี้และสิ่งที่สังเกตได้: การดำเนินการ: ไปข้างหน้า ( ) เลี้ยวซ้าย ( ← ) เลี้ยวขวา ( → )↑↑\uparrow←←\leftarrow→→\rightarrow สิ่งที่สังเกตได้: กำแพงข้างหน้า ( ), ไม่มีกำแพงข้างหน้า ( ⊤ )⊥⊥\bot⊤⊤\top จากนั้นเราสามารถสร้างช่างแก้ตัวทางซ้ายมือเป็น (อภัยรูปวาดขี้เกียจของฉัน): การเห็นสิ่งที่สังเกตได้จะทำให้เราติดตามสถานะที่เหมาะสมออกไปจากรัฐในขณะดำเนินการกระทำที่เกี่ยวข้องกับขอบนั้น หุ่นยนต์นี้จะแก้เขาวงกตที่เชื่อมต่อทั้งหมดแม้ว่ามันอาจจะใช้เวลาหลังจากการตาย เราเรียกว่าหุ่นยนต์อื่นดีกว่าAถ้า:BBB AAA ใช้ขั้นตอนเพิ่มเติมอย่างเคร่งครัดในจำนวน จำกัด เท่านั้นเขาวงกตและBBB ใช้ขั้นตอนน้อยลงอย่างเคร่งครัด (โดยเฉลี่ยสำหรับตัวแปรที่น่าจะเป็น) กับจำนวนเขาวงกตที่ไม่ จำกัดBBB คำถามสองข้อของฉัน: มีหุ่นยนต์ จำกัด ที่ดีกว่าที่วาดไว้ข้างต้นหรือไม่? จะเกิดอะไรขึ้นถ้าเรายอมให้ตัวแปลงสัญญาณที่น่าจะเป็น มีหุ่นยนต์ จำกัด …

1
โครงข่ายประสาทควรมีกี่ชั้น
มีข้อดีของการมีเลเยอร์ที่ซ่อนอยู่มากกว่า 2 เลเยอร์ใน Neural Network หรือไม่? ฉันเคยเห็นบางแห่งที่แนะนำแล้วบางแห่งพิสูจน์ว่าไม่มีประโยชน์ อันไหนที่ถูก?

3
เคล็ดลับเคอร์เนลสำหรับเครือข่ายประสาท
ฉันได้เรียนรู้เกี่ยวกับโครงข่ายประสาทและ SVM แล้ว บทเรียนที่ฉันอ่านได้เน้นว่าการสร้างเคอร์เนลมีความสำคัญเพียงใดสำหรับ SVM หากไม่มีฟังก์ชั่นเคอร์เนล SVMs เป็นเพียงลักษณนามเชิงเส้น ด้วยการสร้างเคอร์เนล SVM สามารถรวมคุณสมบัติที่ไม่ใช่เชิงเส้นซึ่งทำให้ตัวแยกประเภทมีประสิทธิภาพมากขึ้น ดูเหมือนว่าฉันจะใช้เคอร์เนลกับเครือข่ายประสาทได้ แต่ไม่มีบทเรียนเกี่ยวกับโครงข่ายประสาทเทียมที่ฉันเคยเห็นมาแล้ว คนทั่วไปมักจะใช้เคล็ดลับเคอร์เนลกับเครือข่ายประสาทเทียมหรือไม่? ฉันคิดว่าบางคนต้องทดลองกับมันเพื่อดูว่ามันสร้างความแตกต่างใหญ่หรือไม่ การแบ่งเคอร์เนลช่วยเครือข่ายประสาทเทียมได้มากเท่ากับ SVM หรือไม่? ทำไมหรือทำไมไม่? (ฉันสามารถจินตนาการได้หลายวิธีในการรวมเคล็ดลับเคอร์เนลลงในเครือข่ายประสาทเทียมวิธีหนึ่งคือการใช้ฟังก์ชันเคอร์เนลที่เหมาะสมเพื่อประมวลผลอินพุตล่วงหน้าซึ่งเป็นเวกเตอร์ใน RnRn\mathbb{R}^nลงในอินพุตที่มีมิติสูงกว่าเวกเตอร์ใน Rม.Rm\mathbb{R}^{m} สำหรับ ม≥ nm≥nm\ge n. สำหรับตาข่ายหลายชั้นเลเยอร์อีกทางเลือกหนึ่งคือการใช้ฟังก์ชันเคอร์เนลในแต่ละระดับของเครือข่ายประสาท)

1
ทำไมน้ำหนักของ Neural Networks เริ่มต้นด้วยตัวเลขสุ่ม?
ทำไมน้ำหนักเริ่มต้นของโครงข่ายประสาทเทียมเริ่มต้นเป็นตัวเลขแบบสุ่ม? ฉันได้อ่านที่ไหนสักแห่งว่าสิ่งนี้ทำเพื่อ "ทำลายความสมมาตร" และทำให้เครือข่ายประสาทเทียมเรียนรู้เร็วขึ้น การทำลายความสมมาตรทำให้การเรียนรู้เร็วขึ้นอย่างไร จะไม่เริ่มต้นน้ำหนักเป็น 0 เป็นความคิดที่ดีกว่าไหม ด้วยวิธีนี้น้ำหนักจะสามารถค้นหาค่าของพวกเขา (ไม่ว่าจะเป็นบวกหรือลบ) ได้เร็วขึ้น? มีปรัชญาพื้นฐานอื่น ๆ ที่อยู่เบื้องหลังการสุ่มน้ำหนักนอกเหนือจากการหวังว่าพวกเขาจะใกล้เคียงกับค่าสูงสุดของพวกเขาเมื่อเริ่มต้นหรือไม่

2
คณิตศาสตร์ใดที่น่าสนใจสำหรับสาขา CS เหล่านี้
สำหรับปริญญา CS ของฉันฉันมีภูมิหลังทางคณิตศาสตร์ "มาตรฐาน" เป็นส่วนใหญ่: แคลคูลัส: อนุพันธ์, อินทิกรัล, จำนวนเชิงซ้อน พีชคณิต: แนวความคิดจนกระทั่งทุ่ง ทฤษฎีจำนวน: XGCD และสิ่งที่เกี่ยวข้องส่วนใหญ่สำหรับ crypto พีชคณิตเชิงเส้น: จนถึง eigenvector / eigenvalues สถิติ: ความน่าจะเป็นการทดสอบ ลอจิก: เชิงประพจน์ภาคคำกริยาลูกผสม ความสนใจหลักของฉันในพื้นที่ CS คือความปลอดภัยการเข้ารหัสและปัญญาประดิษฐ์ ฉันสงสัยว่ามีคำแนะนำใด ๆ สำหรับหัวข้อทางคณิตศาสตร์ที่น่าสนใจสำหรับสาขาเหล่านี้โดยเฉพาะอย่างยิ่งสำหรับ AI เนื่องจากไม่ใช่สาขาการศึกษาหลักของฉันในขณะนี้

1
อัลกอริทึมโครงข่ายใยประสาทเทียมสามารถแสดงในรูปของการดำเนินการลดแผนที่ได้หรือไม่?
อัลกอริทึมโครงข่ายใยประสาทเทียมสามารถแสดงในรูปของการดำเนินการลดแผนที่ได้หรือไม่? ฉันสนใจวิธีการแบบขนานมากขึ้นเช่นเดียวกับที่ใช้กับ ANNs และแอปพลิเคชันของพวกเขาในการประมวลผลแบบคลาวด์ ฉันคิดว่าวิธีการหนึ่งจะเกี่ยวข้องกับการใช้ ANN แบบเต็มในแต่ละโหนดและรวมผลลัพธ์เพื่อรักษากริดเหมือนเอนทิตีเดียว (ในแง่ของอินพุต / เอาท์พุตและลักษณะการเรียนรู้ของเครื่อง) กลยุทธ์การบูรณาการดังกล่าวอาจมีลักษณะอย่างไร
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.