คำถามติดแท็ก proofs

2
เหตุใดการเรียนรู้แบบ Q ถึงไม่รวมกันเมื่อใช้การประมาณฟังก์ชั่น
อัลกอริทึม Q-learning แบบมีตารางรับประกันว่าจะหาสิ่งที่ดีที่สุด QQQ ฟังก์ชั่น Q∗Q∗Q^*ให้เงื่อนไขต่อไปนี้ (เงื่อนไขRobbins-Monro ) เกี่ยวกับอัตราการเรียนรู้เป็นที่พอใจ ∑tαt(s,a)=∞∑tαt(s,a)=∞\sum_{t} \alpha_t(s, a) = \infty ∑tα2t(s,a)&lt;∞∑tαt2(s,a)&lt;∞\sum_{t} \alpha_t^2(s, a) < \infty ที่ไหน αt(s,a)αt(s,a)\alpha_t(s, a) หมายถึงอัตราการเรียนรู้ที่ใช้เมื่ออัปเดต QQQ ค่าที่เกี่ยวข้องกับรัฐ sss และการกระทำ aaa ในเวลาขั้นตอน tttที่ไหน 0≤αt(s,a)&lt;10≤αt(s,a)&lt;10 \leq \alpha_t(s, a) < 1 จะถือว่าเป็นจริงสำหรับทุกรัฐ sss และการกระทำ aaa. เห็นได้ชัดว่า 0≤αt(s,a)&lt;10≤αt(s,a)&lt;10 \leq \alpha_t(s, a) < 1เพื่อให้ทั้งสองเงื่อนไขเป็นจริงคู่การกระทำของรัฐทุกคนจะต้องเข้าชมอย่างไม่สิ้นสุดบ่อยครั้ง: นี่คือที่ระบุไว้ในหนังสือเสริมการเรียนรู้: การแนะนำนอกเหนือจากข้อเท็จจริงที่ว่านี้ควรเป็นที่รู้จักอย่างกว้างขวางและเป็นเหตุผล เบื้องหลังการใช้งานของϵϵ\epsilon- …

8
พิสูจน์ว่าปัญญาประดิษฐ์ทั่วไปเป็นไปได้
มันถูกสันนิษฐานในวิทยาศาสตร์คอมพิวเตอร์ว่าจิตใจมนุษย์สามารถจำลองด้วยเครื่องทัวริงดังนั้นปัญญาประดิษฐ์ทั่วไป (AGI) จึงเป็นไปได้ การถือว่าเป็นอย่างอื่นคือการเชื่อในสิ่งลึกลับและความเชื่อลึกลับเป็นเท็จ ฉันไม่ทราบว่ามีข้อโต้แย้งอื่น ๆ ที่ AGI เป็นไปได้และข้อโต้แย้งข้างต้นอ่อนแอมาก มีหลักฐานที่เข้มงวดว่า AGI เป็นไปได้อย่างน้อยก็ในทางทฤษฎี? เราจะรู้ได้อย่างไรว่าทุกสิ่งที่จิตใจมนุษย์สามารถทำได้นั้นสามารถเข้ารหัสเป็นโปรแกรมได้?
11 philosophy  agi  proofs 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.