AlphaZero เป็นตัวอย่างของ AGI หรือไม่


11

จากรายงานการวิจัยของ DeepMind ที่ arxiv.org:

ในบทความนี้เราใช้อัลกอริทึมที่คล้ายกัน แต่โดยทั่วไปซึ่งเราเรียกว่าAlphaZeroกับเกมหมากรุกและโชกิรวมถึง Go โดยไม่มีความรู้ด้านโดเมนเพิ่มเติมยกเว้นกฎของเกมแสดงให้เห็นว่าการเรียนรู้การเสริมแรงทั่วไป อัลกอรึทึมสามารถบรรลุได้, ตารางประสิทธิภาพ, ประสิทธิภาพเหนือมนุษย์ในหลาย ๆ โดเมนที่ท้าทาย

นี่หมายความว่า AlphaZero เป็นตัวอย่างของ AGI (Artificial General Intelligence) หรือไม่?

คำตอบ:


11

คำถามที่ดี!

  • AlphaZero ถึงแม้จะเป็นเหตุการณ์สำคัญ แต่ก็ไม่ได้เป็น AGI :)

AlphaGo แม้จะแข็งแกร่งในเกม Go แต่ก็มีความแข็งแกร่งแคบ ("AI strong-narrow AI") ซึ่งหมายถึงความแข็งแกร่งในปัญหาเดียวหรือประเภทของปัญหา (เช่น Go และเกมข้อมูลอื่นที่ไม่มีโอกาสและสมบูรณ์แบบ)

  • อย่างน้อยที่สุด AGI จะต้องมีความแข็งแกร่งเท่ากับมนุษย์ในทุกปัญหาที่ทำงานหรือแก้ไขโดยมนุษย์

AGI มักจะเกี่ยวข้องกับsuperintelligenceหมายถึงปัญญาที่เกินกว่าระดับของมนุษย์

AGI ไม่จำเป็นต้องหมายความซุปเปอร์ปัญญาในแง่ที่ว่าเราจะพิจารณาหุ่นยนต์ที่สามารถดำเนินกิจกรรมของมนุษย์ทุกคนที่มีความสามารถเช่นเดียวกับมนุษย์เป็นผู้ประดิษฐ์ทั่วไปหน่วยสืบราชการลับ

แต่ในทางเทคนิคแล้ว AlphaGo นั้นเป็นระบบที่ชาญฉลาดที่แคบเกินกว่าที่มนุษย์จะได้รับจากปัญหาเดียว


ไม่มีสติปัญญาที่แคบ เราเรียกมันว่าอ่อนแอ AI :) ไม่มีมนุษย์คนใดสามารถค้นพบการรวบรวม Microsoft Word หรือ Excel ที่เหมาะสมที่สุดในช่วงชีวิตของเขาในขณะที่เครื่องทันสมัยอาจใช้เวลาหลายชั่วโมง
Quonux

@Quonux ขึ้นอยู่กับคำนิยามฉันสงสัย ความหมายของคำว่าสติปัญญาของ Bostrom นั้นคล้ายคลึงกับปัญญาประดิษฐ์ทั่วไปอย่างคร่าวๆ แต่คำศัพท์นั้นพูดด้วยคำพูดแบบนิรุกติศาสตร์เพียงหมายถึง "ปัญญาที่สูงกว่า" หมายถึง "เหนือ + ปัญญา" อย่างแท้จริง ภายใต้คำจำกัดความพื้นฐานนี้ "AI strong-narrow" อาจมีความหมายเหมือนกันกับ "narrow superintelligence" ซึ่งคำจำกัดความดั้งเดิมของ "strong" นั้นคือ AGI ดังนั้นหลังจาก AlphaGo นักวิชาการเริ่มใช้ตัวระบุ "แคบ"
DukeZhou

@Quonux ส่วนหนึ่งของจุดของฉันที่นี่คือด้วยการถือกำเนิดของ AlphaGo คำว่า "อ่อนแอ" สำหรับ AI ที่เกินขีดความสามารถของมนุษย์ในงานเดียวดูเหมือนว่าจะถูกแทนที่ด้วย "AI รัดกุม"
DukeZhou

2

ข้อสันนิษฐานที่อาจไม่ถูกต้อง

มีข้อสมมติฐานสองข้อที่สามารถระบุได้ในน้ำเสียงของกระดาษ

  • ความท้าทายทางจิตทั้งหมดสามารถลดลงเป็นเกมที่มีกฎตายตัว
  • เครื่องจักรที่ดีกว่ามนุษย์คือสิ่งที่มนุษย์ต้องการหรือต้องการ

มีอีกสองตัวที่ระบุในคำถาม

  • ความฉลาดทั่วไปมีอยู่ในมนุษย์1
  • หากมีอยู่ในมนุษย์จึงเป็นไปได้ในคอมพิวเตอร์

ทั้งสี่อาจเป็นจริง แต่ไม่มีทั้งสี่อย่างแน่นอน

ผลผลิตของ AlphaZero

ถ้ากระดานหมากรุกของเราอยู่บนชั้นวางเกมในตู้เสื้อผ้าของเราหญ้าของเรานั้นยาวและเครื่องตัดหญ้าของเราจะหัก AlphaZero ถ้าเชื่อมต่อกับหุ่นยนต์ฮิวแมนนอยด์จะไม่มีกฎของเกมเข้ารหัสสำหรับลำดับงาน

  • ฟังคำขอของเจ้าของ
  • เรียนรู้วิธีการเรียนรู้หุ่นหุ่นยนต์
  • การหาและระบุเครื่องมือและอะไหล่ทั้งหมดของเรา
  • แก้ไขเครื่องตัดหญ้าและ
  • แจ้งให้เราทราบว่าเครื่องตัดหญ้าพร้อมใช้งานแล้ว

ดังนั้นจึงไม่มีคุณค่าของผู้บริโภคเป็นพิเศษสำหรับเราในสถานการณ์นั้น ไม่ธรรมดามาก

แม้ว่ามันจะสามารถตัดหญ้าด้วยเครื่องตัดหญ้าที่ทำงานแล้วมันจะมีค่าซึ่งไม่จำเป็นต้องมีความสามารถในการชนะอะไร แต่ความสามารถในการเชื่อฟังและแสดงสติปัญญาของมนุษย์ที่จำเป็นต้องไม่วิ่งข้ามเตียงดอกไม้

ว่าคนฉลาดของ DeepMind เลือกที่จะใช้ภาษาละตินกระดานรสามากกว่ากระดานชนวนว่างเปล่าเป็นเรื่องน่าทึ่ง แต่ไม่ได้เกือบเป็นที่ประทับใจเป็นการสร้างโปรแกรมการเรียนรู้ที่สามารถเรียนรู้ที่จะเล่นสามเกมดีมีเพียงกฎการเข้ารหัสและการเล่นเกมที่เกิดขึ้นจริงเป็น input

เพื่อพิจารณาโปรแกรมเกมเหล่านี้มีประโยชน์อย่างแท้จริงในพื้นที่ผลิตภัณฑ์หนึ่งไม่สามารถพึ่งพาความสนใจอย่างยั่งยืนในการซื้อซอฟต์แวร์ที่ชนะผู้ซื้อทุกครั้ง เพื่อให้ผลิตภัณฑ์ AI สามารถใช้งานได้คุณสมบัติการเรียนรู้จะต้องสามารถใช้สิ่งที่เรียกว่าสามัญสำนึกซึ่งต้องใช้ความรู้ในวงกว้างและยืดหยุ่นมากกว่ากฎตายตัวของเกม เราสามารถเดาได้ว่านักวิจัยส่วนใหญ่ที่ประสบความสำเร็จในการชนะการเรียนรู้การเล่นเกมกำลังผลักไปในทิศทางนั้น พวกเขาก็รู้ว่าผลการวิจัยของพวกเขาในที่สุดจะต้องมีการผลิตผลหรือนำไปสู่การเสนอขาย SaaS

สิ่งที่น่าประทับใจสำหรับผู้ที่อยู่นอกสนามคือหากความก้าวหน้าเหล่านี้สามารถเปลี่ยนเส้นทางในพื้นที่ศูนย์ข้อมูลเพื่อสร้างการบำบัดรักษาด้วยยีนที่สามารถรักษาได้เพื่อรักษาโรคมะเร็งหรือเริมหรือย้อนกลับไปเป็นเบาหวานหรืออัลไซเมอร์ จากนั้นเราสามารถให้อภัยนักวิจัยที่ไม่ให้การดาวน์โหลดแก่เราซึ่งจะทำให้หุ่นหุ่นต้นแบบทำความสะอาดห้องน้ำของเรา มันไม่ชัดเจนจากกระดาษที่ AlphaZero แสดงให้เห็นอย่างเพียงพอว่ามันแสดงให้เห็นว่า "ประสิทธิภาพเหนือมนุษย์ในหลายโดเมนที่ท้าทาย"

สิ่งที่พวกเขาทำก็ยังคงน่าประทับใจและเป็นไปตามที่คนอื่น ๆ ได้ทำเช่นกัน มีพวกเราบางคนที่กล้าลองสร้างเกมที่โปรแกรมการเรียนรู้เกมทั่วไปเหล่านี้จะไม่เรียนรู้เร็วและเอาชนะพวกเราภายในสองสามเกม

ดูความก้าวหน้าในมุมมอง

แน่นอนในการคำนวณทางคณิตศาสตร์, การเรียงลำดับจดหมาย, และตอนนี้เล่นเกม, การประดิษฐ์ของมนุษยชาติขยายความสามารถของมนุษย์ที่เปลือยเปล่า, ขาดเครื่องมือของเขา. ความคืบหน้าดังกล่าวทำให้ระบบคอมพิวเตอร์มั่นคงภายในขอบเขตของเครื่องมือ จอบกลับเป็นมนุษย์ในทางเกินไป พยายามที่จะวางท่อกิโลเมตรโดยไม่มีใคร

ในทางกลับกันมนุษยชาติมีบทบาทเป็นผู้ให้บริการด้านการดูแลสุขภาพสำหรับคอมพิวเตอร์ หากพวกเขาป่วยหรือล้มเหลวเราถูกบังคับให้ขับไล่ไวรัสและเวิร์มของพวกเขาหรือเปลี่ยนชิ้นส่วนที่ล้มเหลว มิฉะนั้นบ้านและธุรกิจของเราจะตกอยู่ในความระส่ำระสาย

เทคโนโลยีควรมองในมุมมองของทุกสิ่ง

มันจะเป็นการรอบคอบสำหรับมนุษย์ที่จะทำให้ติดใจในเกมน้อยลงและตีกันและให้ความสำคัญกับพฤติกรรมทางสังคมที่ร่วมมือกันที่มุ่งไปสู่การแก้ปัญหาสังคมและเศรษฐกิจด้วยเครื่องมือที่คิดค้นขึ้นใหม่และทำในลักษณะที่ไม่สร้างปัญหาใหม่หรือเชิญ ความโหดใหม่


เชิงอรรถ

สิ่งที่ได้รับการอธิบายว่าเป็นความฉลาดทั่วไปที่มีอยู่ในมนุษย์มีข้อโต้แย้งบนพื้นฐานของหลักฐานไปในทางตรงกันข้าม หลายคนจะกล่าวถึงกลยุทธ์และแนวโน้มเหล่านี้เป็นหลักฐานของข้อ จำกัด ต่อความฉลาดของมนุษย์

  • การยับยั้งนิวเคลียร์เป็นกลยุทธ์สันติภาพ
  • การขาดการกลั่นกรองอย่างสมบูรณ์ในการใช้ทรัพยากรพลังงานที่ จำกัด และเป็นพลังงานธรรมชาติที่สำคัญ
  • เพิ่มความหนาแน่นของรูปแบบการเสพติดอย่างต่อเนื่องทั่วโลก
  • ก่อให้เกิดการสูญพันธุ์ครั้งที่หกบนโลก

ขอบคุณสำหรับการแก้ไขมันจะดีกว่าวิธีนี้ (สำหรับฉันอย่างน้อย) ด้วยการมุ่งเน้นที่ส่วนทางเทคนิคของคำตอบ อาจมีคำถามที่แตกต่างกันเกี่ยวกับความต้องการเหตุผลหรือประสิทธิภาพของ AGI ที่สมบูรณ์แบบ ในทำนองเดียวกันมาตรฐานของพฤติกรรมของบุคคลหรือกลุ่มที่เราต้องการให้มนุษย์ - แม้ว่าจะไม่ได้สำหรับเว็บไซต์นี้เว้นแต่คำถามที่เฉพาะเจาะจงเกี่ยวกับการเปรียบเทียบกับปัญญาประดิษฐ์
Neil Slater
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.