EQ ของโปรแกรม AI สามารถวัดได้อย่างไร


9

โปรแกรม AI สามารถมี EQ (เชาวน์อารมณ์หรือความฉลาดทางอารมณ์) ได้หรือไม่?

กล่าวอีกนัยหนึ่งสามารถวัด EQ ของโปรแกรม AI ได้หรือไม่?

หาก EQ มีปัญหาในการวัดมากกว่า IQ (อย่างน้อยกับการประยุกต์มาตรฐานกับมนุษย์และโปรแกรม AI) ทำไมเป็นเช่นนั้น


คุณรู้จัก 'การทดสอบ EQ' สำหรับมนุษย์อย่างไร อะไรจะเป็นอุปสรรคในการนำพวกเขาไปใช้กับ AI?
NietzscheanAI

คำตอบ:


6

คำตอบสำหรับคำถามของคุณคือ "โดยหลักการแล้วใช่" - ในรูปแบบทั่วไปส่วนใหญ่การทดสอบ EQ เป็นเพียงกรณีเฉพาะของการทดสอบของทัวริง ("คุณจะรู้สึกอย่างไรกับ ... ?")

หากต้องการดูสาเหตุที่การทดสอบ EQ ที่มีความหมายอาจทำได้ยากให้พิจารณาการทดสอบที่เป็นไปได้สองแบบต่อไปนี้:

ด้วยความซับซ้อนที่ซับซ้อนอย่างหนึ่งภาพยนตร์ 'Blade Runner' ที่โด่งดังแสดงให้เห็นถึงการทดสอบเพื่อแยกแยะความแตกต่างระหว่างมนุษย์และ Android บนพื้นฐานของการตอบสนองต่อคำถามทางอารมณ์

หากคุณลองถามคำถามเหล่านี้ (หรือแม้แต่คำถามที่ง่ายกว่า) กับ chatbot สมัยใหม่คุณน่าจะสรุปได้อย่างรวดเร็วว่าคุณไม่ได้พูดคุยกับบุคคล

ปัญหาเกี่ยวกับการประเมิน EQ คือยิ่งการทดสอบทางอารมณ์มีความซับซ้อนมากเท่าใดระบบ AI ก็น่าจะต้องมีมากขึ้นเพื่อที่จะเปลี่ยนอินพุตให้เป็นตัวแทนที่มีความหมาย

อีกด้านหนึ่งจากด้านบนสมมติว่าการทดสอบ EQ นั้นใช้ถ้อยคำในรูปแบบที่มีโครงสร้างอย่างมากพร้อมกับโครงสร้างที่ได้รับจากมนุษย์ ในกรณีเช่นนี้ความสำเร็จใน 'การทดสอบ EQ' นั้นไม่ได้มีอยู่จริงในโลกแห่งความเป็นจริง

ในเรียงความเรื่อง "เอลิซ่าที่ไม่อาจกำจัดได้และอันตราย" Douglas Hofstadter ให้ตัวอย่างต่อไปนี้ซึ่งโปรแกรม ACME ถูกอ้างสิทธิ์ (ไม่ใช่โดย Hofstadter) เพื่อ 'ทำความเข้าใจ' การเปรียบเทียบ

ที่นี่คอมพิวเตอร์เรียนรู้เกี่ยวกับเพื่อนที่ชื่อ Sluggo พาภรรยาของเขาเจนและบั๊กบัดดี้ที่ดีของเขาไปที่บาร์ซึ่งสิ่งต่าง ๆ เกิดขึ้นตามธรรมชาติและเจนก็ตั้งท้องโดยบั๊ก เธอมีลูก แต่ไม่ต้องการและดังนั้นเมื่อได้รับความช่วยเหลือจากสามีของเธอเธอก็จมน้ำตายลูกในแม่น้ำดังนั้น "การแก้ไข" ปัญหา "ของแบมบี้อย่างเรียบร้อย

เรื่องนี้นำเสนอต่อ ACME ในรูปแบบต่อไปนี้:

ql: (neglectful-husband (Sluggo))
q2: (lonely-and-sex-starved-wife (Jane-Doe))
q3: (macho-ladykiller (Buck-Stag))
q4: (poor-innocent-little-fetus (Bambi))
q5: (takes-out-to-local-bar (Sluggo Jane-Doe Buck-Stag))
...
q11: (neatly-solves-the-problem-of (Jane-Doe Bambi))
q12: (cause (ql0 q11))

สมมติว่ารายการนั้นถูกถามว่าพฤติกรรมของ Jane Doe นั้นมีคุณธรรมหรือไม่ แนวคิดทางอารมณ์ที่ซับซ้อนเช่น 'ละเลย', 'เหงา' และ 'ไร้เดียงสา' อยู่ที่นี่ซึ่งเป็นเพียงภาคแสดงเท่านั้นไม่สามารถใช้ AI สำหรับการตรวจสอบเชิงลึก พวกเขาสามารถเปลี่ยนฉลากได้ง่ายเช่น 'bling-blang-blong15657'

ดังนั้นในแง่หนึ่งการไม่ประสบความสำเร็จในการทดสอบ EQ ด้วยความลึกใด ๆ นั้นบ่งบอกถึงปัญหาทั่วไปที่กำลังเผชิญอยู่ในปัจจุบันคือ AI: การไร้ความสามารถในการนิยาม (หรือเรียนรู้) การเป็นตัวแทนที่มีความหมายของความซับซ้อนที่ซับซ้อนของโลกมนุษย์ ซับซ้อนกว่าความสามารถในการรับรู้วิดีโอของแมว

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.