ฐานความรู้มีบทบาทอย่างไรในขณะนี้และจะเล่นในอนาคต


13

ทุกวันนี้ปัญญาประดิษฐ์นั้นเกือบจะเท่ากับการเรียนรู้ของเครื่องโดยเฉพาะอย่างยิ่งการเรียนรู้ลึก บางคนกล่าวว่าการเรียนรู้อย่างลึกซึ้งจะแทนที่ผู้เชี่ยวชาญมนุษย์ซึ่งเป็นเรื่องสำคัญมากสำหรับวิศวกรรมฟีเจอร์ในสาขานี้ มันก็บอกว่าสองนวัตกรรมการสนับสนุนการเพิ่มขึ้นของการเรียนรู้ลึก: บนมือข้างหนึ่งประสาทและneuroplasticityโดยเฉพาะบอกเราว่าเหมือนสมองมนุษย์ซึ่งเป็นพลาสติกสูงสามารถใช้เครือข่ายประดิษฐ์เพื่อทำหน้าที่เกือบทุกแบบ ในทางตรงกันข้ามการเพิ่มขึ้นของพลังการคำนวณโดยเฉพาะอย่างยิ่งการแนะนำของ GPU และ FPGA ได้เพิ่มความฉลาดทางอัลกอริธึมในแบบที่งดงามและได้สร้างแบบจำลองที่สร้างขึ้นมาหลายสิบปีที่ผ่านมา ฉันจะเพิ่มว่าข้อมูลขนาดใหญ่ (ส่วนใหญ่เป็นข้อมูลที่มีป้ายกำกับ) ที่สะสมในช่วงหลายปีที่ผ่านมาก็มีความเกี่ยวข้องเช่นกัน

การพัฒนาดังกล่าวทำให้การมองเห็นคอมพิวเตอร์ (และการจดจำเสียง) เข้าสู่ยุคใหม่ แต่ในการประมวลผลภาษาธรรมชาติและระบบผู้เชี่ยวชาญสถานการณ์ไม่ได้เปลี่ยนแปลงไปมากนัก

การใช้สามัญสำนึกสำหรับเครือข่ายประสาทนั้นเป็นเรื่องที่ค่อนข้างสูง แต่ประโยคการสนทนาและข้อความสั้น ๆ ส่วนใหญ่มีการอนุมานที่ควรดึงออกมาจากความรู้พื้นฐานของโลก ดังนั้นการสร้างกราฟความรู้จึงมีความสำคัญอย่างยิ่งต่อปัญญาประดิษฐ์ โครงข่ายประสาทเทียมสามารถควบคุมได้ในการสร้างฐานความรู้ แต่ดูเหมือนว่าโมเดลโครงข่ายใยประสาทเทียมนั้นมีปัญหาในการใช้ฐานความรู้ที่สร้างขึ้นเหล่านี้

คำถามของฉันคือ:

  1. ฐานความรู้ (ตัวอย่างเช่น "กราฟความรู้" ที่ประกาศโดย Google) เป็นสาขาที่มีแนวโน้มใน AI หรือไม่ ถ้าเป็นเช่นนั้น KB สามารถเสริมศักยภาพการเรียนรู้ของเครื่องได้อย่างไร เราจะรวมตัวแปรแฝงแบบแยกเป็นส่วน ๆ ลงใน NLU และ NLG ได้อย่างไร

  2. เพื่อความอยู่รอดในยุคที่มีการปกครองโดย DL ทิศทางของฐานความรู้ (หรือแนวทางสัญลักษณ์ของคำร่ม) อยู่ที่ไหน? คือวุลแฟรมฐานความรู้แบบไดนามิก Z เหมือนทิศทางใหม่? หรือทิศทางใหม่?

ฉันขาดพื้นฐานบางอย่างหรือมีแนวคิดบางอย่างที่จัดการปัญหาเหล่านี้หรือไม่


ฉันทำงานให้กับ บริษัท ไอทีรายใหญ่ที่ครั้งหนึ่งเคยทำการตลาดผลิตภัณฑ์ AI ปัญหาเกี่ยวกับโครงข่ายประสาทเทียมคือไม่มีฐานความรู้ต่อคน ดังนั้นหากไม่มีกฎใด ๆ เป็นไปไม่ได้ที่เครือข่ายประสาทจะอธิบายว่า "ทำไม" ฝึกอบรมโครงข่ายประสาทเทียมจากนั้นกำหนดกฎที่ซ้ำซ้อนกับเครือข่ายจะให้คำตอบแก่คุณ แต่ไม่มีรูปแบบของการเรียนรู้ของเครื่องที่ตอนนี้สามารถพฤติกรรมดังกล่าวได้
MaxW

ใช่. ใน บริษัท ของเราบอทแชทที่สนับสนุนโดย NN เท่านั้นนั้นโง่มาก ๆ
Lerner Zhang

ฉันพบบทความนี้: arxiv.org/abs/1702.01932
Lerner Zhang

คำตอบ:


4

ก่อนอื่นฉันอยากจะชี้ให้เห็นความแตกต่างหลักระหว่างฐานความรู้และการเรียนรู้ของเครื่อง (ลึก) โดยเฉพาะอย่างยิ่งเมื่อจุดเน้นหลักคือ "AI" ไม่ใช่ "วิทยาศาสตร์ข้อมูล":

  • NN เป็นเหมือนกล่องดำ แม้ว่าพวกเขาจะเรียนรู้ชุดข้อมูลและได้รับพลังของการสรุปทั่วโดเมนปัญหาคุณไม่เคยรู้ว่าพวกเขากำลังทำงาน หากคุณพิจารณารายละเอียดของรูปแบบที่พัฒนาขึ้นทั้งหมดที่คุณเห็นคือตัวเลขน้ำหนักการเชื่อมต่อที่ไม่ดีและแข็งแรงและฟังก์ชันการแปลง ขั้นตอน "การดึงฟีเจอร์" ก่อนที่ขั้นตอนการฝึกอบรมจะบอกคุณอย่างแท้จริง: "เฮ้มนุษย์พอกับโลกที่ซับซ้อนของคุณมาเริ่มเป็นศูนย์และอัน" ในกรณีของ DL มันแย่กว่า! เราไม่เห็นว่าคุณสมบัติที่เลือกและมีประสิทธิภาพคืออะไร ฉันไม่ใช่ผู้เชี่ยวชาญ DL แต่เท่าที่ฉันรู้กล่องดำของ DL นั้นมืดกว่า! แต่ฐานความรู้เขียนด้วยภาษาที่เป็นมิตรกับมนุษย์ หลังจากขั้นตอนการสะสมความรู้คุณสามารถเห็นการเชื่อมต่อทั้งหมดระหว่างเอนทิตี้และที่สำคัญกว่า คุณสามารถตีความการเชื่อมต่อเหล่านั้น ถ้าคุณตัดลวดในฐานความรู้โมเดลของคุณจะสูญเสียพลังงานไปเล็กน้อยและคุณรู้ว่ามันจะสูญเสียอะไร ตัวอย่างเช่นการตัดการเชื่อมต่อโหนด "พลูโต" จากโหนด "ระบบสุริยะ" จะบอกโมเดลของคุณว่า deGrasse Tyson บอกอะไรเรา แต่ในแบบจำลอง ML นี่อาจเปลี่ยนเป็นแบบไร้ประโยชน์อันบริสุทธิ์: เกิดอะไรขึ้นถ้าคุณจัดการการเชื่อมต่อระหว่างหมายเลขเซลล์ประสาท 14 และ 47 ในแบบจำลอง NN ที่ใช้ในการทำนายว่าดาวเคราะห์ใดเป็นของระบบสุริยะ?!

  • รุ่น ML เป็นเพียงข้อมูลที่จารึกไว้ พวกเขาไม่มีพลังในการอนุมานและพวกเขาก็ไม่ให้คุณ ในขณะที่ฐานความรู้นั้นมีความสามารถในการอนุมานจากความรู้เดิมตามที่คุณระบุไว้ในคำถามของคุณ แสดงให้เห็นว่ารุ่น DL ที่ผ่านการฝึกอบรมด้วยข้อมูลการจำแนกภาพว่าสามารถนำไปใช้กับปัญหาการตรวจจับเสียงได้ แต่นี่ไม่ได้หมายความว่ารุ่น DL สามารถใช้ความรู้เดิมในโดเมนของภาพกับโดเมนของเสียง

  • คุณต้องการกิโลไบต์ของข้อมูลสำหรับอัลกอริธึม ML ดั้งเดิมและตันข้อมูลสำหรับ DL แต่อินสแตนซ์เดียวของชุดข้อมูลจะสร้างฐานความรู้ที่มีความหมายสำหรับคุณ

มีหัวข้อการวิจัยหลักสองหัวข้อใน NLP: การแปลด้วยคอมพิวเตอร์และการตอบคำถาม แสดงให้เห็นว่าในทางปฏิบัติแล้ว DL สามารถทำงานได้อย่างมีนัยสำคัญกับปัญหาการแปลด้วยคอมพิวเตอร์ แต่ทำตัวโง่ ๆ ในการตอบคำถามที่ท้าทายโดยเฉพาะอย่างยิ่งเมื่อโดเมนของหัวข้อที่ครอบคลุมในการสนทนาระหว่างมนุษย์กับเครื่องจักรนั้นกว้าง ฐานความรู้ไม่ใช่ทางเลือกที่ดีสำหรับการแปลด้วยเครื่อง แต่อาจเป็นกุญแจสำคัญในการตอบคำถามที่สูงส่ง เนื่องจากสิ่งที่สำคัญในการแปลด้วยเครื่องเป็นเพียงข้อความฉบับแปล (และฉันไม่สนใจว่าบนโลกจะมีเครื่องทำเท่าที่มันเป็นจริง) แต่ในการตอบคำถามฉันไม่ต้องการนกแก้วที่ ทำซ้ำข้อมูลเดิมที่ฉันให้ไว้กับเขา แต่สิ่งมีชีวิตอัจฉริยะที่ให้ฉัน "แอปเปิ้ลกินได้" หลังจากที่ฉันบอกเขาว่า "แอปเปิ้ลเป็นผลไม้" และ "


ผลไม้ทุกชนิดนั้นกินได้ตราบใดที่พวกเขาไม่ได้เปรียบเทียบผลไม้เหล่านั้นเป็น "แรงงาน" (จากนั้นอีกครั้งเราสามารถใช้ "devour" ในแง่ที่เป็นอุปมาได้เช่นเมื่อคนหนึ่งกินคำตอบที่ซ้อนกัน "อร่อย" และย่อยเนื้อหาของมัน)
DukeZhou
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.