การดึงข้อมูลเป็นเรื่องเกี่ยวกับการคืนข้อมูลที่เกี่ยวข้องกับการสืบค้นหรือสาขาที่สนใจ โปรดทราบว่าข้อมูลนี้อาจอยู่ในรูปแบบของเอกสารทั่วไปเครื่องมือค้นหานั่นเองเป็นตัวอย่างที่โดดเด่นของงานดังกล่าว ฉันจะบอกว่าเอนทิตีที่สำคัญที่สุดที่จำได้สำหรับการดึงข้อมูลคือชุดเอกสาร / ข้อมูลเริ่มต้นและเคียวรีที่ระบุ "สิ่งที่ต้องการค้นหา"
ในทางตรงกันข้ามการดึงข้อมูลนั้นเป็นเรื่องเกี่ยวกับการดึง (หรืออนุมาน) ความรู้ทั่วไป (หรือความสัมพันธ์) จากชุดของเอกสารหรือข้อมูล โปรดทราบว่าเนื้อหาทั้งหมดของเอกสารถือได้ว่าเป็นคลังข้อมูลทั้งหมดที่ดึงความรู้ออกมา แน่นอนสำหรับกรณีนี้คุณสามารถระบุสิ่งที่คุณต้องการแยกได้ แต่มันเป็นเรื่องของคุณสมบัติ / ความสัมพันธ์มากกว่าวิชา / หัวข้อที่เฉพาะเจาะจง คุณสมบัติเป็นโดเมนเฉพาะเจาะจงมากขึ้นในขณะที่ความสัมพันธ์โดยทั่วไปครอบคลุมสถานการณ์ทั่วไปมากขึ้น
อีกครั้งกับเครื่องมือค้นหาที่คุณขอให้เว็บไซต์ที่มีแนวโน้มมากที่สุดที่จะมีข้อมูลเกี่ยวกับเรื่องเฉพาะ นี่คือตัวอย่างของการดึงข้อมูล
สำหรับการดึงข้อมูลคุณสามารถขอให้แยกชื่อเมืองหรือที่อยู่อีเมลทั้งหมดที่ปรากฏในคลังเอกสาร คุณสามารถทำได้ทั่วๆไปอีกหน่อยขอแค่ดึงความรู้ออกมา อย่างที่คุณเห็นนี่เป็นเรื่องธรรมดาจริงๆ แต่ก็สามารถทำได้เช่นโดยได้รับแบบฟอร์มสามเรื่องของแอ็คชั่น - วัตถุ - วัตถุสำหรับแต่ละประโยคที่ถูกต้องของข้อความ (เหมาะที่สุดสำหรับข้อความภาษาธรรมชาติ)
หากคุณสนใจเหล่านี้ (และอื่น ๆ ) หัวข้ออธิบายในรายละเอียดในบทที่ประมวลผลภาษาธรรมชาติของหนังสือเล่มนี้Arti ficial หน่วยสืบราชการลับ: วิธีโมเดิร์น