ฉันเพิ่งเจอกราฟการฝังเช่น DeepWalk และ LINE อย่างไรก็ตามฉันยังไม่มีความคิดที่ชัดเจนว่ากราฟ embeddings มีความหมายอย่างไรและควรใช้เมื่อใด (แอปพลิเคชัน) ข้อเสนอแนะใด ๆ ยินดีต้อนรับ!
ฉันเพิ่งเจอกราฟการฝังเช่น DeepWalk และ LINE อย่างไรก็ตามฉันยังไม่มีความคิดที่ชัดเจนว่ากราฟ embeddings มีความหมายอย่างไรและควรใช้เมื่อใด (แอปพลิเคชัน) ข้อเสนอแนะใด ๆ ยินดีต้อนรับ!
คำตอบ:
การฝังกราฟเรียนรู้การแมปจากเครือข่ายไปยังพื้นที่เวกเตอร์ในขณะที่รักษาคุณสมบัติเครือข่ายที่เกี่ยวข้อง
เวกเตอร์สเปซนั้นคล้อยตามศาสตร์ข้อมูลมากกว่ากราฟ กราฟมีขอบและโหนดความสัมพันธ์เครือข่ายเหล่านี้สามารถใช้เฉพาะส่วนย่อยของคณิตศาสตร์สถิติและการเรียนรู้ของเครื่อง ช่องว่างเวกเตอร์มีชุดเครื่องมือยิ่งขึ้นจากโดเมนเหล่านั้น นอกจากนี้การดำเนินการของเวกเตอร์มักจะง่ายและเร็วกว่าการดำเนินการทางกราฟที่เทียบเท่า
ตัวอย่างหนึ่งคือการค้นหาเพื่อนบ้านที่ใกล้ที่สุด คุณสามารถทำการ "กระโดด" จากโหนดหนึ่งไปอีกโหนดหนึ่งในกราฟ ในกราฟที่ใช้งานจริงหลายแห่งหลังจากมีการกระโดดสองสามครั้งมีข้อมูลที่มีความหมายเพียงเล็กน้อย (เช่นคำแนะนำจากเพื่อนของเพื่อนของเพื่อน) อย่างไรก็ตามในปริภูมิเวกเตอร์คุณสามารถใช้การวัดระยะทางเพื่อให้ได้ผลลัพธ์เชิงปริมาณ (เช่นระยะทางแบบยุคลิดหรือความคล้ายคลึงโคไซน์) หากคุณมีการวัดระยะทางเชิงปริมาณในพื้นที่เวกเตอร์ที่มีความหมายการหาเพื่อนบ้านที่ใกล้ที่สุดนั้นตรงไปตรงมา
" เทคนิคการฝังกราฟแอปพลิเคชันและประสิทธิภาพการทำงาน: แบบสำรวจ " เป็นบทความภาพรวมที่มีรายละเอียดมากขึ้น
งานแต่งงานกราฟคืออะไร? "Graph Embeddings" เป็นพื้นที่ร้อนแรงในการเรียนรู้ของเครื่อง โดยทั่วไปหมายถึงการค้นหา "การแทนเวกเตอร์แฝง" ของกราฟที่จับทอพอโลยี (ในแง่ที่พื้นฐานมาก) ของกราฟ เราสามารถทำให้ "การแสดงเวกเตอร์" สมบูรณ์ด้วยการพิจารณาถึงความสัมพันธ์ของจุดยอด - จุดยอดข้อมูลขอบ ฯลฯ มีงานแต่งงานประมาณสองระดับในกราฟ (ซึ่งแน่นอนว่าเราสามารถกำหนดระดับเพิ่มเติมได้ทุกเวลาโดยแบ่งกราฟทั้งหมดเป็นตรรกะ กราฟย่อยขนาดต่างๆ):
แอปพลิเคชั่น - โดยการมองอย่างระมัดระวัง embeddings คือการแสดง "แฝง" ซึ่งหมายความว่าหากกราฟมี | V | * | V | adjacency matrix โดยที่ | V | = 1M มันใช้งานยากหรือประมวลผลหมายเลข 1M * 1M ในอัลกอริทึม ดังนั้นการฝังมิติ 'แฝง' โดยที่ d << | V | จะทำให้เมทริกซ์ adjacency | V | * d และใช้งานง่ายขึ้น แอปพลิเคชันอื่นอาจเป็น - พิจารณาสถานการณ์สมมติแบบง่าย ๆ ที่เราต้องการแนะนำผลิตภัณฑ์ให้กับผู้ที่มีความสนใจคล้ายกันในเครือข่ายสังคมออนไลน์ ด้วยการใส่จุดสุดยอด (นี่หมายถึงการแทนเวกเตอร์ของแต่ละคน) เราสามารถหาคนที่คล้ายกันได้โดยการพล็อตเวกเตอร์เหล่านี้และทำให้การแนะนำง่ายขึ้น แอปพลิเคชั่นเหล่านี้บางแอปพลิเคชั่นและอื่น ๆ คุณสามารถดูกระดาษสำรวจความสุข - เทคนิคกราฟฝัง, การสำรวจ
มันมาจากที่ไหน? มีงานจำนวนมากในพื้นที่นี้และเกือบทั้งหมดมาจากการวิจัยที่ก้าวล้ำในสาขาการประมวลผลภาษาธรรมชาติ - "Word2Vec" โดย Mikolov หากคุณต้องการเริ่มต้นด้วยการวิจัยเกี่ยวกับงานแต่งงานกราฟฉันจะแนะนำให้เข้าใจก่อนว่า Word2Vec ทำงานอย่างไร คุณสามารถหาคำอธิบายที่ดี - Word2Vec การเรียนรู้พารามิเตอร์อธิบายและStanford บรรยาย จากนั้นคุณสามารถข้ามไปที่เอกสารที่คุณระบุไว้ ผลงานเหล่านี้สามารถแบ่งได้เป็น:
ทำงานบนพื้นฐานของ "Vertex embeddings": - DeepWalk , Node2Vec , สาย
ทำงานบนพื้นฐานของ "กราฟ embeddings": - ลึกกราฟเมล็ด , Subgraph2Vec
ในบทความทฤษฎีบทขีด จำกัด กลางสำหรับรถโดยสารฝังกราฟผลิตภัณฑ์แบบจุดโดย Levin et.al กระดาษการฝังกราฟชนิดเฉพาะ (การฝังแถบ Omnibus) กำหนดกราฟการฝังเป็นวิธีการ "ซึ่งจุดยอดของกราฟถูกแมปกับเวกเตอร์ในปริภูมิแบบยุคลิดแบบมิติต่ำ" ตรวจสอบลิงค์สำหรับข้อมูลเพิ่มเติม