ชุดข้อมูลการวิเคราะห์เครือข่ายแบบคลาสสิก


10

มีชุดข้อมูลคลาสสิกหลายชุดสำหรับการจัดหมวดหมู่ / การถดถอยของการเรียนรู้ของเครื่อง ความนิยมมากที่สุดคือ:

แต่ไม่มีใครรู้ชุดข้อมูลที่คล้ายกันสำหรับการวิเคราะห์เครือข่าย / ทฤษฎีกราฟ? เป็นรูปธรรมมากขึ้น - ฉันกำลังมองหาชุดข้อมูลมาตรฐานทองคำสำหรับการเปรียบเทียบ / การประเมิน / การเรียนรู้:

  1. มาตรการศูนย์กลาง
  2. อัลกอริทึมการจัดกลุ่มเครือข่าย

ฉันไม่ต้องการรายการเครือข่าย / กราฟจำนวนมากที่เปิดเผยต่อสาธารณชน แต่มีชุดข้อมูลที่ต้องรู้สองสามรายการ

แก้ไข:

มันค่อนข้างยากที่จะให้คุณสมบัติที่แน่นอนสำหรับ "ชุดข้อมูลมาตรฐานทองคำ" แต่นี่เป็นความคิดบางอย่าง ฉันคิดว่าชุดข้อมูลคลาสสิกที่แท้จริงควรเป็นไปตามเกณฑ์เหล่านี้:

  • การอ้างอิงหลายบทความและตำรา
  • รวมอยู่ในแพ็คเกจซอฟต์แวร์การวิเคราะห์เครือข่ายที่มีชื่อเสียง
  • เวลาที่เพียงพอในการดำรงอยู่;
  • การใช้งานในหลายหลักสูตรเกี่ยวกับการวิเคราะห์กราฟ

เกี่ยวกับสาขาที่ฉันสนใจฉันต้องการคลาสที่ติดป้ายกำกับสำหรับจุดยอดและ / หรือ "คะแนนผู้มีอำนาจ" ที่กำหนดไว้ล่วงหน้า (หรือที่กำหนดไว้ล่วงหน้า) (เช่นการประมาณค่าส่วนกลาง) หลังจากถามคำถามนี้ฉันค้นหาต่อไปและนี่คือตัวอย่างที่เหมาะสม:

  • สโมสรคาราเต้ของ Zachary : เปิดตัวในปี 1977 อ้างมากกว่า 1.5 พันเท่า (อ้างอิงจาก Google Scholar) จุดสุดยอดมีแอตทริบิวต์ Faction (ซึ่งสามารถใช้สำหรับการจัดกลุ่ม)
  • เครือข่าย Erdos Collaboration : โชคไม่ดีที่ฉันไม่พบเครือข่ายนี้ในรูปแบบของไฟล์ข้อมูล แต่มันค่อนข้างมีชื่อเสียงและถ้าใครบางคนจะเสริมสร้างเครือข่ายด้วยข้อมูลเฉพาะทางของนักคณิตศาสตร์ก็สามารถใช้สำหรับทดสอบอัลกอริธึมการจัดกลุ่ม

1
ฉันคิดว่าคุณสามารถปรับปรุงคำถามนี้ได้ด้วยการกำหนด "ชุดข้อมูลมาตรฐานทองคำ" ในรูปแบบที่เป็นกลางกว่า อะไรทำให้ "ต้องรู้"? ควรอ้างอิงในหนังสือเรียนจำนวนหนึ่งหรือไม่ ใช้ในรุ่นที่เผยแพร่จำนวนมากหรือไม่ เป็นต้นมิฉะนั้นคำตอบจะเป็นอัตนัยและพวกเขาจะเปลี่ยนเมื่อเวลาผ่านไป การรวมกันที่ไม่ดีที่นี่
อากาศ

คำตอบ:


5

สิ่งที่คุณกำลังค้นหาสามารถพบได้ในKONECT (เว็บไซต์ไม่ทำงานเนื่องจากฉันกำลังเขียนสิ่งนี้ แต่ควรได้รับการแก้ไขในไม่ช้า!) เป็นการรวบรวมข้อมูลที่ครอบคลุมที่สุดสำหรับการวิเคราะห์เครือข่าย แต่คำถามก็คือคำถามใดที่เป็นมาตรฐานที่จะใช้มากกว่านี้?

ไม่มีคำตอบที่ชัดเจนยกเว้นคาราเต้คลับของ Zachary!

หากคุณทำการตรวจสอบวรรณกรรมในอัลกอริทึมการตรวจจับชุมชนคุณจะเห็นว่าเอกสารที่ส่องแสงเกือบทั้งหมดใช้เครือข่ายที่แตกต่างกัน คำแนะนำของฉันคือสิ่งที่ Andrea Lancichinetti และ Santo Fortunato ทำเพื่อเปรียบเทียบกราฟ พวกเขาเสนอบางมาตรฐานกราฟอัลกอริทึมรุ่นเช่นนี้

หวังว่าจะช่วย :)


คุณสามารถค้นหาสิ่งนี้ผ่านเครื่องเวย์แบ็ค
อัลเบิร์ต


1

สิ่งเดียวที่ฉันรู้คือข้อมูลมาตรฐานสำหรับฐานข้อมูลกราฟเช่น Neo4j

คุณอาจพบลิงค์ที่คล้ายกับลิงค์นี้: http://istc-bigdata.org/index.php/benchmarking-graph-database/

ที่ซึ่งคุณสามารถค้นหาข้อมูลเพื่อทดสอบการวิเคราะห์เครือข่ายและทฤษฎีกราฟ

นอกจากนี้คุณสามารถเล่นกับ API ของ Twitter / Facebook เพื่อรวบรวมข้อมูลของคุณเอง นี่เป็นคำแนะนำในกรณีที่คุณไม่พบข้อมูลที่ต้องการ


ขอบคุณ แต่มันไม่ใช่สิ่งที่ฉันกำลังมองหา ดูการอัปเดตสำหรับรายละเอียดเพิ่มเติม
sobach
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.