ฉันกำลังมองหาชุดข้อมูลเครือข่ายสังคมออนไลน์ (twitter, friendfeed, facebook, lastfm และอื่น ๆ ) สำหรับการจัดประเภทงานโดยเฉพาะอย่างยิ่งในรูปแบบ arff
การค้นหาของฉันผ่าน UCI และ Google ยังไม่ประสบความสำเร็จ ... คำแนะนำใด ๆ
ฉันกำลังมองหาชุดข้อมูลเครือข่ายสังคมออนไลน์ (twitter, friendfeed, facebook, lastfm และอื่น ๆ ) สำหรับการจัดประเภทงานโดยเฉพาะอย่างยิ่งในรูปแบบ arff
การค้นหาของฉันผ่าน UCI และ Google ยังไม่ประสบความสำเร็จ ... คำแนะนำใด ๆ
คำตอบ:
ดัชนีหน้าเพจ Facebook ขนาดใหญ่ถูกสร้างขึ้นและพร้อมใช้งานเป็นฝนตกหนัก (เป็น ~ 2.8Gb) http://btjunkie.org/torrent/Facebook-directory-personal-details-for-100-million-users/3979e54c73099d291605e7579b90838c2cd86a8e8675
ชุดข้อมูล Twitter ถูกติดแท็กใน Infochimps: http://infochimps.com/tags/twitter
ชุดข้อมูล lastfm มีให้ที่http://mtg.upf.edu/node/1671
เยี่ยมชมสถาบัน Max Planck พวกเขายังรวบรวมชุดข้อมูลหลายชุดสำหรับ OSN ด้วย
เพิ่งพบสิ่งนี้: 476 ล้านทวีต Twitter (ผ่าน@yarapavan )
เราได้รวบรวมชุดข้อมูล Twitter สำหรับเพื่อนของผู้ใช้ในปี 2009 และในปี 2009 คุณสามารถค้นหาข้อมูลเพิ่มเติมได้ที่นี่: http://strict.dista.uninsubria.it/?p=364
ตรวจสอบ kaggle.com พวกเขามีการแข่งขันบางอย่างเกี่ยวกับเครือข่ายสังคมและพวกเขาแจกชุดข้อมูล
นอกจากนี้ SNAP ของ Stanford ยังเป็นทรัพยากรที่ยอดเยี่ยมอีกด้วย และก็มีงานวิจัยในการบู๊ต
กราฟโซเชียล Facebook การติดตั้งแอปพลิเคชันและผู้ใช้ Last.fm กิจกรรมกลุ่มที่ http://odysseas.calit2.uci.edu/research/
ชุดข้อมูลสองชุด (รวบรวมเมื่อเดือนเมษายนถึงพฤษภาคม 2552) ซึ่งมีตัวอย่างตัวแทนของผู้ใช้ ~ 1 ล้านคนทั่วทั้ง Facebook พร้อมด้วยคุณสมบัติบันทึกย่อไม่กี่รายการ: สำหรับผู้ใช้ที่สุ่มตัวอย่างรายชื่อเพื่อนการตั้งค่าความเป็นส่วนตัวและการเป็นสมาชิกเครือข่าย ชุดข้อมูลชุดที่สาม (เก็บกุมภาพันธ์ 2008) รวมถึงกราฟ bipartite ที่แสดงถึงการติดตั้งแอปพลิเคชันโดยผู้ใช้ Facebook ชุดข้อมูลชุดที่สี่ที่มี Daily Active Users และการติดตั้งแอพพลิเคชั่นนานกว่า 6 เดือน (รวบรวมกันยายน 2550- กุมภาพันธ์ 2551) ชุดข้อมูลที่ห้าที่มีตัวอย่างตัวแทนของผู้ใช้ Last.fm ที่ได้รับโดยใช้การสุ่มตัวอย่างแบบหลายชุด (รวบรวมเมื่อเดือนกรกฎาคม 2010)
ทรัพยากรที่ดีสำหรับการค้นหาชุดข้อมูลคือ:
/ r / ชุดข้อมูลบน Reddit
ภาพรวมอย่างรวดเร็วที่หน้านั้นจะเปิดเผยแหล่งที่มาซึ่งอาจมีสิ่งที่มีประโยชน์สำหรับคุณ
บทความนี้ใช้ชุดข้อมูลของ Facebookที่มีอยู่ที่นี่ นี่คือคำอธิบายจากผู้เขียน:
ข้อมูลประกอบด้วยชุดโหนดและลิงก์ที่สมบูรณ์ (และข้อมูลประชากรบางส่วน) จากวิทยาลัยและมหาวิทยาลัยในสหรัฐอเมริกา100แห่งจากสแนปช็อตแบบครั้งเดียวในเดือนกันยายน 2548