ชุดข้อมูล / APIs เครือข่ายโซเชียลที่เปิดเผยต่อสาธารณชน


26

ในฐานะที่เป็นส่วนขยายของรายการชุดข้อมูลที่เปิดเผยต่อสาธารณชนเราต้องการทราบว่ามีรายการใด ๆ ของชุดข้อมูลเครือข่ายโซเชียลสาธารณะ / API การรวบรวมข้อมูล มันจะดีมากถ้าพร้อมกับลิงค์ไปยังชุดข้อมูล / API คุณสมบัติของข้อมูลที่มีอยู่ก็ถูกเพิ่มเข้ามา ข้อมูลดังกล่าวควรเป็นและไม่ จำกัด เฉพาะ:

  • ชื่อเครือข่ายโซเชียล
  • มีข้อมูลผู้ใช้ประเภทใดบ้าง (โพสต์โปรไฟล์เครือข่ายมิตรภาพ ... );
  • ไม่ว่าจะช่วยให้การรวบรวมเนื้อหาของมันผ่านทาง API (และอัตรา: 10 / นาที, 1k / เดือน, ... );
  • ไม่ว่าจะเป็นเพียงแค่ให้ภาพรวมของชุดข้อมูลทั้งหมด

ข้อเสนอแนะและคุณสมบัติเพิ่มเติมที่จะเพิ่มยินดีต้อนรับมาก

คำตอบ:


20

คำสองสามคำเกี่ยวกับ API เครือข่ายสังคม ประมาณหนึ่งปีที่ผ่านมาฉันเขียนรีวิวเกี่ยวกับ APIs เครือข่ายสังคมยอดนิยมสำหรับนักวิจัย น่าเสียดายที่มันเป็นภาษารัสเซีย นี่คือบทสรุป:

Twitter ( https://dev.twitter.com/docs/api/1.1 )

  • มีข้อมูลเกือบทั้งหมดเกี่ยวกับทวีต / ข้อความและผู้ใช้
  • การขาดข้อมูลทางสังคมสารสนเทศ
  • API การสตรีมที่ยอดเยี่ยม: มีประโยชน์สำหรับการประมวลผลข้อความตามเวลาจริง
  • wrappers จำนวนมากสำหรับการเขียนโปรแกรมภาษา
  • การรับโครงสร้างเครือข่าย (การเชื่อมต่อ) เป็นไปได้ แต่เสียเวลา (1 คำขอต่อ 1 นาที)

Facebook ( https://developers.facebook.com/docs/reference/api/ )

  • ขีด จำกัด อัตรา: ประมาณ 1 คำขอต่อวินาที
  • จัดทำเอกสารอย่างดีนำเสนอ sandbox;
  • FQL (เหมือน SQL) และ« Rest ปกติ» Graph API;
  • ข้อมูลมิตรภาพและคุณลักษณะทางสังคมวิทยาปัจจุบัน
  • ข้อมูลจำนวนมากอยู่นอกเหนือขอบเขตเหตุการณ์ : มีเพียงข้อมูลของเพื่อนและเพื่อนที่สมบูรณ์ไม่มากก็แทบจะไม่มีการตรวจสอบผู้ใช้แบบสุ่ม
  • ข้อผิดพลาด API แปลก ๆ บางอย่างและดูเหมือนว่าไม่มีใครสนใจ (เช่นคุณสมบัติบางอย่างที่มีให้ผ่าน FQL แต่ไม่ใช่ผ่านพ้องกราฟ API)

Instagram ( http://instagram.com/developer/ )

  • ขีด จำกัด อัตรา: 5,000 คำขอต่อชั่วโมง
  • API แบบเรียลไทม์ (เช่นสตรีมมิ่ง API สำหรับ Twitter แต่มีรูปถ่าย) - การเชื่อมต่อกับมันค่อนข้างยุ่งยากเล็กน้อย: ใช้การโทรกลับ
  • การขาดข้อมูลทางสังคมสารสนเทศ
  • ภาพถ่ายกรองข้อมูลที่มีอยู่;
  • ความไม่สมบูรณ์ที่ไม่คาดคิด (เช่นเป็นไปได้ที่จะรวบรวมเพียง 150 ความเห็นเพื่อโพสต์ / รูปภาพ)

Foursquare ( https://developer.foursquare.com/overview/ )

  • ขีด จำกัด อัตรา: 5,000 คำขอต่อชั่วโมง
  • อาณาจักรของข้อมูลทางภูมิศาสตร์สังคม :)
  • ค่อนข้างปิดจากงานวิจัยเนื่องจากปัญหาความเป็นส่วนตัว ในการรวบรวมข้อมูลเช็คอินจำเป็นต้องสร้างตัวแยกวิเคราะห์คอมโพสิตที่ทำงานกับ 4sq, bit.ly และ twitter API ในครั้งเดียว
  • อีกครั้ง: การขาดข้อมูลทางสังคมวิทยา

Google+ ( https://developers.google.com/+/api/latest/ )

  • ประมาณ 5 คำขอต่อวินาที (ลองยืนยัน);
  • วิธีการหลัก: กิจกรรมและผู้คน;
  • เช่นเดียวกับ Facebook ข้อมูลส่วนบุคคลจำนวนมากสำหรับผู้ใช้แบบสุ่มจะถูกซ่อน
  • ขาดข้อมูลการเชื่อมต่อผู้ใช้

และออกจากการแข่งขัน: เราได้ตรวจสอบเครือข่ายทางสังคมสำหรับผู้อ่านที่รัสเซียและ # 1 เครือข่ายที่นี่เป็นvk.com มันแปลเป็นหลายภาษา แต่ได้รับความนิยมเฉพาะในรัสเซียและประเทศ CIS อื่น ๆ เอกสาร API เชื่อมโยง: http://vk.com/dev/ และจากมุมมองของฉันมันเป็นตัวเลือกที่ดีที่สุดสำหรับการวิจัยโซเชียลมีเดียโซเชียล อย่างน้อยในรัสเซีย นั่นเป็นเหตุผล:

  • ขีด จำกัด อัตรา: 3 คำขอต่อวินาที
  • ข้อความสาธารณะและข้อมูลสื่อที่มีอยู่;
  • มีข้อมูลโซโนเดโมกราฟิกอยู่: สำหรับระดับความพร้อมใช้งานของผู้ใช้แบบสุ่มอยู่ที่ประมาณ 60-70%;
  • มีการเชื่อมต่อระหว่างผู้ใช้ด้วย: มีข้อมูลมิตรภาพเกือบทั้งหมดสำหรับผู้ใช้แบบสุ่ม
  • วิธีพิเศษบางอย่าง: เช่นมีวิธีการรับสถานะออนไลน์ / ออฟไลน์สำหรับผู้ใช้ที่แน่นอนในเรียลไทม์และสามารถสร้างตารางสำหรับผู้ชมของเขา

1
สุดยอดเชียร์! จริง ๆ แล้วฉันคาดหวังว่าบางสิ่งเช่นนี้จะหายไปเป็นคำตอบมากมายและคุณก็ถือทั้งหมด: D ขอบคุณสำหรับคำตอบ งานที่ดี! :)
รูเบนส์

1
ฉันทิ้งไว้ข้างหลังขอบเขต LinkedIn, YouTube, ความลับ อาจเป็นเครือข่ายระดับภูมิภาคอื่น ๆ (QQ?) และยินดีที่จะรับข้อมูลเกี่ยวกับพวกเขา
sobach

8

มันไม่ใช่เครือข่ายโซเชียลต่อ se แต่ Stackexchange เผยแพร่ดัมพ์ฐานข้อมูลทั้งหมดเป็นระยะ:

คุณสามารถดึงข้อมูลโซเชียลได้โดยการวิเคราะห์ว่าผู้ใช้คนไหนถามและตอบกัน สิ่งหนึ่งที่ดีคือเมื่อติดแท็กโพสต์คุณสามารถวิเคราะห์ชุมชนย่อยได้อย่างง่ายดาย


6

รายการชุดข้อมูลเครือข่ายโซเชียลที่เปิดเผยต่อสาธารณชนสามารถดูได้จากเว็บไซต์โครงการการวิเคราะห์เครือข่าย Stanford:

ชุดข้อมูล SNAP

เว็บไซต์นี้มีข้อมูลเครือข่ายโซเชียลอินเทอร์เน็ต (Facebook, Twitter, Google Plus), เครือข่ายอ้างอิงสำหรับวารสารวิชาการ, เครือข่ายการจัดซื้อร่วมจาก Amazon และเครือข่ายอื่น ๆ อีกมากมาย พวกเขาได้ชี้นำกำกับทิศทางและกราฟสองฝ่ายและชุดข้อมูลทั้งหมดเป็นภาพรวมที่สามารถดาวน์โหลดได้ในรูปแบบการบีบอัด


5

ตัวอย่างจากประเทศเยอรมนี: ซิงไซต์ที่คล้ายกับ linkedin แต่ จำกัด เฉพาะประเทศที่พูดภาษาเยอรมัน

ลิงก์ไปยังศูนย์กลางนักพัฒนาซอฟต์แวร์: https://dev.xing.com/overview

ให้การเข้าถึง: โปรไฟล์ผู้ใช้, การสนทนาระหว่างผู้ใช้ (จำกัด เฉพาะผู้ใช้เอง), ประกาศรับสมัครงาน, รายชื่อติดต่อและรายชื่อผู้ติดต่อ, ข่าวจากเครือข่ายและตำแหน่งทางภูมิศาสตร์บางตำแหน่ง

ใช่มันมี API แต่ฉันไม่พบข้อมูลเกี่ยวกับอัตรา แต่สำหรับฉันแล้วดูเหมือนว่าข้อมูลบางอย่างถูก จำกัด โดยความยินยอมของผู้ใช้


4

Network Repository ( http://networkrepository.com ) มีเครือข่ายสังคมออนไลน์มากมาย, เว็บกราฟ, เครือข่ายชีวภาพและสมองเป็นต้นสิ่งที่สำคัญที่สุดคือพวกเขายังมีเครื่องมือวิเคราะห์ภาพเชิงโต้ตอบเพื่อเปรียบเทียบ / สำรวจเครือข่ายสังคมออนไลน์ต่างๆ


2

คอลเลกชันขนาดเล็กของการเชื่อมโยงดังกล่าวสามารถพบได้ที่นี่ หลายคนเป็นกราฟโซเชียล


ฉันขอบคุณมากสำหรับการโพสต์ข้อมูลอ้างอิงนี้ แต่ฉันคาดหวังคำตอบที่นี่เพื่อชี้ชุดข้อมูล / API สำหรับเครือข่ายสังคมออนไลน์และยังอธิบายถึงสิ่งที่ให้บริการโดยแหล่งข้อมูลดังกล่าว (อัตราการดาวน์โหลดของโพสต์หรือข้อมูลประเภทใด เกี่ยวกับผู้ใช้) ตามคำตอบของคุณฉันคิดว่าจะยินดีมากกับรายการชุดข้อมูลสาธารณะที่เรามี
รูเบนส์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.