ฉันมีไฟล์ CSV กับ 4 ล้านขอบของเครือข่ายผู้กำกับที่เป็นตัวแทนของคนสื่อสารกับแต่ละอื่น ๆ (เช่นจอห์นส่งข้อความไปยังแมรี่แมรี่ส่งข้อความไปยังแอนจอห์นส่งอีกข้อความถึงแมรี่, ฯลฯ ) ฉันต้องการทำสองสิ่ง:
ค้นหาการศึกษาระดับปริญญา, ระหว่างและ (อาจ) มาตรการศูนย์กลาง eigenvector สำหรับแต่ละคน
รับภาพของเครือข่าย
ฉันต้องการทำสิ่งนี้ในบรรทัดคำสั่งบนเซิร์ฟเวอร์ Linux เนื่องจากแล็ปท็อปของฉันมีพลังงานไม่มาก ฉันได้ติดตั้ง R ไว้บนเซิร์ฟเวอร์นั้นและไลบรารี statnet ฉันพบโพสต์ของคนที่มีความสามารถมากกว่าฉันที่พยายามทำสิ่งเดียวกันและมีปัญหา ดังนั้นฉันจึงสงสัยว่าถ้ามีคนอื่นที่มีพอยน์เตอร์เกี่ยวกับวิธีการทำเช่นนี้โดยเฉพาะอย่างยิ่งพาฉันทีละขั้นตอนเพราะฉันรู้วิธีการโหลดไฟล์ CSV และไม่มีอะไรอื่น
เพียงให้แนวคิดแก่คุณนี่คือลักษณะของไฟล์ CSV ของฉัน:
$ head comments.csv
"src","dest"
"6493","139"
"406705","369798"
$ wc -l comments.csv
4210369 comments.csv