เชื่อมโยงการตรวจจับความผิดปกติในเครือข่ายชั่วคราว


32

ฉันมาข้ามบทความนี้ที่ใช้เชื่อมโยงการตรวจสอบความผิดปกติในการทำนายแนวโน้มหัวข้อและผมพบว่ามันไม่น่าเชื่อที่น่าสนใจ: กระดาษ"การค้นพบหัวข้อที่เกิดขึ้นใหม่ในกระแสสังคมผ่านการเชื่อมโยงความผิดปกติของการตรวจสอบ"

ฉันชอบที่จะทำซ้ำในชุดข้อมูลอื่น แต่ฉันไม่คุ้นเคยกับวิธีการที่จะรู้วิธีใช้ สมมติว่าฉันมีชุดของภาพรวมของเครือข่ายของโหนดในช่วงหกเดือน โหนมีการกระจายระดับเทลด์เทอร์มินัลโดยส่วนใหญ่มีการเชื่อมต่อเพียงเล็กน้อย แต่บางอันมีจำนวนมาก โหนดใหม่ปรากฏขึ้นภายในช่วงเวลานี้

ฉันจะใช้การคำนวณความน่าจะเป็นสูงสุดปกติแบบลดตามลำดับที่ใช้ในกระดาษเพื่อตรวจจับลิงก์ผิดปกติที่ฉันคิดว่าอาจเป็นตัวตั้งต้นให้เกิดการระเบิดได้อย่างไร มีวิธีการอื่นที่เหมาะสมกว่าหรือไม่

ฉันถามทั้งในทางทฤษฎีและในทางปฏิบัติ หากใครบางคนชี้ให้ฉันเห็นวิธีการใช้สิ่งนี้ใน python หรือ R นั่นจะเป็นประโยชน์อย่างมาก

ใคร? ฉันรู้ว่าคุณสมาร์ทคนมีความคิดเริ่มต้นสำหรับคำตอบ


1
หากคุณไม่รังเกียจที่จะผ่อนคลายการตั้งค่า R / python งานของฉันจะช่วยได้ไหม? goo.gl/l7SLlB ข้อดี บางประการของวิธีนี้คือคุณไม่จำเป็นต้องกังวลเกี่ยวกับประเภทของคุณสมบัติการทำให้เป็นมาตรฐานและอีกมากมาย
arielf

1
หากฉันไม่เข้าใจคำถามคุณควรจะสามารถใช้วิธีการจากกระดาษในลักษณะเดียวกับที่ผู้เขียนบทความใช้วิธีนี้ หากวิธีนี้ไม่สามารถทำซ้ำได้จากกระดาษคุณควรติดต่อผู้เขียน ผู้เขียนอาจยินดีที่จะให้รหัสของพวกเขา หากคุณมีคำถามเชิงทฤษฎีหรือคำถามการเขียนโปรแกรมที่เฉพาะเจาะจงแล้วพวกเขาควรจะถามแยกต่างหาก
แน็ต

คำตอบ:


0

คุณควรเริ่มต้นด้วยคำนิยามของคะแนนความผิดปกติของโหนดใหม่ (ดูหัวข้อ 3.1, 3.2) โชคดีที่การติดต่อกันระหว่างโพสต์ใหม่ (ในกรณีของพวกเขา) และโหนดใหม่ (ในกรณีของคุณ) เกือบหนึ่งต่อหนึ่งเนื่องจากเราสนใจเฉพาะชุดของโหนด (ผู้ใช้) ที่โหนด (โพสต์) คือ เกี่ยวข้องกับ

γ

สอบถามเพิ่มเติมหากคุณมีปัญหาในการทำตามขั้นตอนที่อธิบายไว้ในส่วนย่อย 3.4 ซึ่งมีการใช้ SDNML

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.