มันหมายความว่าอย่างไรเมื่อทุกขอบในเครือข่าย / กราฟในโลกแห่งความเป็นจริงมีความเป็นไปได้ที่จะเกิดขึ้นโดยบังเอิญ


11

ฉันใช้วิธีการแยกเครือข่ายกระดูกสันหลังที่ระบุไว้ในบทความนี้: http://www.pnas.org/content/106/16/6483.abstract

โดยทั่วไปผู้เขียนเสนอวิธีการตามสถิติที่ก่อให้เกิดความน่าจะเป็นสำหรับแต่ละขอบของกราฟที่เกิดขึ้นโดยบังเอิญ ฉันใช้การตัดนัยสำคัญทางสถิติทั่วไปที่ 0.05

ฉันใช้วิธีนี้กับเครือข่ายในโลกแห่งความจริงหลายแห่งและบางเครือข่ายก็น่าสนใจที่ไม่มีอะไรจะสำคัญ ฉันพยายามที่จะเข้าใจว่าสิ่งนี้เกี่ยวข้องกับเครือข่าย เวลาอื่นที่ฉันใช้วิธีการกับเครือข่ายและไม่มีขอบออกมาเป็นสำคัญคือเมื่อฉันใช้วิธีการกับเครือข่ายแบบสุ่มที่ฉันสร้างขึ้นซึ่งเป็นสิ่งที่เราคาดหวัง

ในฐานะที่เป็นตัวอย่างเครือข่ายโลกแห่งความจริงคุณอาจเห็นภาพเครือข่ายล่าสุดที่เกิดขึ้นกับนักเศรษฐศาสตร์ซึ่งแสดงให้เห็นถึงการแบ่งขั้วของวุฒิสภาสหรัฐอเมริกาในช่วง 25 ปีที่ผ่านมา: http://www.economist.com/news/united-states/21591190 -United ฉันใช้วิธีการแยกเครือข่ายกระดูกสันหลังกับเครือข่ายเหล่านั้นและไม่มีขอบปรากฏขึ้นอย่างมีนัยสำคัญ ถึงแม้ว่าขอบดิบจะแสดงสิ่งที่แนบและการจัดกลุ่มแบบพิเศษ แต่ก็เป็นไปได้หรือไม่ เครือข่ายการลงคะแนนของวุฒิสภาเป็นแบบสุ่มหรือไม่

คำตอบ:


6

สมมติฐานว่างเปล่าที่อยู่เบื้องหลังวิธีการกระดูกสันหลังเป็น

[The] น้ำหนักที่ปรับให้เป็นมาตรฐานที่สอดคล้องกับการเชื่อมต่อของโหนดหนึ่ง ๆ ของระดับ k นั้นถูกสร้างขึ้นโดยการมอบหมายแบบสุ่มจากการแจกแจงแบบสม่ำเสมอ

หากไม่มีขอบ "นัยสำคัญ" ใด ๆ สมมุติฐานว่างจะถือเป็นกราฟทั้งหมดนั่นคือน้ำหนักถ่วงของขอบเกิดจากแรงโน้มถ่วงที่สำคัญในการส่งและรับความสัมพันธ์

วิธีแบ็คโบนอาจไม่เหมาะสมทั้งนี้ขึ้นอยู่กับความสัมพันธ์ที่คุณกำลังวิเคราะห์ วิธีนี้ใช้ได้ผลดีที่สุดสำหรับเครือข่ายที่ใช้เครือข่ายถ่วงน้ำหนักในโหมดเดียว เครือข่ายสองโหมดสามารถฉายเป็นเครือข่ายหนึ่งโหมดที่มีน้ำหนัก แต่มักจะไม่เหมาะสมที่จะทำเช่นนั้น

จากตัวอย่างของคุณในนักเศรษฐศาสตร์มันไม่สมเหตุสมผลที่จะวิเคราะห์การลงคะแนนของวุฒิสภาในฐานะเครือข่ายหนึ่งโหมดที่ถ่วงน้ำหนักด้วยจำนวนคะแนนเสียงที่แชร์ การลงคะแนนเสียงในวุฒิสภาเป็นความสัมพันธ์สองโหมดที่ได้รับการลงนามแล้ว วุฒิสมาชิก (i) มีความสัมพันธ์กับชิ้นส่วนของกฎหมาย (j) และพวกเขาก็ละเว้นจากการลงคะแนน (0) หรือพวกเขาลงคะแนนให้ (+1) หรือต่อต้าน (-1) กฎหมาย ในการแปลงเครือข่ายให้เป็นเครือข่ายข้อตกลงโหมดเดียวที่มีน้ำหนักแล้วทำการวิเคราะห์กระดูกสันหลังด้วยการลดข้อมูลลงอย่างรุนแรง กฎหมายบางชิ้นมีความแตกแยกทางการเมืองมากกว่าและบางกฎหมายมีคะแนนเสียงมากกว่าส่วนอื่น ๆ - วิธีการของกระดูกสันหลังจะไม่ได้รับกลไกเหล่านี้

คุณอาจต้องการพิจารณาการทดสอบ Conditional Uniform Graph (CUG) แทนวิธีแบ็คโบน แนวคิดเบื้องหลังการทดสอบเหล่านี้คือการตรวจสอบว่าคุณสมบัติระดับกราฟบางอย่าง (เช่นการจัดกลุ่มความยาวเส้นทางโดยเฉลี่ยการรวมศูนย์แบบ homophily) เป็นผลมาจากโอกาสหรือไม่ กระบวนการดังต่อไปนี้:

  1. ใช้การวัดfจากกราฟที่สังเกต
  2. สร้างกราฟสุ่มที่ควบคุมคุณสมบัติบางอย่างของกราฟที่สังเกตได้ (เช่นขนาดจำนวนขอบการกระจายองศาเป็นต้น)
  3. ทำการวัดfจากกราฟสุ่ม
  4. ทำซ้ำขั้นตอนที่ 2 และ 3 หลายครั้ง (เช่น 1,000) เพื่อสร้างการแจกแจงแบบ null
  5. เปรียบเทียบการวัดที่สังเกตได้กับการแจกแจงโมฆะ

สำหรับเครือข่ายสองโหมดการสร้างกราฟสุ่มโดยอนุญาตให้กราฟที่สังเกตเห็นได้ (ทั้ง tnet และ statnet ใน R มีรูทีนสำหรับอนุญาตให้ใช้เครือข่ายสองโหมด) หากการวัดfต้องใช้เครือข่ายหนึ่งโหมดกระบวนการสุ่มควรทำบนเครือข่ายสองโหมดก่อนที่จะฉายเป็นเครือข่ายโหมดเดียว


4

ในบทความที่คุณอ้างถึงผู้เขียนพิจารณาว่าในเครือข่ายที่ซับซ้อน "โหนด [[]] เป็นตัวแทนองค์ประกอบของระบบ [แบบจำลอง] และขอบถ่วงน้ำหนักระบุถึงการมีปฏิสัมพันธ์และความแข็งแรงสัมพัทธ์" (เน้นโดยฉัน) .

ในเครือข่ายที่คุณศึกษาถ้าฉันเข้าใจบทความนักเศรษฐศาสตร์อย่างถูกต้องมีการเชื่อมโยงระหว่างวุฒิสมาชิก 2 คนหากพวกเขาโหวตอย่างน้อย 100 ครั้ง ดังนั้นลิงก์จะไม่สร้างแบบจำลองการโต้ตอบ แต่มีความคล้ายคลึงกัน (ระหว่างพฤติกรรมการลงคะแนนของวุฒิสมาชิก) จากประสบการณ์ของฉันเครือข่ายความคล้ายคลึงกันไม่ได้แสดงการกระจายระดับเดียวกันกว่าเครือข่ายปฏิสัมพันธ์ในแง่ที่ว่ามันไม่เหมือนกัน นอกจากนี้พารามิเตอร์ threshold ที่ใช้เมื่อแยกเครือข่าย (ที่นี่: 100) บางครั้งมีผลอย่างมากต่อการกระจายระดับ

ยิ่งกว่านั้นฉันไม่สามารถพูดถึงน้ำหนักใด ๆ ในบทความนักเศรษฐศาสตร์ แต่การปรากฏตัวของน้ำหนักน่าจะเป็นจุดสำคัญในวิธีการที่อธิบายในการทำงานของÁngeles Serrano et al, คุณอ้างถึงคำถามของคุณ

จากการสังเกตทั้งสองนี้ดูเหมือนว่าเป็นไปได้ว่าวิธีการไม่ทำงานอย่างถูกต้องกับข้อมูลเหล่านี้เพราะมันไม่ได้ออกแบบมาเพื่อประมวลผลเครือข่ายประเภทนี้ บางทีคุณสามารถตรวจสอบการกระจายระดับได้: มันมีค่าเป็นศูนย์กลางหรือไม่เหมือนกันหรือไม่? แล้วน้ำหนักล่ะมีอะไรบ้าง?


ฉันทำซ้ำข้อมูลด้วยตนเองจากเว็บไซต์ต้นทางดังนั้นฉันจึงรวมน้ำหนักและไม่ได้ใช้เกณฑ์การตัดออกโดยพลการ ดังนั้นฉันคิดว่าข้อมูลที่ฉันใช้กับวิธีการกระดูกสันหลังไม่ควรได้รับผลกระทบจากปัญหาเหล่านี้ ความคิดที่ดีในการตรวจสอบการกระจายระดับ - ฉันจะต้องดู!
Randy Olson
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.