จำนวนการเชื่อมต่อเป็น Gaussian ได้อย่างไรถ้าไม่สามารถลบได้?


14

ฉันกำลังวิเคราะห์เครือข่ายสังคมออนไลน์ (ไม่ใช่เสมือน) และฉันกำลังสังเกตการเชื่อมต่อระหว่างผู้คน หากบุคคลนั้นเลือกบุคคลอื่นเพื่อเชื่อมต่อแบบสุ่มจำนวนการเชื่อมต่อภายในกลุ่มบุคคลจะกระจายตามปกติอย่างน้อยตามหนังสือที่ฉันกำลังอ่าน

เราจะรู้ได้อย่างไรว่าการแจกแจงเป็นแบบเกาส์ (ปกติ) มีการแจกแจงอื่น ๆ เช่น Poisson, Rice, Rayliegh เป็นต้นปัญหาของการแจกแจงแบบเกาส์ในทางทฤษฎีคือค่าจากถึง+ (แม้ว่าความน่าจะเป็นเป็นศูนย์) และจำนวนการเชื่อมต่อไม่สามารถลบได้+

ไม่มีใครรู้ว่าการกระจายใดที่สามารถคาดหวังในกรณีที่แต่ละคนเป็นอิสระ (สุ่ม) หยิบคนอื่นเพื่อเชื่อมต่อกับ?


1
ชี้แจง: คำถามเกี่ยวกับ "จำนวนการเชื่อมต่อทั้งหมดสำหรับทั้งกลุ่ม" หรือ "จำนวนการเชื่อมต่อทั้งหมดสำหรับหนึ่งคน" หรือไม่ คำตอบของฉันถือว่าอย่างหลัง

1
การกระจายไรลีย์ ? นั่นเป็นเรื่องใหม่สำหรับฉัน คุณมีการอ้างอิงหรือลิงค์?
onestop

3
"Rayleigh" อาจจะ?
whuber

คำตอบ:


6

เมื่อมีผู้คนและจำนวนการเชื่อมต่อที่ทำโดยคนที่ฉัน, 1 ฉันn ,เป็นX ฉันแล้วจำนวนรวมของการเชื่อมต่อเป็นS n = Σ n ฉัน= 1 X ฉัน / 2 ตอนนี้ถ้าเราใช้X ฉันจะเป็นตัวแปรสุ่มถือว่าพวกเขามีความเป็นอิสระและความแปรปรวนของพวกเขาไม่ได้ "ไม่เท่ากันเกินไป" เป็นคนมากขึ้นมีการเพิ่มการผสมแล้วLindeberg-Levy ทฤษฎีขีด จำกัด กลางni,1in,XiSn=i=1nXi/2Xiใช้ มันอ้างว่าฟังก์ชันการแจกแจงสะสมของผลรวมที่เป็นมาตรฐานมาบรรจบกับ cdf ของการแจกแจงแบบปกติ นั่นหมายถึงคร่าวๆว่าฮิสโตแกรมของผลรวมจะมีลักษณะเหมือนเกาส์เซียน (เป็น "เส้นโค้งระฆัง") มากขึ้นเมื่อโตขึ้นมากn

ตรวจสอบสิ่งที่ไม่ได้พูด:

  • มันไม่ได้ยืนยันว่าการกระจายของเคยว่าปกติ เป็นไปไม่ได้สำหรับเหตุผลที่คุณชี้ให้เห็นSn

  • ไม่ได้หมายความถึงจำนวนการเชื่อมต่อที่คาดว่าจะมาบรรจบกัน ในความเป็นจริงมันจะต้องแตกต่าง (ไปที่อินฟินิตี้) มาตรฐานคือการนำเสนอและ rescaling ของการกระจาย; ปริมาณการลดอัตรากำลังเพิ่มขึ้นโดยไม่มีขีด จำกัด

  • Xin


โปรดทราบว่าผมไม่ตีความคำถามไปยังรัฐที่ทุกคนเลือกว่าหนึ่งคนอื่น ๆ ที่จะเชื่อมต่อไป - ที่จะนำไปสู่ทฤษฎีหมันเพราะจำนวนการเชื่อมต่อจะได้รับการพิจารณาไม่สุ่ม แต่ฉันตีความว่าทุกคนเมื่อพวกเขาเข้าสู่เครือข่ายเลือกการเชื่อมต่อแบบสุ่มในหมู่ n คนอื่น ๆ รวมกับที่ใดก็ได้ตั้งแต่ 0 ถึง n การเชื่อมต่อทั้งหมด สมมติฐานเกี่ยวกับความแปรปรวนสามารถมั่นใจได้เมื่อมีการ จำกัด จำนวนการเชื่อมต่อที่ผู้ใช้ใหม่จะทำและจำนวนนั้นจะมีการสุ่ม "น้อยที่สุด"
whuber

Xi

1
@ ไม่ใช่คน: จำนวนการเชื่อมต่อที่เกิดขึ้น สิ่งสำคัญคือควรมีโอกาสที่จำนวนของการเชื่อมต่อที่ทำโดยบุคคลแตกต่างกันจริง ๆ และไม่ปักหลักที่คงที่ เมื่อเกิดเหตุการณ์นี้ขึ้นการ จำกัด การกระจาย (จำนวนการเชื่อมต่อ) จะถูกกำหนดโดยจำนวน จำกัด ของการเชื่อมต่อเริ่มต้นที่แตกต่างกันดังนั้นจึงเป็นไปไม่ได้ที่จะเข้าใกล้การแจกแจงปกติแบบไม่มีสัญญาณ
whuber

1

คำตอบนั้นขึ้นอยู่กับสมมุติฐานที่คุณต้องการ เครือข่ายทางสังคมมีวิวัฒนาการตลอดเวลาและดังนั้นจึงไม่ใช่เอนทิตีแบบคงที่ ดังนั้นคุณต้องตั้งสมมติฐานเกี่ยวกับวิธีที่เครือข่ายวิวัฒนาการตลอดเวลา

n

PRโอ(ไม่มีการเชื่อมต่อสำหรับบุคคลใด ๆ=n-1)=1.

หากบุคคลเลือกบุคคลอื่นโดยการสุ่มเพื่อเชื่อมต่อในที่สุดทุกคนจะถูกเชื่อมต่อ

อย่างไรก็ตามเครือข่ายชีวิตจริงไม่ได้ทำงานในลักษณะนี้ ผู้คนต่างกันในหลาย ๆ ด้าน

  1. เมื่อใดก็ตามที่บุคคลมีขนาดเครือข่ายที่แน่นอนและความน่าจะเป็นของการเชื่อมต่ออื่นที่ทำขึ้นเป็นฟังก์ชั่นของขนาดเครือข่ายของเขา / เธอ

  2. บุคคลที่มีแนวโน้มที่แท้จริงของเขา / เธอในรูปแบบการเชื่อมต่อ (เป็นบางคนเป็นคนเก็บตัว / exterovert ฯลฯ )

ความน่าจะเป็นเหล่านี้เปลี่ยนแปลงตลอดเวลาบริบท ฯลฯ ฉันไม่แน่ใจว่ามีคำตอบที่ตรงไปตรงมาเว้นแต่ว่าเราจะตั้งสมมติฐานบางอย่างเกี่ยวกับโครงสร้างของเครือข่าย (เช่นความหนาแน่นของเครือข่ายวิธีการที่คนทำงาน ฯลฯ )


@Srikant คุณช่วยอธิบายว่าคุณได้รับ "คำตอบเล็ก ๆ น้อย ๆ " ได้อย่างไร? (จะต้องมีข้อสมมติฐานบางอย่างที่ไม่ได้ระบุไว้) และคุณอ้างถึงทฤษฎีบทใดเมื่อคุณสรุปว่า "ในที่สุดทุกคนจะได้รับการเชื่อมต่อ" ไม่ชัดเจนเลย!
whuber

@whuber ฉันสมมติว่าขนาดเครือข่ายได้รับการแก้ไข คำถามระบุ: คนเลือกบุคคลอื่นโดยการสุ่มเพื่อทำการเชื่อมต่อและสันนิษฐานว่านี่เป็นกระบวนการต่อเนื่อง ดังนั้นเมื่อเวลาผ่านไปทุกคนควรเชื่อมต่อกัน ไม่มีทฤษฎีบทเพียงแค่สัญชาตญาณ บางทีฉันกำลังใช้ภาษาที่ไม่แน่ชัด

@Srikant ฉันยังสับสนเพราะหลังจากผ่านไปนาน "Prob (ไม่มีการเชื่อมต่อ = n)" เท่ากับ 1 เมื่อ n = 3 และมิฉะนั้นจะเป็นศูนย์เสมอ ท้ายที่สุดเมื่อ "ทุกคนควรเชื่อมต่อ" จำนวนการเชื่อมต่อเท่ากับ n (n-1) / 2 ฉันสงสัยว่าคุณอาจมีกระบวนการสุ่มที่แตกต่างกันหลายอย่างในใจในเวลาเดียวกัน มันอาจช่วยเปิดเผยสมมติฐานที่คุณทำและแม่นยำกว่านี้เล็กน้อย
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.