แบบจำลองของกราฟสุ่มสำหรับเครือข่ายคอมพิวเตอร์จริง


19

ฉันสนใจแบบจำลองของกราฟสุ่มที่คล้ายกับกราฟของเครือข่ายคอมพิวเตอร์จริง ฉันไม่แน่ใจว่าแบบจำลองได้รับการศึกษาเป็นอย่างดี(จุดยอด, ขอบแต่ละอันที่เป็นไปได้ถูกเลือกด้วยความน่าจะเป็น ) นั้นดีสำหรับการศึกษาเครือข่ายคอมพิวเตอร์จริงหรือไม่?n pG(n,พี)nพี

กราฟสุ่มแบบใดที่มีประโยชน์สำหรับการทำความเข้าใจเครือข่ายคอมพิวเตอร์ที่เกิดขึ้นในทางปฏิบัติ

โดยทั่วไปแล้วรูปแบบอื่น ๆ ของกราฟสุ่ม จำกัด (นอกเหนือจากที่เทียบเท่ากับแบบจำลอง ) ที่ได้รับการศึกษาในวรรณคดีคืออะไร? (คำตอบที่ดีที่สุดคือตัวชี้ไปยังแบบสำรวจสำหรับแบบจำลองของกราฟสุ่ม จำกัด )G(n,พี)


2
คุณต้องการโมเดลดังกล่าวที่ไหน - เป็นเพียงการสร้างอินพุตทดสอบสำหรับอัลกอริทึมหรือคุณต้องการวิเคราะห์โมเดลเพื่อเรียนรู้บางอย่างเกี่ยวกับเครือข่ายคอมพิวเตอร์ คุณสนใจเครือข่ายคอมพิวเตอร์ประเภทใด เครื่องชั่งของคุณคืออะไร (LAN กับอินเทอร์เน็ต) ทำไมคุณถึงคิดว่าเครือข่ายคอมพิวเตอร์ที่แท้จริงถูกสร้างขึ้นโดยกระบวนการสุ่ม - บ่อยครั้งที่เครือข่ายโลกแห่งความจริงได้รับการออกแบบโดยวิศวกรที่น่าประหลาดใจที่มีการโยนเหรียญค่อนข้างน้อย
Jukka Suomela

@ Jukka ฉันพยายามดูว่าฉันสามารถใช้เทคนิคที่พัฒนาขึ้นสำหรับกับโมเดลแบบสุ่มเหล่านั้นเพื่อรับข้อมูลเกี่ยวกับเครือข่ายจริงฉันไม่ชอบที่จะเฉพาะเจาะจงมากขึ้นในตอนนี้เพราะมันอาจให้ ปัญหาที่ฉันกำลังคิดไป :) ฉันสนใจชั้น IP ของอินเทอร์เน็ตเป็นส่วนใหญ่ ฉันเคยเห็นคนใช้กราฟสุ่มเพื่อวิเคราะห์กราฟที่เกิดจากเครือข่ายสังคม ฉันไม่แน่ใจว่าทำไมเครือข่ายจริงเหล่านี้แบ่งปันคุณสมบัติกับกราฟแบบสุ่มอาจมีกระบวนการสุ่มซ่อนอยู่หลังพื้นผิวในที่ทำงาน (ดูเหมือนคำถามที่น่าสนใจถาม :) G(n,พี)
Kaveh

ฉันเดาว่าส่วนหนึ่งของความสนใจในการใช้แบบจำลองแบบสุ่มคือการวิเคราะห์พวกมันง่ายกว่าการวิเคราะห์เครือข่ายจริงดังนั้นจึงมีเหตุผลที่จะต้องพิจารณาพวกเขาหากพวกเขามีความใกล้เคียงกับของจริงมากพอ
Kaveh

ขอบคุณทุกคนสำหรับคำตอบที่ดี (ตอนนี้ฉันต้องใช้เวลาอ่านบทความเหล่านี้เป็นบางครั้ง :)
Kaveh

คำตอบ:


10

ในช่วงไม่กี่ปีที่ผ่านมาการศึกษาของกราฟสุ่มที่มีข้อ จำกัด ของโครงสร้าง "ธรรมชาติ" ได้รับแรงฉุด ตัวอย่างเช่นหนึ่งสามารถพิจารณาภาพถ่ายกราฟวาด UAR จากชั้นเรียนของกราฟภาพถ่ายทั้งหมดที่มีจุดและการศึกษาวิธีการที่จะทำงานเป็นn →การ ซึ่งแตกต่างจากกราฟสุ่มErdős-Rényiหรือโมเดลอื่น ๆ ที่คล้ายกันขอบในกราฟเหล่านี้ขึ้นอยู่สูงดังนั้นหนึ่งในแรงจูงใจหลอกสำหรับการศึกษาการแจกแจงแบบนี้คือการวิเคราะห์แบบจำลองเครือข่ายที่มีความเป็นอิสระ จำกัด ระหว่างขอบnn

อย่างไรก็ตามในปัจจุบันเป้าหมายนี้ดูเหมือนจะอยู่ค่อนข้างไกลเนื่องจากความเป็นอิสระที่ จำกัด ทำให้การวิเคราะห์คุณสมบัติของกราฟนั้นยากขึ้นมาก ในความเป็นจริงคำถามพื้นฐานหลายข้อที่ตอบได้ง่ายมากสำหรับเช่นการกระจายของลำดับองศาได้รับการแก้ไขสำหรับกราฟระนาบแบบสุ่มเมื่อเร็ว ๆ นี้เท่านั้นG(n,พี)

สำหรับการอ้างอิงที่ชัดเจนให้ดูเอกสารของKonstantinos Panagiotouและการอ้างอิงที่อยู่ในนั้น เพื่อความสะดวกนี่เป็นตัวอย่างเล็ก ๆ ของเอกสารที่เกี่ยวข้อง:

  • การกระจายการศึกษาปริญญาตรีของสุ่มภาพถ่ายกราฟ คอนสแตนตินอส Panagiotou และ Angelika Steger ที่จะปรากฏในการประชุมวิชาการ ACM-SIAM ประจำปีครั้งที่ 22 เกี่ยวกับขั้นตอนวิธีแบบไม่ต่อเนื่อง (SODA '11)
  • กับคุณสมบัติของสุ่มเบามือและ triangulations Nicla Bernasconi, คอนสแตนตินอส Panagiotou และ Angelika Steger ในการประชุมวิชาการ ACM-SIAM ประจำปีครั้งที่ 19 เกี่ยวกับอัลกอริธึมแบบไม่ต่อเนื่อง (SODA '08) 132-141 [http://www.mpi-inf.mpg.de/~kpanagio/Dissections.pdf]
  • ในลำดับปริญญาสุ่ม Outerplanar และกราฟ Nicla Bernasconi, คอนสแตนตินอส Panagiotou และ Angelika Steger ในการประชุมเชิงปฏิบัติการนานาชาติครั้งที่ 12 เรื่องเทคนิคการสุ่มในการคำนวณ (RANDOM'08), p. 303-316 [http://www.mpi-inf.mpg.de/~kpanagio/OPSP.pdf]

1
ความคิดเห็นเพิ่มเติม: งานวิจัยนี้จริง ๆ แล้วจะย้อนกลับไปประมาณ 15 ปีอย่างน้อยก็ในกระดาษเดนิส Vasconcellos และเวลส์ (2539) และเหตุผลหนึ่งที่ทำให้ "ได้รับแรงดึง" ในขณะนี้คือความสำเร็จอันยิ่งใหญ่ของการประยุกต์ใช้ combinatorics เชิงวิเคราะห์และการแจงนับ asymptotic ที่นี่เช่นโดย Gimenez และ Noy (2009)
RJK

10

การสำรวจครั้งนี้โครงสร้างและหน้าที่ของเครือข่ายที่ซับซ้อนโดยนิวแมนทบทวนเทคนิคและแบบจำลองสำหรับเครือข่ายที่ซับซ้อนจริงรวมถึงแนวคิดเช่นเอฟเฟ็กต์โลกขนาดเล็กการแจกแจงระดับและโมเดลกราฟสุ่ม นอกจากนี้ผู้เขียนคนเดียวกันก็มีกระดาษที่ดีคือกราฟสุ่มเป็นแบบจำลองของเครือข่ายเกี่ยวกับการดัดแปลงกราฟสุ่มให้เป็นแบบจำลองเครือข่ายจริง

อ้างอิง:

1) กราฟสุ่มเป็นแบบจำลองของเครือข่าย MEJ Newman ในคู่มือของกราฟและเครือข่าย, S. Bornholdt และ HG Schuster (บรรณาธิการ), Wiley-VCH, Berlin (2003)

2) โครงสร้างและหน้าที่ของเครือข่ายที่ซับซ้อน MEJ Newman, SIAM Review 45, 167-256 (2003)


1
แค่อยากรู้อยากเห็น: นี่คือสำหรับเครือข่าย "สังคม" กับอินเทอร์เน็ตหรือไม่
Suresh Venkat

ฉันสองสิ่งนี้: แนวทางสู่เครือข่ายทางสังคมควรมีประโยชน์อย่างมากเนื่องจากการศึกษาส่วนใหญ่ของเครือข่ายเหล่านี้มุ่งเน้นไปที่คุณสมบัติ "สากล" ของเครือข่ายและรวมถึงโทโพโลยีโครงข่ายประสาทตารางกำลังไฟและเครือข่ายถนน นอกจากนี้ Barabasi-Albert และตาข่าย Watts-Strogatz แต่ละแห่งมีคุณสมบัติที่เครือข่ายจริงมีและ Erdos-renyi neglects นั้นได้รับการศึกษาเป็นอย่างดีมาก
Elliot JJ

1
@Suresh เครือข่ายที่ซับซ้อนเหล่านั้นครอบคลุมทั้งการอ้างอิงรวมถึงเครือข่ายคอมพิวเตอร์เช่นอินเทอร์เน็ตและเครือข่ายสังคม
Mohammad Al-Turkistany

8

เครือข่ายคอมพิวเตอร์จริงที่เลเยอร์อะไร อินเทอร์เน็ตอยู่ในระดับ AS (เครือข่ายระดับบนสุด) ซึ่งเป็นเครือข่ายเล็ก ๆ ในโลกที่มีโหนดระดับสูงมาก เมื่อเลเยอร์เข้าใกล้สายจริงมากขึ้นกราฟจะเชื่อมโยงกับภูมิศาสตร์และเชื่อมโยงกับเลเยอร์ทางสังคมน้อยลง (โซเชียลเป็นคำที่ผิด - มันเป็นเครือข่ายสังคมจริงหรือเปล่าเมื่อเครือข่ายทางสังคมเป็นนิติบุคคลเมื่อ บริษัท ต่างๆ . ในกรณีที่รุนแรงอีเธอร์เน็ตท้องถิ่นเป็นทรีแบบลอจิกที่ (อาจ) กราฟย่อยของรูปแบบทางกายภาพของการเชื่อมต่อสายไฟและรูปแบบของการเชื่อมต่อสายนั้นอาจไม่ใช่สายไฟมากกว่าต้นไม้มากเกินไป

"เครือข่ายคอมพิวเตอร์จริง" มีรสชาติและเลเยอร์มากมาย บางคนดูเหมือนเครือข่ายโซเชียล แต่บางคนก็ไม่ชอบ สำหรับข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้ฉันอย่างไม่สุภาพอ้างอิงถึงบทที่ 2 ของวิทยานิพนธ์ของฉัน - http://home.manhattan.edu/~peter.boothe/thesis.pdf


ฉันสนใจเครือข่ายทางกายภาพเป็นหลัก (เช่นเลเยอร์ IP) ขอบคุณสำหรับลิงค์ฉันจะตรวจสอบ
Kaveh

2
เลเยอร์ IP ไม่ใช่เลเยอร์ทางกายภาพ MPLS และเทคโนโลยีการสลับวงจรอื่น ๆ ทำลายสมมติฐานนี้ ชั้นทางกายภาพคือสายไฟ เรายังมีลิงค์หลายสายที่ดูเหมือนจะเป็นอีเธอร์เน็ตเดี่ยว! คำถามของ "สิ่งที่เลเยอร์" อยู่ลึกกว่าการตรวจสอบครั้งแรกอาจแนะนำและต้องใช้ความคิดอย่างระมัดระวัง ฉันขอแนะนำให้คุณคิดถึงคุณสมบัติที่คุณอาจต้องการให้เครือข่ายหาเลเยอร์ที่การวิเคราะห์ทอพอโลยีจะช่วยให้คุณวิเคราะห์คุณสมบัตินั้นได้ดีที่สุดและหวังว่าข้อมูลจะพร้อมใช้งาน
Peter Boothe

7

nuvβed/(Lα)dL

หุ่นขี้ผึ้งการกำหนดเส้นทางการเชื่อมต่อหลายจุดเชื่อมต่อ IEEE J. Select พื้นที่ชุมชน 6 (9), 1617-1622, 1988. Zegura, Calvert, Bhattacharjee, วิธีสร้างแบบจำลอง Internetwork , Proc. IEEE INFOCOM '96, 1996


5

วอลเตอร์วิลลิงเงอร์ได้สร้างอาชีพด้วยการใช้กราฟที่ไร้มาตราส่วนเพื่อสร้างแบบจำลองเครือข่าย มีมากเกินไปที่จะกล่าวอ้างดังนั้นฉันจะชี้ให้คุณเข้า DBLP ของเขา จุดสำคัญในโมเดลเหล่านี้คือพวกเขามีคุณสมบัติคล้ายกับเครือข่าย "ของจริง" ที่ไม่ได้ถูกจับโดย G (n, p)



5

แทนที่จะค้นหาอย่างเอาเป็นเอาตายให้เหตุผลและวิเคราะห์รูปแบบที่เฉพาะเจาะจงคุณอาจต้องการใช้ข้อมูลชีวิตจริงที่คุณมี (ถ้าคุณมี) นั่นหมายถึงการกำหนดรูปแบบความน่าจะเป็นทั่วไปและการฝึกอบรมพารามิเตอร์ของมันให้ข้อมูลของคุณ (เช่นโดยการประมาณโอกาสสูงสุด)

Sพี1:(S)S|พี2:εพี1,พี2

เห็นได้ชัดว่าไวยากรณ์ที่เฉพาะเจาะจงสามารถ (และควร!) ใช้ความรู้เกี่ยวกับโดเมน พิจารณาเช่นไวยากรณ์ที่แตกต่างที่ใช้สำหรับการทำนายโครงสร้างรอง RNA ในDowell, Eddy (2004)เพื่อลิ้มรส

ค้นหารายละเอียดบางอย่างเกี่ยวกับเทคนิคนี้ในWeinberg, Nebel (2010) ฉันไม่ทราบว่าสามารถนำไปใช้กับกราฟทั่วไปได้อย่างไร

หากคุณจำเป็นต้องใช้พลังงานมากกว่าที่คุณจะสามารถย้ายไปยังสิ่งที่ชอบหลายมิติ (S) ซีเอฟจี (เช่นเซกิคาโต (2008) ) หรือ length- / ตำแหน่งขึ้นอยู่กับ SCFG ( Weinberg, Nebel (2010) )


1
นี่มันเจ๋ง แต่ SCFG ไม่มีบริบทบังคับให้ผู้เรียนละเลยโครงสร้างระดับโลกบางอย่างที่เครือข่ายในชุดการฝึกอบรมของคุณอาจมีหรือไม่?
Artem Kaznatcheev

ใช่แล้วคุณสมบัติที่ไม่ใช่บริบทจะหายไป แต่โปรดทราบว่าคุณสมบัติเช่น (โดยเฉลี่ย) องศาโหนดสามารถบันทึกได้ สำหรับข้อมูลเพิ่มเติมโปรดดูการแก้ไขของฉัน
Raphael

ขอบคุณ! ฉันจะมองอย่างใกล้ชิด MDP ที่ซ่อนไม่สามารถจับภาพคุณสมบัติเช่นระดับเฉลี่ยได้หรือไม่ ดูเหมือนว่าสิ่งที่ภาษาปกติควรจะสามารถจับภาพหรือฉันสับสน? (นอกจากนี้ประเด็นย่อย: ลิงก์ Weinberg, Nebel มีอักขระต่อท้ายที่ฆ่าลิงก์เป็นที่ชัดเจนว่าคุณต้องการลิงก์ใด แต่ถ้าคุณทำการแก้ไขเพิ่มเติมมันอาจคุ้มค่าที่จะแก้ไข)
Artem Kaznatcheev

แน่นอนว่าฉันแค่ต้องการชี้ให้เห็นว่าคุณสามารถครอบคลุมคุณลักษณะระดับโลกบางอย่างโดยใช้โมเดลนั้น REG สามารถครอบคลุมบางส่วนเช่นกัน แต่จะล้มเหลวในการสร้างแบบจำลองโครงสร้างที่ไม่ใช่ปกติโดยเนื้อแท้ (ขอบคุณคง)
กราฟิลส์

3

G(n,พี)G(n,ม.)

อย่างที่คุณอาจจะรู้ว่ามีความแตกต่างระหว่างกราฟการเชื่อมต่อสำหรับเวิลด์ไวด์เว็บและตรงข้ามกับกราฟการเชื่อมต่อสำหรับโครงสร้างพื้นฐานอินเทอร์เน็ต แน่นอนว่าฉันไม่ได้อ้างว่าเป็นผู้เชี่ยวชาญ แต่ฉันได้เห็นกระดาษของ Li, Alderson, Tanaka, Doyle และ Willinger "สู่ทฤษฎีของกราฟมาตราส่วนฟรี: นิยามคุณสมบัติและผลกระทบ"ที่แนะนำตัวชี้วัด 'เพื่อวัด' มาตราส่วน - freeness 'ของกราฟ (ด้วยคำจำกัดความของกราฟขนาดฟรีที่ยังอยู่ภายใต้การอภิปรายเท่าที่ฉันรู้) ที่อ้างว่ามีรูปแบบกราฟที่สร้างกราฟที่คล้ายกับการเชื่อมต่ออินเทอร์เน็ตที่เราเตอร์ ชั้น

ต่อไปนี้เป็นรูปแบบการกำเนิดเพิ่มเติมอีกเล็กน้อยที่อาจเป็นที่สนใจ:

Berger, Borgs, Chayes, D'Souza และกระดาษของ Kleinberg "เอกสารยืนยันการเข้าร่วมการแข่งขันพิเศษ"

ความทนทานสูงสุดของคาร์ลสันและดอยล์: กลไกสำหรับกฎหมายพลังงานในระบบที่ออกแบบมา

จุดสำคัญของ Molloy และ Reed สำหรับกราฟสุ่มที่มีลำดับองศาที่กำหนดซึ่งแนะนำ "รูปแบบการกำหนดค่าที่ถูกลบ"

Newman's Clustering และสิ่งที่แนบมาพิเศษในเครือข่ายที่กำลังเติบโต (ซึ่งได้รับการกล่าวถึงแล้ว)

เราสามารถสร้างการกระจายระดับอย่างชัดเจนและสร้างกราฟด้วยวิธีนี้ แต่ก็ไม่มีความชัดเจนสำหรับฉันว่าโมเดลอินเทอร์เน็ตกราฟที่เราเตอร์อยู่ใกล้แค่ไหน

แน่นอนว่ามีวรรณคดีอีกหลายเรื่องที่เกี่ยวกับเรื่องนี้และฉันได้ให้ความสำคัญเพียงไม่กี่อย่าง (ที่ฉันคิดว่าเป็น)

G(n,พี)G(n,ม.)) ไม่ทำงานอย่างถูกต้องเนื่องจากระดับการแจกแจงแบบอิสระหรือระดับพลังงานของกฎกระจายกราฟแบบสุ่มเบี่ยงเบนช่วงเวลาที่สองในการกระจายระดับ ฉันไม่ได้อ้างว่ารู้มากพอเกี่ยวกับหัวข้อที่จะทำการอ้างสิทธิ์เกี่ยวกับบทพิสูจน์ที่ "มากที่สุด" แต่จากสิ่งที่ฉันได้เห็นหนึ่งในไม่กี่บรรทัดแรกของการพิสูจน์สำหรับคุณสมบัติในกราฟสุ่ม Erdos-Renyi ถือว่าแน่นอน ช่วงเวลาที่สองในการกระจายระดับ จากมุมมองของฉันนี่ทำให้รู้สึกว่าช่วงเวลาที่สองที่ จำกัด ทำให้ Erdos-Renyi กราฟเหมือนต้นไม้ในท้องถิ่นมากขึ้น (ดู Mertens และ Montanari ข้อมูลฟิสิกส์และการคำนวณ) ซึ่งให้คุณสมบัติ / พา ธ / โครงสร้างอิสระอย่างมีประสิทธิภาพ เนื่องจากระดับพลังงาน - กฎกระจายกราฟแบบสุ่มมีช่วงเวลาที่สองที่แตกต่างกันโครงสร้างเหมือนต้นไม้ในท้องถิ่นนี้จะถูกทำลาย (และต้องใช้เทคนิคการพิสูจน์ที่แตกต่างกัน?) ฉันยินดีที่จะให้สัญชาตญาณนี้เป็นโมฆะหากผู้ที่มีความรู้หรือความเข้าใจลึกซึ้งยิ่งขึ้นแสดงให้เห็นว่าทำไมสิ่งนี้ถึงไม่เป็นเช่นนั้น

หวังว่าจะช่วย


3

แม้ว่าจะเป็นหัวข้อเก่าที่ฉันตอบเนื่องจากมีหลายคนที่ยังคงเข้าชมโพสต์ดังกล่าว ฉันมีแรงจูงใจจากความคิดเห็นในการตอบกลับอื่น

โมเดล Barabasi-Albert และโมเดลอื่น ๆ ที่สร้างกราฟที่ไม่มีมาตราส่วนได้รับการเสนอเพื่อจำลองอินเทอร์เน็ตในระดับเราเตอร์และในระดับระบบอัตโนมัติ แม้ว่าในขั้นต้นโมเดลดังกล่าวซึ่งถือว่าถูกต้อง แต่กลับกลายเป็นว่าเราไม่มีภาพที่สมบูรณ์ของโทโพโลยีอินเทอร์เน็ตเนื่องจากปัญหาในการค้นหาลิงก์ทั้งหมด แม้ว่ามันจะเชื่อว่าเป็นหางที่หนัก แต่ก็เป็นงานที่กำลังดำเนินอยู่

สำหรับการอ้างอิงของคุณคุณสามารถอ่านได้: RG Clegg, C Di Cairano-Gilfedder, S Zhou, ลักษณะที่สำคัญในการสร้างแบบจำลองกฎหมายพลังงานของอินเทอร์เน็ต


2

มีหนังสือหลายเล่มเกี่ยวกับกราฟสุ่มเช่นหนังสือของBollobásและมีกราฟสุ่มหลายแบบเช่นลิงก์วิกิพีเดียขนาดเล็กในโลกหรือลิงค์แนบวิกิพีเดียที่มีสิทธิพิเศษไปยังเครือข่ายแบบจำลองที่มีระยะห่างระหว่างคอมพิวเตอร์ขนาดเล็กหรือระดับการกระจายตามกฎหมายพลังงาน ตามลำดับ

ฉันคิดว่าไม่มีวิธีง่ายๆในการสร้างแบบจำลองเครือข่ายคอมพิวเตอร์จริง แต่ฉันค่อนข้างแน่ใจว่า G (n, p) จะไม่สร้างแบบจำลองได้ดีมาก ถ้าคุณไม่ทำงานกับเครือข่ายที่มีการจัดการเฉพาะ


2

คำแนะนำของฉันคือกระดาษสำรวจที่เขียนโดยนักประดิษฐ์ของเครื่องกำเนิดกราฟสุ่ม R-MAT http://portal.acm.org/citation.cfm?id=1132954

เครื่องกำเนิดกราฟสุ่ม R-MAT นั้นง่ายและใช้กันอย่างแพร่หลาย ตัวอย่างเช่นเครื่องกำเนิดไฟฟ้านี้ใช้ในเกณฑ์มาตรฐาน Graph500 ( http://www.graph500.org/ )

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.