วิทยาศาสตร์คอมพิวเตอร์เชิงทฤษฎี dc.distributed-comp

4

ทำไมเราถึงไม่สามารถพัฒนาทฤษฎีความซับซ้อนแบบรวมศูนย์ของการคำนวณแบบกระจายได้?

สาขาการคำนวณแบบกระจายได้ลดลงอย่างน่าเสียดายในการพัฒนาทฤษฎีทางคณิตศาสตร์เดี่ยวเพื่ออธิบายอัลกอริทึมแบบกระจาย มี 'โมเดล' และกรอบของการคำนวณแบบกระจายที่ไม่เข้ากันได้ การระเบิดที่แท้จริงของคุณสมบัติทางโลกที่แตกต่างกัน (แบบอะซิงโครนัสซิงโครนัสซิงโครนัสบางส่วน) การสื่อสารพื้นฐานต่างๆ (ข้อความผ่านเมื่อเทียบกับหน่วยความจำที่ใช้ร่วมกัน on) ทำให้เรามีโมเดลระบบกรอบงานและวิธีการจำนวนมากที่ไม่สามารถเปรียบเทียบได้ว่าการเปรียบเทียบผลการแก้ปัญหาญาติและขอบเขตที่ต่ำกว่าในโมเดลและกรอบเหล่านี้ได้กลายเป็นยากลำบากยากลำบากและในบางครั้งเป็นไปไม่ได้ คำถามของฉันง่ายมากทำไมถึงเป็นเช่นนั้น อะไรคือพื้นฐานที่แตกต่างกันของการคำนวณแบบกระจาย (จากลำดับคู่กัน) ที่เราไม่สามารถเปรียบเทียบการวิจัยในทฤษฎีแบบรวมศูนย์ของการคำนวณแบบกระจายได้? ด้วยการคำนวณแบบต่อเนื่องเครื่องทัวริงฟังก์ชันแบบเรียกซ้ำและแคลคูลัสแลมบ์ดาทั้งหมดล้วนถูกทำให้เท่าเทียมกัน นี่เป็นเพียงแค่จังหวะแห่งโชคหรือเราทำงานได้ดีในการห่อหุ้มการคำนวณตามลำดับในลักษณะที่ยังไม่สามารถใช้งานได้กับการคำนวณแบบกระจาย กล่าวอีกนัยหนึ่งคือการคำนวณแบบกระจายโดยไม่ยอมให้ทฤษฎีที่สง่างาม (และถ้าเป็นเช่นนั้นอย่างไรและทำไม?) หรือว่าเราไม่ฉลาดพอที่จะค้นพบทฤษฎีดังกล่าวได้หรือไม่? การอ้างอิงเดียวที่ฉันสามารถพบได้ว่าปัญหานี้คือ: " ประเมินสองทศวรรษของการวิจัยทฤษฎีการคำนวณแบบกระจาย " โดย Fischer และ Merritt DOI: 10.1007 / s00446-003-0096-6 การอ้างอิงหรืองานแสดงสินค้าใด ๆ จะเป็นประโยชน์จริงๆ

41 big-picture dc.distributed-comp

10

ตัวแบบขนานปัจจุบันสำหรับการคำนวณ

ปี 1980 ก่อให้เกิดทั้งรถเข็นและBSPรูปแบบของการคำนวณแบบขนาน ดูเหมือนว่าความมั่งคั่งของทั้งสองรุ่นอยู่ในช่วงปลายยุค 80 และต้นยุค 90 พื้นที่เหล่านี้ยังคงทำงานอยู่ในแง่ของการวิจัยสำหรับอัลกอริทึมแบบขนานหรือไม่ มีรุ่นที่ใหม่กว่าที่ซับซ้อนกว่าสำหรับการคำนวณแบบขนานหรือไม่? รุ่นทั่วไปยังอยู่ในสมัยหรือนักวิจัยพยายามที่จะเชี่ยวชาญกับ GPGPU หรือการคำนวณตาม Cloud มาในแฟชั่น?

30 ds.algorithms dc.parallel-comp dc.distributed-comp

4

ปัญหาใหญ่ที่ยังไม่แก้ในระบบแบบกระจาย?

แรงบันดาลใจจากคำถามนี้สิ่งที่เป็นปัญหาที่สำคัญและการแก้ปัญหาที่มีอยู่ซึ่งต้องการการปรับปรุงในโดเมนระบบกระจาย (ทฤษฎี) สิ่งที่ต้องการโปรโตคอลสมาชิกความสอดคล้องของข้อมูล?

23 big-list dc.distributed-comp

1

การประมาณค่าเปอร์เซ็นต์ไทล์ระหว่างโหนดแบบกระจายโดยไม่เปิดเผยค่า

คำถามนี้ถูกโยกย้ายจากการตรวจสอบข้ามเพราะมันสามารถตอบได้ในการแลกเปลี่ยนวิทยาศาสตร์คอมพิวเตอร์ทฤษฎี อพยพ 8 ปีที่ผ่านมา ฉันมีปัญหาที่ไม่เหมือนใครในการแก้ปัญหาและฉันหวังว่าจะมีใครบางคนที่นี่สามารถให้ข้อมูลเชิงลึกเกี่ยวกับวิธีจัดการกับปัญหาได้ดีที่สุด ปัญหา:สมมติว่ามีการแบ่งปันรายชื่อหมายเลข N ในกลุ่มของผู้เข้าร่วมในลักษณะที่ไม่มีผู้เข้าร่วมคนเดียวที่รู้หมายเลขที่พวกเขาแบ่งปัน ผู้เข้าร่วมทุกคนรู้ว่า N (ขนาดของรายการตัวเลข) และผลรวมของตัวเลขทั้งหมดในรายการ แต่ไม่มีอะไรเพิ่มเติมมาก่อน โดยการทำงานร่วมกันเป็นไปได้ที่จะเปรียบเทียบตัวเลขที่แชร์กันสองตัว a และ b ในแบบที่ผู้เข้าร่วมเรียนรู้ว่าคำว่า "a <b" นั้นเป็นจริง แต่ไม่มีอะไรเพิ่มเติม อย่างไรก็ตามนี่เป็นสิ่งที่มีราคาแพงมากที่ต้องทำ (อ่าน: อาจใช้เวลาหลายวินาทีหรืออาจเป็นนาทีเพื่อทำการเปรียบเทียบให้เสร็จสิ้น) ดูจุดสิ้นสุดของโพสต์นี้สำหรับข้อมูลเพิ่มเติมอีกเล็กน้อยว่าเป็นไปได้อย่างไร ในตอนท้ายของวันคู่กรณีต้องการส่งออกซึ่งดัชนีในรายการนั้นตรงกับ "เปอร์เซ็นต์ K สูงสุด" (K% ซึ่งมากที่สุด) แบ่งปันหมายเลขในรายการ ซึ่งแน่นอนว่าสามารถทำได้โดยการเรียงลำดับหรือใช้อัลกอริธึมการเลือก "top K" อย่างไรก็ตามสิ่งเหล่านี้มักใช้การเปรียบเทียบที่น่าเกรงขามซึ่งควรหลีกเลี่ยง (นี่คือ O (n log n) หรือ O (n) ที่มีค่าคงที่ซ่อนอยู่ค่อนข้างใหญ่) อีกทางเลือกหนึ่งคือ "เดา" ที่ตัวเลข X …

23 cr.crypto-security dc.distributed-comp st.statistics privacy

4

เหตุใดปัญหาฉันทามติจึงสำคัญมากในการคำนวณแบบกระจาย

ในการคำนวณแบบกระจายปัญหาฉันทามติดูเหมือนจะเป็นหนึ่งในหัวข้อหลักที่ดึงดูดการวิจัยอย่างเข้มข้น โดยเฉพาะอย่างยิ่งกระดาษ "เป็นไปไม่ได้ของฉันทามติกระจายกับกระบวนการหนึ่งผิดพลาด" ที่ได้รับ2001 PODC มีอิทธิพลรางวัลกระดาษ เหตุใดปัญหาฉันทามติจึงสำคัญมาก เราจะประสบความสำเร็จได้อย่างไรด้วยฉันทามติทั้งในทางทฤษฎีและในทางปฏิบัติ? การอ้างอิงหรืองานแสดงสินค้าใด ๆ จะเป็นประโยชน์จริงๆ

19 reference-request big-picture dc.distributed-comp

4

ปัญหาการคำนวณที่มีขนาดใหญ่อย่างไร้ขีด จำกัด แต่ในพื้นที่

คำถามนี้เป็นคำถามแรงบันดาลใจจากความคิดเห็น Jukka Suomela ทำในคำถามอื่น ตัวอย่างของปัญหาการคำนวณที่มีขนาดใหญ่มาก แต่ จำกัด เฉพาะในเครื่อง (และอัลกอริทึม) คืออะไร กล่าวอีกนัยหนึ่งตัวอย่างของการคำนวณที่หยุดในเวลา จำกัด ซึ่งทัวริงแต่ละเครื่องอ่านและประมวลผลข้อมูลที่ จำกัด เท่านั้น แต่การคำนวณทั้งหมดช่วยแก้ปัญหาขนาดไม่ จำกัด

14 dc.distributed-comp

1

พิสูจน์ความถูกต้องของ Paxos คลาสสิคและ Fast Paxos

ฉันกำลังอ่านกระดาษ "Fast Paxos"โดย Leslie Lamport และติดอยู่กับบทพิสูจน์ความถูกต้องของทั้ง Paxos คลาสสิคและ Fast Paxos สำหรับความสอดคล้องค่าเลือกโดยผู้ประสานงานในขั้นตอนที่ 2ในรอบฉันควรตอบสนองความโวลต์vv2 ก2a2aผมii สำหรับรอบใด ๆ J < ฉันไม่มีค่าอื่นที่ไม่ใช่วีได้รับหรืออาจจะยังไม่ได้รับการคัดเลือกในรอบที่ jคP( v , i ) :CP(v,i):CP(v,i):j < ij<ij < iโวลต์vvJjj สำหรับ Paxos แบบคลาสสิกการพิสูจน์ (หน้า 8) จะแบ่งออกเป็นสามกรณี: , j = k , และj < kโดยที่kเป็นจำนวนรอบที่ใหญ่ที่สุดซึ่งผู้ตอบรับบางคนรายงานผู้ประสานงานโดยเฟส1 bข่าวสาร ฉันไม่เข้าใจอาร์กิวเมนต์สำหรับกรณีที่สาม:k < j < ik<j<ik < j …

13 ds.algorithms dc.distributed-comp proofs

1

มีรายการปัญหาที่ยอมรับในระบบแบบกระจายหรือไม่?

สัปดาห์ที่แล้วผมได้อ่านอีกครั้งของเลสลี่ Lamport 1982 trasncript ของการประชุมที่เขาให้การเกี่ยวกับการแก้ไขปัญหาและการแก้ปัญหาที่ไม่ใช่ปัญหาในการเห็นพ้องด้วย กระดาษสามารถอ่านได้ง่าย แต่สิ่งหนึ่งที่ทำให้ฉันคิดคือการยืนยันดังต่อไปนี้: ปัญหาใด ๆ ถือได้ว่าเป็นปัญหาการกีดกันซึ่งกันและกันหรือปัญหาของผู้ผลิต - ผู้บริโภคหรือการรวมกันของทั้งสอง ฉันต้องการที่จะรู้ว่าคำถามนี้ได้รับการตอบสำหรับกรณีระบบกระจาย มีชุดของปัญหาระบบการกระจายแบบบัญญัติซึ่งสามารถลดปัญหาระบบแบบกระจายที่เป็นไปได้ทั้งหมดได้หรือไม่? รายการมาตรฐานนี้คืออะไร หากไม่มีรายการที่ยอมรับรายการปัจจุบันของปัญหาคืออะไรและมีการลดลงใดบ้าง ตัวอย่างเช่นฉันจะพูดอย่างไร้เดียงสาว่าการเลือกตั้งผู้นำและปัญหาการกีดกันซึ่งกันและกันสามารถลดลงเป็นปัญหาฉันทามติ ฉันจะบอกว่าสแน็ปช็อตแบบกระจายสามารถลดลงเป็นนาฬิกาแบบกระจายได้ มันผิดหรือเปล่าจริงเหรอ? ถ้าเป็นไปได้ฉันอยากให้คำตอบนั้นอ้างอิงถึงกระดาษ / หนังสือที่ตีพิมพ์ซึ่งสนับสนุนการอ้างสิทธิ์ :)

13 reductions dc.distributed-comp concurrency

2

อัลกอริทึมการกระจายอำนาจสำหรับการกำหนดโหนดที่มีอิทธิพลในเครือข่ายสังคม

ในการนี้กระดาษโดย Kempe-Kleinberg-Tardos ผู้เขียนนำเสนอขั้นตอนวิธีโลภขึ้นอยู่กับฟังก์ชั่น submodular เพื่อตรวจสอบโหนดมีอิทธิพลมากที่สุดในกราฟกับการใช้งานเครือข่ายทางสังคมkkk โดยทั่วไปขั้นตอนวิธีจะเป็นดังนี้: S= e m p t y s e t S=empty setS = {\rm empty~set} เลือกโหนดที่มีอิทธิพลต่อบุคคลสูงสุดเรียกมันว่า ; S = S ∪ v 1โวลต์1v1v_1S= S∪ โวลต์1S=S∪v1S = S\cup v_1 ลบและขอบทั้งหมดที่เชื่อมต่อv 1กับส่วนที่เหลือของเครือข่ายโวลต์1v1v_1โวลต์1v1v_1 ทำซ้ำจนกระทั่งมีจุดยอดkSSSkkk ฉันมีคำถามสองข้อเกี่ยวกับโหนดที่มีอิทธิพลในเครือข่ายสังคมออนไลน์ a) มีอัลกอริธึมในการค้นหาวิธีแก้ปัญหาหรือประมาณโดยวิธีการกระจายอำนาจหรือไม่? b) มีใครบ้างที่ใช้อัลกอริธึมอื่น ๆ เช่นอันดับของหน้าและที่คล้ายคลึงกันเพื่อแก้ไขปัญหาเดียวกันหรือไม่?

13 ds.algorithms graph-theory dc.distributed-comp social-sciences heuristics

5

ความล้มเหลวของตัวประมวลผลในการคำนวณแบบกระจายที่ไม่ผิดพลาดหรือไบแซนไทน์

มีความล้มเหลวของตัวประมวลผลหลักสองประเภทในแบบจำลองการคำนวณแบบกระจาย: (1) ความล้มเหลวของข้อผิดพลาด: ตัวประมวลผลหยุดทำงานและจะไม่เริ่มต้นอีกครั้ง (2) ความล้มเหลวของไบแซนไทน์: โปรเซสเซอร์ทำงานผิดพลาดเป็นอันตราย คำถามของฉันคือ: มีความล้มเหลวของตัวประมวลผลประเภทอื่น ๆ อีกบ้างที่ได้รับการศึกษาซึ่งไม่ลดความผิดพลาดหรือความล้มเหลวของไบแซนไทน์ นอกจากนี้คำถามที่เฉพาะเจาะจงมากขึ้น: มีการศึกษารูปแบบที่มีความน่าจะเป็นบางอย่างกระบวนการอยู่ที่ขั้นตอนเวลาและอื่น ๆ ออก? ดังนั้นแต่ละกระบวนการจะเปิดและปิดตามที่เคยเป็นเสื้อtt ฉันสนใจมากที่สุดว่าความล้มเหลวเหล่านี้เกี่ยวข้องกับฉันทามติและปัญหาข้อตกลงการกระจายอื่น ๆ อย่างไร ขอขอบคุณ.

13 reference-request dc.distributed-comp

2

ความซับซ้อนของการนินทาแบบสุ่ม

ปัญหาการนินทาในระบบกระจายมีดังต่อไปนี้ เรามีกราฟมีจุดยอดแต่ละจุดยอดมีข้อความที่ต้องส่งไปยังโหนดทั้งหมดn v m vGGGnnnvvvmvmvm_v ตอนนี้คำถามของฉันอยู่ในบริบทของโมเดลเครือข่ายเฉพาะกิจ (เราสมมติว่าโหนดไม่มีความรู้ก่อนหน้าเกี่ยวกับโทโพโลยีของเครือข่ายองศาเข้าและออกและชุดของเพื่อนบ้าน เฉพาะความรู้ของแต่ละโหนดคือตัวระบุของตนเองและจำนวนโหนดทั้งหมด) ฉันยังสมมติว่าโหนดทั้งหมดมีการเข้าถึงนาฬิกาทั่วโลกและทำงานพร้อมกันในขั้นตอนเวลาไม่ต่อเนื่องเรียกว่ารอบ ความซับซ้อนของอัลกอริทึมในบริบทนี้คือจำนวนรอบที่จำเป็นสำหรับการทำให้สมบูรณ์ ฉันจำได้ว่ามีอัลกอริทึมที่แก้ปัญหาการนินทาในรอบมีความน่าจะเป็นสูง แต่ฉันไม่สามารถหาข้อมูลอ้างอิงได้อีกต่อไปและฉันสงสัยว่าจะมีผลลัพธ์ที่เกิดขึ้นเมื่อไม่นานมานี้หรือไม่O(nlog2n)O(nlog2⁡n)O(n \log ^2 n) แก้ไขตามความคิดเห็นที่รอบคอบ: ในแต่ละรอบโหนดสามารถส่งข้อความไปยังเพื่อนบ้านทั้งหมดและสามารถรับข้อความจากพวกเขา โหนดจะได้รับข้อความในรอบที่กำหนดหากว่าเพื่อนบ้านคนใดคนหนึ่งของมันส่งสัญญาณในรอบนั้น มิฉะนั้นจะเกิดการชนกันและไม่มีโหนดใดได้รับข้อความ

13 reference-request dc.distributed-comp

3

การเปรียบเทียบ DAG ที่มีประสิทธิภาพผ่านเครือข่าย

ในระบบควบคุมเวอร์ชันแบบกระจาย (เช่นMercurialและGit ) มีความจำเป็นที่จะต้องเปรียบเทียบกราฟ acyclic (DAG) ที่มีประสิทธิภาพโดยตรง ฉันเป็นนักพัฒนา Mercurial และเราสนใจฟังเรื่องทฤษฎีที่พูดถึงเรื่องเวลาและความซับซ้อนของเครือข่ายในการเปรียบเทียบ DAG สองตัว DAG ที่เป็นปัญหาจะเกิดขึ้นจากการแก้ไขที่บันทึกไว้ การแก้ไขจะถูกระบุโดยค่าแฮช แต่ละการแก้ไขขึ้นอยู่กับศูนย์ (การกระทำเริ่มต้น), หนึ่ง (การกระทำปกติ) หรือมากกว่า (รวมการกระทำ) ของการแก้ไขก่อนหน้านี้ นี่คือตัวอย่างที่การแก้ไขaจะeทำทีละอย่าง: a --- b --- c --- d --- e การเปรียบเทียบกราฟเข้ามาในรูปภาพเมื่อมีบางส่วนของประวัติและต้องการเรียกคืนส่วนที่ขาด ลองนึกภาพผมมีaที่จะcทำxและyขึ้นอยู่กับc: a --- b --- c --- x --- y ใน Mercurial ฉันจะทำhg pullและดาวน์โหลดdและe: a --- b …

11 cc.complexity-theory dc.distributed-comp directed-acyclic-graph

1

ปัญหาการวิจัยที่สำคัญในการทำธุรกรรมการกระจายคืออะไร?

ข้อมูลประกอบ:การประมวลผลธุรกรรมเป็นหัวข้อวิจัยแบบดั้งเดิมในทฤษฎีฐานข้อมูล ปัจจุบันการทำธุรกรรมการกระจายกำลังนิยมโดยระบบจัดเก็บข้อมูลขนาดใหญ่กระจายซึ่งมักจะเกี่ยวข้องกับข้อมูลพาร์ทิชัน (ที่เรียกว่าชาร์ด) และการจำลองแบบข้อมูล ปัญหาการวิจัยที่สำคัญในการทำธุรกรรมการกระจายคืออะไร? มีทฤษฎีและวิธีแก้ไขปัญหาที่รู้จักกันดีซึ่งต้องการการปรับปรุง (ตามทฤษฎี) หรือไม่? การอ้างอิงใด ๆ ที่ชื่นชม

10 reference-request big-list dc.distributed-comp db.databases

1

อะไรคือข้อได้เปรียบของการออกแบบอัลกอริธึมแบบกระจายที่กำหนดขึ้นได้?

อัลกอริธึมแบบกระจายที่ยืดหยุ่นต่อความล้มเหลวสามารถกำหนดได้หรือน่าจะเป็น ยกตัวอย่างเช่นปัญหาฉันทามติ Paxos เป็นตัวกำหนดในแง่ที่ทำให้สมมติฐานมันทำงานได้เสมอ ใน constrast การลงมติแบบสุ่มทำงานร่วมกับความน่าจะเป็นที่กำหนด อะไรคือข้อได้เปรียบของการออกแบบและใช้อัลกอริธึมที่กำหนดขึ้นได้? สมมติฐานที่อัลกอริธึมกำหนดขึ้นอยู่กับความน่าจะเป็นของการถือครองในความเป็นจริง (สิ่งที่เรียกว่าการครอบคลุมสมมติฐานของพวกเขา) ดังนั้นจึงมีความเป็นไปได้เสมอที่อัลกอริทึมที่กำหนดขึ้นจะไม่ทำงานในความเป็นจริง

10 randomized-algorithms dc.distributed-comp fault-tolerance

2

ทำไม Linearizability ถึงมีคุณสมบัติความปลอดภัยและทำไมคุณสมบัติด้านความปลอดภัยถึงปิด?

ในบทที่ 13 "อะตอมมิกวัตถุ" ของหนังสือ "อัลกอริธึมแจกจ่าย" โดยแนนซี่ลินช์ความเป็นเส้นตรง (หรือที่เรียกว่าอะตอมมิกซิตี้) ได้รับการพิสูจน์แล้วว่าเป็นคุณสมบัติด้านความปลอดภัย กล่าวคือคุณสมบัติการติดตามที่สอดคล้องกันนั้นเป็นแบบnonempty, prefix-closed และ limit-closedตามที่กำหนดไว้ในส่วน 8.5.3 อย่างไม่เป็นทางการคุณสมบัติด้านความปลอดภัยมักถูกตีความว่าเป็นการกล่าวว่าสิ่งที่ "ไม่ดี" บางอย่างไม่เคยเกิดขึ้น จากปัญหานี้ปัญหาแรกของฉันมีดังนี้: linearizability เป็นคุณสมบัติความปลอดภัยคืออะไร? มีผลลัพธ์บางส่วนจากข้อเท็จจริงนี้ในวรรณคดีหรือไม่? ในการศึกษาการจำแนกประเภทของคุณสมบัติความปลอดภัยและคุณสมบัติการอยู่รอดเป็นที่รู้จักกันดีว่าคุณสมบัติความปลอดภัยสามารถกำหนดเป็นชุดปิดในโทโพโลยีที่เหมาะสม ในบทความ"การจำแนกความปลอดภัย - ความคืบหน้า" @ 1993 โดย Amir Pnueli และคณะ โทโพโลยีเมตริกถูกนำมาใช้ โดยเฉพาะอย่างยิ่งสถานที่ให้บริการคือชุดของ ( จำกัด หรือไม่มีที่สิ้นสุด) คำมากกว่าตัวอักษร\คุณสมบัติประกอบด้วยทุกคำอนันต์ดังกล่าวว่าทุกคำนำหน้าของเป็นของ\ตัวอย่างเช่นถ้าดังนั้นΣ ( Φ ) σΦΦ\PhiΣΣ\SigmaA ( Φ )A(Φ)A(\Phi)σσ\sigmaΦ Φ = + B * ( Φ …

10 reference-request fl.formal-languages dc.distributed-comp concurrency

คำถามติดแท็ก dc.distributed-comp