“ ปัญหาที่ยากจริงๆอยู่ตรงไหน” หรือไม่? แนวคิดปัจจุบันเกี่ยวกับเรื่องนี้คืออะไร?


27

ฉันพบว่าเอกสารนี้น่าสนใจมาก เพื่อสรุป: มันอธิบายว่าทำไมในทางปฏิบัติคุณไม่ค่อยพบตัวอย่างที่เลวร้ายที่สุดของปัญหา NP-complete แนวคิดในบทความนี้คืออินสแตนซ์มักจะอยู่ภายใต้การควบคุมที่มากเกินไปหรือน้อยเกินไปซึ่งทั้งสองวิธีนั้นค่อนข้างง่ายต่อการแก้ไข จากนั้นเสนอปัญหาสองสามข้อเพื่อวัด 'ข้อ จำกัด ' ปัญหาเหล่านั้นดูเหมือนจะมี 'การเปลี่ยนเฟส' จาก 0 โอกาสของโซลูชันเป็นโอกาส 100% จากนั้นตั้งสมมติฐาน:

  1. ว่าปัญหา NP-complete (หรือแม้แต่ปัญหา NP ทั้งหมด) มีการวัด 'ข้อ จำกัด '
  2. สำหรับปัญหา NP-complete แต่ละข้อคุณสามารถสร้างกราฟของความน่าจะเป็นของวิธีแก้ปัญหาที่มีอยู่ในรูปแบบของ 'ข้อ จำกัด ' ยิ่งกว่านั้นกราฟนั้นจะมีการเปลี่ยนเฟสซึ่งความน่าจะเป็นนั้นเพิ่มขึ้นอย่างรวดเร็วและอย่างมาก
  3. ตัวอย่างกรณีที่เลวร้ายที่สุดของปัญหาที่เกิดขึ้นกับ NP นั้นอยู่ในช่วงการเปลี่ยนผ่าน
  4. ความจริงที่ว่าปัญหาอยู่ที่การเปลี่ยนเฟสยังคงไม่เปลี่ยนแปลงภายใต้การเปลี่ยนแปลงของปัญหา NP-complete หนึ่งไปยังอีกปัญหาหนึ่ง

บทความนี้ตีพิมพ์ในปี 1991 คำถามของฉันคือมีการวิจัยติดตามความคิดเหล่านี้ในช่วง 25 ปีที่ผ่านมา? และถ้าเป็นเช่นนั้นกระแสหลักคิดในปัจจุบันคืออะไร? พวกเขาพบว่าถูกต้องไม่ถูกต้องไม่เกี่ยวข้องหรือไม่


อินสแตนซ์สุ่มของ CSP, k-sat, k-colour ได้รับการศึกษาอย่างกว้างขวางโดยชุมชน TCS ตัวอย่างเช่นความจริงที่ว่าความหนาแน่น / 'ข้อ จำกัด ' ที่เราสามารถแก้ปัญหาได้อย่างมีประสิทธิภาพมักจะต่ำกว่าเกณฑ์ที่ความน่าจะเป็นของโซลูชันที่มีอยู่ลดลงจาก 1 ถึง 0 whp ได้รับความสนใจเป็นจำนวนมาก
JWM

ความน่าจะเป็นที่ธรณีประตูของ 'การแก้ปัญหาอย่างง่าย' เป็นเรื่องโกหก (พูดคร่าวๆ)? เป็นเช่น 0.2 หรือมากกว่าเช่น 0.001 หรือไม่
dimpol

1
@dimpol มักจะไม่มีการกำหนดเกณฑ์ที่แม่นยำเช่นนั้น ประเด็นคือสิ่งที่ "มีข้อ จำกัด " ความน่าจะเป็นไปที่ 0 หรือ 1 ด้วยขนาดอินพุต คำสั่งทั่วไปคือ "อัลกอริทึม A แก้ปัญหาอินสแตนซ์ 3-SAT แบบสุ่มที่มีตัวแปรและคำสั่งด้วยความน่าจะเป็นอย่างน้อยโดยที่ไปที่ 1 กับ " เกณฑ์คือค่าของที่น่าจะเป็นไปจากพุ่งไปที่ 0 ถึงพุ่งไป 1nΔnพีnพีnnΔ
Sasho Nikolov

คิดว่าความคิดนั้นมีอิทธิพลมากโดยทั่วไปและมีเอกสารจำนวนมากที่เกี่ยวข้องกับหัวข้อนี้และการวิจัยยังคงดำเนินต่อไป อย่างไรก็ตามมันเป็นแนวคิดการสลับสับเปลี่ยนเนื่องจากการเปลี่ยนเฟสมาจากฟิสิกส์และ (คำตอบ MAT ใหม่ด้านล่าง) บางทีนักวิทยาศาสตร์คอมพิวเตอร์อาจสงสัยเกี่ยวกับความสำคัญของพวกเขามากขึ้นและดูเหมือนว่าจะเป็นแนวคิดเชิงประจักษ์ / การทดลองมากกว่า อาจพยายามหาคำตอบที่ pt หากคนอื่นเห็นด้วยกับความคิดเห็นนี้ แต่สำหรับตอนนี้เชิญ / จะ defn ขอสนับสนุนการอภิปราย / การวิเคราะห์ต่อไปในการสนทนาวิทยาศาสตร์คอมพิวเตอร์ทฤษฎี
vzn

1
ดูว่าการเปลี่ยนเฟสในปัญหาที่เกิดขึ้นโดยทั่วไปเป็นอย่างไร ยังคิดว่า Walsh 1998 ขอบมีดที่มีข้อ จำกัด มีความสำคัญ & ไม่ได้รับการติดตามมากมันเกี่ยวข้องกับจุดเปลี่ยน แต่อาจไม่ตรงกับแนวคิดเดียวกัน ... กระดาษไม่ได้พูดถึงเศษส่วนโดยตรง แต่คิดว่ามีการชี้นำอย่างมาก ความคล้ายคลึงกันของตัวเอง, ความแปรปรวนของสเกล ฯลฯ
vzn

คำตอบ:


26

นี่คือบทสรุปคร่าวๆของสถานะบนพื้นฐานของงานนำเสนอที่ได้รับจากVardiที่การประชุมเชิงปฏิบัติการเรื่องทฤษฎีแบบ จำกัด และอัลกอริทึม (2012):

พบว่ากรณียากอยู่ที่การเปลี่ยนเฟสจากภูมิภาคที่อยู่ภายใต้การ จำกัด มากเกินไป การคาดเดาพื้นฐานคือมีการเชื่อมต่อที่แข็งแกร่งระหว่างการเปลี่ยนเฟสและความซับซ้อนในการคำนวณของปัญหา NP

Achlioptas – Coja-Oghlan พบว่ามีความหนาแน่นในภูมิภาคที่น่าพอใจที่พื้นที่การแก้ปัญหาแตกเป็นกลุ่มเล็ก ๆ จำนวนมาก Vinay Deolalikar ตามความพยายามอันโด่งดังของเขาในการพิสูจน์จากการสันนิษฐานว่าการสั่นสะเทือนหมายถึงความแข็งในการคำนวณ หลักฐานของ Deolalikar นั้นข้องแวะกับข้อเท็จจริงที่ว่า XOR-SAT นั้นอยู่ในและมันทำให้ชิ้นส่วนเสียหาย ดังนั้นการสั่นสะเทือนจึงไม่สามารถใช้ในการพิสูจน์ความแข็งของการคำนวณได้Pยังไม่มีข้อความPP

กระแสความคิดหลักดูเหมือนจะเป็น (ตามที่ระบุไว้โดย Vardi) ว่าการเปลี่ยนเฟสนั้นไม่ได้เชื่อมโยงกับความซับซ้อนในการคำนวณ

ในที่สุดนี่คือบทความที่ตีพิมพ์ในธรรมชาติซึ่งตรวจสอบการเชื่อมต่อระหว่างการเปลี่ยนเฟสและความแข็งในการคำนวณของ K-SAT


ขอบคุณสำหรับภาพรวมน่าเสียดายที่สิ่งนี้ไม่ได้นำไปสู่การค้นพบที่แท้จริง
dimpol

1
ฉันคิดว่าปรากฏการณ์ที่แตกเป็นเสี่ยง ๆ สามารถพิจารณาออกกฎคลาสอัลกอริธึมการค้นหาในท้องถิ่นซึ่งเป็นฐานของอัลกอริทึมฮิวริสติกจำนวนมากสำหรับปัญหา NP-hard
Kaveh

3
การพูดคุย / วิดีโอที่คล้ายกัน / แก้ไขบ้างโดย Vardi, 2014, การเปลี่ยนเฟสและความซับซ้อนในการคำนวณ , สถานีวิจัยระหว่างประเทศของ Banff
vzn

@vzn Nice ต้องดูวิดีโอโดย Vardi
Mohammad Al-Turkistany

14

ใช่มีการทำงานมากมายตั้งแต่ Cheeseman, Kanefsky และ Taylor ในปี 1991

ค้นหาความคิดเห็นเกี่ยวกับการเปลี่ยนเฟสของปัญหา NP-Complete จะให้ผลลัพธ์มากมาย หนึ่งรีวิวดังกล่าวคืออาร์ตมันน์และไวต์ท์ [1] สำหรับการแนะนำระดับที่สูงขึ้นโปรดดูบทความนักวิทยาศาสตร์อเมริกัน Brian Hayes [2] [3]

Cheesemen, Kanefsky และ Taylor 's 1991 เอกสารเป็นกรณีที่โชคร้ายของนักวิทยาศาสตร์คอมพิวเตอร์ที่ไม่ให้ความสนใจกับวรรณคดีคณิตศาสตร์ ใน Cheeseman กระดาษของ Kanefsky และ Taylor พวกเขาระบุวงจร Hamiltonian ว่ามีการเปลี่ยนแปลงเฟสด้วยค่าใช้จ่ายในการค้นหาที่ใกล้กับค่าวิกฤต รูปแบบกราฟแบบสุ่มที่ใช้คือกราฟสุ่ม Erdos-Renyi (ความน่าจะเป็นขอบคงที่หรือการแจกแจงระดับเกาส์เทียบเท่า) กรณีนี้ได้รับการศึกษามาอย่างดีก่อนที่ Cheeseman และทุกคนในปีพ. ศ. 2534 ที่รู้จักกันดีว่าอัลกอริธึมเวลาเชิงพหุนามสำหรับกราฟของคลาสนี้แม้ในหรือใกล้ถึงจุดวิกฤติ "กราฟสุ่ม" ของ Bollobas [4] เป็นข้อมูลอ้างอิงที่ดี หลักฐานดั้งเดิมที่ฉันเชื่อว่าถูกนำเสนอโดย Angliun และ Valiant [5] พร้อมการปรับปรุงเพิ่มเติมโดย Bollobas, Fenner และ Frieze [6] หลังจาก Cheeseman

การเปลี่ยนเฟสสำหรับวงจร Hamiltonian ในกราฟสุ่ม Erdos-Renyi มีอยู่ในแง่ที่ว่ามีการเปลี่ยนแปลงอย่างรวดเร็วของความน่าจะเป็นในการหาวิธีแก้ปัญหา แต่สิ่งนี้ไม่ได้แปลเป็นการเพิ่มความซับซ้อนของ มีอัลกอริธึมเวลาเชิงพหุนามว่าเกือบจะหาวัฏจักรแฮมิลตันในกราฟสุ่มของ Erdos-Renyi แม้ในช่วงการเปลี่ยนภาพที่สำคัญทั้งในทางทฤษฎีและในทางปฏิบัติ

การสำรวจเผยแผ่ [8] ประสบความสำเร็จในการหาตัวอย่างที่น่าพอใจสำหรับการสุ่ม 3-SAT ใกล้กับจุดวิกฤติ ความรู้ในปัจจุบันของฉันมีสนิมเล็กน้อยดังนั้นฉันไม่แน่ใจว่ามีความคืบหน้าในการค้นหาอัลกอริธึมที่มีประสิทธิภาพสำหรับกรณีที่ไม่น่าพอใจใกล้กับจุดวิกฤติหรือไม่ 3-SAT เท่าที่ฉันรู้เป็นหนึ่งในกรณีที่ "ง่าย" ในการแก้ปัญหาถ้าเป็นที่น่าพอใจและใกล้ถึงจุดวิกฤติ แต่ไม่ทราบ (หรือยาก?) ในกรณีที่ไม่น่าพอใจใกล้กับจุดวิกฤติ

ความรู้ของฉันค่อนข้างล้าสมัยไปแล้ว แต่ครั้งสุดท้ายที่ฉันดูเรื่องนี้ในเชิงลึกมีบางสิ่งที่โดดเด่นสำหรับฉัน:

  • Hamiltonian Cycle เป็น "ง่าย" สำหรับกราฟสุ่ม Erdos-Renyi ปัญหายากอยู่ที่ไหน
  • การแบ่งพาร์ติชั่นควรจะสามารถแก้ไขได้เมื่ออยู่ไกลมากในความน่าจะเป็น 0 หรือ 1 แต่ไม่มีอัลกอริธึมที่มีประสิทธิภาพ (สำหรับความรู้ของฉัน) สำหรับขนาดอินสแตนซ์ปานกลาง (1,000 จำนวน 500 บิตแต่ละบิต ขั้นตอนวิธีการที่ทันสมัย) [9] [10]
  • 3-SAT นั้น "ง่าย" สำหรับอินสแตนซ์ที่น่าพอใจซึ่งอยู่ใกล้กับขีด จำกัด วิกฤตแม้กระทั่งขนาดอินสแตนซ์ขนาดใหญ่ (ตัวแปรนับล้าน) แต่ยากสำหรับอินสแตนซ์ที่ไม่น่าพอใจใกล้กับจุดวิกฤติ

ฉันลังเลที่จะรวมไว้ที่นี่เพราะฉันยังไม่ได้เผยแพร่เอกสารที่ผ่านการตรวจสอบจากเพื่อน แต่ฉันเขียนวิทยานิพนธ์ของฉันในเรื่อง แนวคิดหลักคือคลาสที่เป็นไปได้ของการสุ่มตระการตา (วงจรมิลโตเนียน, ปัญหาจำนวนพาร์ติชัน, ฯลฯ ) ที่มี "ความแข็งภายใน" เป็นสิ่งที่มีคุณสมบัติ การแจกแจงที่เสถียรเป็นหนึ่งในการแจกแจงที่เป็นธรรมชาติมากขึ้นด้วยคุณภาพนี้การมีกฏของกฏพลังงานและสามารถเลือกอินสแตนซ์สุ่มจาก NP-Complete ตระการตา ฉันให้หลักฐานที่อ่อนแอว่าสามารถพบอินสแตนซ์วัฏจักรของ Hamiltonian Cycle ได้ยากหากเลือกกราฟสุ่มที่มีการแจกแจงระดับ Levy-เสถียรแทนการแจกแจงแบบปกติ ถ้าไม่มีอะไรอย่างน้อยก็จะให้จุดเริ่มต้นสำหรับการทบทวนวรรณกรรม

[1] AK Hartmann และ M. Weigt การเปลี่ยนเฟสในปัญหาการหาค่าเหมาะที่สุดสำหรับ Combinatorial: พื้นฐาน, อัลกอริทึมและกลศาสตร์เชิงสถิติ Wiley-VCH, 2005

[2] บีเฮย์ส ปัญหาที่ยากที่สุดที่ง่ายที่สุด นักวิทยาศาสตร์อเมริกัน 90 (2), 2002

[3] บีเฮย์ส บนธรณีประตู นักวิทยาศาสตร์อเมริกัน 91 (1), 2003

[4] B. Bollobás กราฟสุ่มรุ่นที่สอง สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์นิวยอร์ก 2544

[5] D. Angluin และ LG Valiant อัลกอริธึมอย่างรวดเร็วสำหรับวงจรแฮมิลตันและการจับคู่ J. คอมพิวเตอร์ Syst วิทย์, 18: 155–193, 1979

[6] B. Bollobás, TI Fenner และ AM Frieze อัลกอริทึมสำหรับการค้นหาเส้นทางแฮมิลตันและรอบในกราฟสุ่ม Combinatorica, 7: 327–341, 1987

[7] B. Vandegriend และ J. Culberson การเปลี่ยนเฟส G n, m ไม่ยากสำหรับปัญหาวัฏจักรของมิลโตเนียน J. ของการวิจัย AI, 9: 219-245, 1998

[8] A. Braunstein, M. Mézardและ R. Zecchina การเผยแพร่การสำรวจ: อัลกอริทึมสำหรับความพึงพอใจ โครงสร้างและอัลกอริธึมแบบสุ่ม, 27: 201–226, 2005

[9] I. Gent และ T. Walsh การวิเคราะห์ฮิวริสติกสำหรับการแบ่งหมายเลข หน่วยสืบราชการลับการคำนวณ, 14: 430–451, 1998

[10] CP Schnorr และ M. Euchner การลดพื้นฐาน Lattice: ปรับปรุงอัลกอริธึมเชิงปฏิบัติและแก้ไขปัญหาผลรวมย่อย ในการดำเนินการขั้นพื้นฐานของทฤษฎีการคำนวณ '91, L. Budach, ed., บันทึกการบรรยายในวิทยาการคอมพิวเตอร์, เล่ม 529, หน้า 68–85, 1991


0

25 ปีแห่งการศึกษาและแนวคิดปัจจุบันอยู่ที่ไหน:

+++ ความคิดที่ 1:

จากประสบการณ์ของฉันในการแก้ปัญหาความพึงพอใจฉันได้พบในทางปฏิบัติว่าการเพิ่ม k-clause ที่ถูกต้องลงในสูตรที่เราพยายามแก้ไขนั้นคล้ายกับการตัดสินใจตัวแปร (nk) qbf

ที่ดูเหมือนว่าจะเป็นวิธีการแสดงวิธีการแก้ปัญหา sat ปัจจุบันสำหรับ NP เป็น pspace- ยาก!

+++ ความคิดที่ 2:

อีกแนวคิดหนึ่งคือปัญหา AllQBFs เป็นปัญหาจริงในลำดับชั้นบูลีน ปัญหา AllQBFs คือ: สร้างนิพจน์บูลีน Q ที่ตัดสินใจทั้งหมด 2 ^ n qbfs ของสูตรอาร์ AllQBFs นั้นง่ายเมื่อสูตร R ดั้งเดิมเป็นแบบโมโนโทนหรือ 2-cnf

ดูเหมือนว่า AllQBFs เป็นถนนที่มีความเป็นไปได้ที่จะแสดง QBF เป็น Exp เนื่องจาก Q มักจะเป็นเลขชี้กำลังดังนั้นการประเมินการมอบหมายของ Q (การหาปริมาณของสูตรดั้งเดิม R) นั้นเป็นการอธิบายแบบ ดังนั้นถนนที่จะพิสูจน์ว่า NP คือ Exp อย่างน้อยมีอิฐอยู่สองสามก้อนในนั้น

+++ ความคิดที่ 3: k-cnfs ปกติ

Btw การศึกษาการเปลี่ยนสถานะทั้งหมดได้พลาดปกติ k-cnfs ซึ่งจำนวนการเกิดขึ้นของตัวแปร (ในทิศทางใดทิศทางหนึ่ง) ได้รับการแก้ไขคล้ายกับกราฟปกติขององศา ... k-cnfs ปกติจะหนักกว่ารุ่นมาตรฐานมาก เพราะตัวแปรทั้งหมดดูเหมือนกันในแง่ของข้อ จำกัด

ยี่สิบห้าปีที่ผ่านมาหลังจากอ่านชีสเค้กฉันเพ่งความสนใจไปที่การระบายสีกราฟปกติ ดังนั้นฉันจะละเมิดสิทธิ์คำตอบของฉันที่นี่และนำเสนอผลยี่สิบปีของกราฟปกติ!

+++ ความคิดที่ 4: คะแนนทองคำสำหรับการศึกษาเกณฑ์มาตรฐานที่น่าพอใจ

ฉันได้ศึกษาการระบายสี C ของกราฟจุดยอด N ปกติ D อย่างกว้างขวาง ตารางต่อไปนี้สรุปผลลัพธ์ Golden Point สำหรับการระบายสีกราฟปกติ

สำหรับความน่าจะเป็นสูงอินสแตนซ์แบบสุ่ม N จะพอใจ สำหรับสูงมาก N ^ 2 มีความพึงพอใจ สำหรับ Super High อินสแตนซ์สุ่มของ N ^ 3 นั้นน่าพอใจ

คะแนนสีทองน่าจะสูง (1 - 1 / N) คือ:

C3D5N180 C4D6N18 C4D7N35 C4D8N60 C4D9N180? C5D10N25 C5D11N42 C5D12N72

จุดสีทองที่น่าจะเป็นสูง (1 - 1 / (N ^ 2)) คือ:

C3D5N230? C4D6N18 C4D7N36 C4D8N68 C4D9N ??? C5D10N32 C5D11N50 C5D12N78

จุดสีทองความน่าจะเป็นสูง (1 - 1 / (N ^ 3)) คือ:

C3D5N ??? C4D6N22 C4D7N58 C4D8N72 C4D9N ??? C5D10N38 C5D11N58 C5D12N ??

รายการ C4D9 แสดงถึงสี่สีของกราฟระดับที่เก้า นี่คือการสุ่ม 4cnfs ที่ยากที่สุดที่ฉันพบใน 25 ปีแห่งการแก้ปัญหา ฉันเพิ่งวาดกราฟองศา 172 จุดสุดยอดที่เก้าหลังจากเวลาซีพียูสิบวัน

+++ แนวคิด 5: The C5D16N ???? โกลเด้นพอยต์คาดเดาอย่างอ่อนโยนว่ามีอยู่จริง

ขอบคุณ Daniel Pehoushek


4
นี่ไม่ใช่สถานที่ที่เหมาะสมที่จะนำเสนองานวิจัยที่ไม่ได้เผยแพร่ เขียนบทความอธิบายทุกสิ่งอย่างละเอียดวางไว้บน arxiv หรือที่อื่นแล้วโพสต์ลิงก์ที่นี่พร้อมข้อมูลสรุป
Sasho Nikolov

จุดระบายสีกราฟปกติ C4D9 เป็นจุดที่ยากมากตามชื่อในคำถาม มันต้องการบริบทเล็ก ๆ น้อย ๆ ดังนั้นส่วนที่เหลือของตาราง
daniel pehoushek
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.