เหตุใดการคาดเดาโลภจึงยากมาก?


14

ฉันเพิ่งเรียนรู้เกี่ยวกับการคาดเดาโลภสำหรับSuperstring ปัญหาที่สั้นที่สุด

ในปัญหานี้เราจะได้รับชุดของสตริงs1,,snและเราต้องการที่จะหาที่สั้นที่สุด superstring sเช่นเช่นกันว่าsiปรากฏขึ้นเป็น substring ของss

ปัญหานี้คือปัญหา NP-hard และหลังจากลำดับของเอกสารที่ยาวอัลกอริทึมการประมาณรู้จักที่ดีที่สุดสำหรับปัญหานี้มีอัตราส่วน2+1130 [Paluch '14]

ในทางปฏิบัตินักชีววิทยาใช้อัลกอริทึมโลภต่อไปนี้:

ในแต่ละขั้นตอนให้ผสานสองสตริงที่มีการทับซ้อนสูงสุดกับทุกคู่ (ส่วนต่อท้ายสูงสุดที่เป็นส่วนนำหน้าของสตริงอื่น) และทำซ้ำในอินสแตนซ์ใหม่นี้จนกว่าจะเหลือเพียงหนึ่งสตริง (ซึ่งเป็น superstring )

ที่ถูกผูกไว้ที่ต่ำกว่าของ2ในอัตราส่วนประมาณโลภขั้นตอนวิธีการนี้สามารถได้รับจากการป้อนข้อมูลc(ab)k,(ba)k,(ab)kc

ที่น่าสนใจก็คือการคาดคะเนได้ว่านี่เป็นตัวอย่างที่เลวร้ายที่สุดคือที่บรรลุโลภ2 -approximation สำหรับสั้น Superstring ปัญหา ฉันประหลาดใจมากที่เห็นว่าอัลกอริทึมที่ง่ายและเป็นธรรมชาตินั้นยากที่จะวิเคราะห์

มีสัญชาติญาณข้อเท็จจริงข้อเท็จจริงการสังเกตตัวอย่างที่แนะนำว่าทำไมคำถามนี้ถึงท้าทายหรือไม่


7
หนึ่งในเหตุผลอาจเป็นได้ว่าคุณสมบัติที่เป็นที่รู้จักของการแสดงกราฟมาตรฐานของปัญหา (เช่น Monge และความไม่เท่าเทียมสาม) ไม่เพียงพอสำหรับการพิสูจน์การคาดการณ์โลภ ดูตัวอย่างเช่น Laube, Weinard "ความไม่เท่าเทียมกันแบบมีเงื่อนไขและปัญหาการทำให้เกิดความเชื่อโชคลางที่สั้นที่สุด" และ Weinard, Schnitger "ในการคาดเดาที่ทำให้เกิดความโลภมาก"
Alex Golovnev

@AlexGolovnev: ดูเหมือนคำตอบที่ดีอย่างสมบูรณ์แบบสำหรับฉัน!
Joshua Grochow

@JoshuaGrochow: ขอบคุณ! ตอนนี้ฉันจะขยายไปยังคำตอบ
Alex Golovnev

คำตอบ:


8

ก่อนอื่นให้ฉันลองสรุปสิ่งที่ทราบเกี่ยวกับการเดาโลภ

  1. Blum, Jiang, Li, Tromp, Yannakakisพิสูจน์ให้เห็นว่าอัลกอริทึมโลภให้การประมาณ 4 แบบและKaplan และ Shafrirแสดงให้เห็นว่าการประมาณ 3.5 สำหรับปัญหา Superstring สามัญที่สั้นที่สุด
  2. รุ่นของอัลกอริทึมโลภเป็นที่รู้จักกันเพื่อให้การประมาณ 3 ( Blum, Jiang, Li, Tromp, Yannakakis )
  3. 34
  4. การคาดเดาโลภถือได้ว่าอัลกอริทึมโลภเกิดขึ้นกับการรวมสตริงในลำดับเฉพาะบางอย่าง ( Weinard, Schnitger ; Laube, Weinard )
  5. อัลกอรึทึมของโลภทำให้การบีบอัดTarhio, Ukkonenประมาณ 2 เท่า (ซึ่งถูกกำหนดให้เป็นความยาวทั้งหมดของสายป้อนเข้าลบความยาวของ superstrting ทั่วไปที่สั้นที่สุด)
  6. มีการดำเนินงานที่มีประสิทธิภาพมากของโลภอัลกอริทึมUkkonen

ฉันคิดว่าเหตุผลข้อหนึ่งที่ว่าทำไมการพิสูจน์ความโลภเป็นการยากที่จะพิสูจน์ได้ดังต่อไปนี้ วิธีการส่วนใหญ่ในการพิสูจน์การรับประกันโดยประมาณของอัลกอริทึมโลภจะวิเคราะห์กราฟที่ทับซ้อนกัน (หรือเทียบเท่า, กราฟนำหน้า) ของชุดอินพุตของสตริง เรารู้เพียงบางคุณสมบัติของกราฟเหล่านี้ (เช่น Monge และความไม่เท่าเทียมสามประการ) แต่คุณสมบัติเหล่านี้ไม่เพียงพอสำหรับการพิสูจน์การคาดการณ์โลภ ( Weinard, Schnitger ; Laube, Weinard )

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.