การแก้ Superstring อย่างแน่นอน

สิ่งที่เป็นที่รู้จักกันเกี่ยวกับความซับซ้อนที่แน่นอนของปัญหา superstring ที่สั้นที่สุด? สามารถแก้ไขได้เร็วกว่า $O^*(2^n)$ หรือไม่ มีอัลกอริทึมที่รู้จักกันดีในการแก้ปัญหา superstring ที่สั้นที่สุดโดยไม่ลดลงถึง TSP หรือไม่?

UPD: $O^*(\cdot)$ ยับยั้งปัจจัยพหุนาม

ปัญหา superstring ที่สั้นที่สุดคือปัญหาที่คำตอบคือสตริงที่สั้นที่สุดซึ่งมีแต่ละสตริงจากชุดของสตริงที่กำหนด คำถามนี้เกี่ยวกับการเพิ่มประสิทธิภาพการขยายตัวของปัญหา NP-hard ชื่อ Shortest Superstring (Garey and Johnson, p.228)

— อเล็กซ์ Golovnev
แหล่งที่มา

"ปัญหาเรื่องความเชื่อโชคลาง" คืออะไร?

— Jeffε

ฉันหมายถึงปัญหา Superstring ที่สั้นที่สุดฉันแก้ไขมัน ขอขอบคุณ!

— อเล็กซ์ Golovnev

ถ้าอย่างนั้นโอเคปัญหา "ปัญหาการเป็น superstring ที่สั้นที่สุด" คืออะไร ฉันสามารถนึกถึงปัญหาต่าง ๆ ที่สมควรได้รับชื่อนั้นและอีกสองสามเรื่องที่ควรจะเรียกว่า " ปัญหาการพลิกกลับที่สั้นที่สุด" แต่อาจไม่ใช่ในทางปฏิบัติ ให้บริบทกับเราหน่อยได้ไหม!

— Jeff

ปัญหาของคุณคืออะไร เช่นหากคุณกำลังมองหาสตริงที่สั้นที่สุดในการแยกส่วนจีโนมเนื่องจากการกระจายตัวของจีโนมสร้างกราฟความกว้างของต้นไม้คุณสามารถมีอัลกอริทึมที่รวดเร็ว แต่ถ้าคุณสนใจที่เร็วกว่าอัลกอริธึมที่มีอยู่คำตอบของคุณคือ ใน TSP (เนื่องจากการลดลงอย่างง่าย) นอกจากนี้ยังมี

อัลกอริทึมในกราฟความกว้างแผนภูมิต้นไม้ที่ถูก จำกัด

O^{*} (2^{\sqrt{n}})

$O^*(2^{\sqrt n})$

— Saeed

@AlexGolovnev ใช่คุณมีสิทธินี้เป็น ATSP แต่สำหรับกระโดด treewidth ผมคิดว่าเป็นสิ่งที่ดีที่จะเห็นcs.bme.hu/~dmarx/papers/marx-warsaw-fpt2หรือถ้าคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับพวกเขาดีเกินไปดูอัลกอริทึม ทฤษฎีบทเมตา

— Saeed

คำตอบ:

สมมติว่าสตริงมีพหุนามยาวเป็นแล้วใช่มีอย่างน้อย $n$ การแก้ปัญหาเวลา เหตุผลก็คือการลดที่รู้จักกันดีจากปัญหา superstring ทั่วไปที่สั้นที่สุดถึง ATSP ที่มีน้ำหนักจำนวนเต็มขนาดพหุนามซึ่งคุณสามารถแก้ไขได้โดยการประมาณพหุนามหากคุณสามารถนับรอบมิลโตเนียนในการเขียนด้วยลายมือหลายทิศทาง ปัญหาหลังมี $2^{n-\Omega(\sqrt{n/\log n})}$ การแก้ปัญหาเวลา Björklund 2012 $2^{n-\Omega(\sqrt{n/\log n})}$

ลดลงจาก ATSP มีน้ำหนักสำหรับคู่ของจุดแต่ละเพื่อมิลวงจรนับไปดังต่อไปนี้: $w_{uv}$ $u,v$

สำหรับที่เป็นขอบเขตบนของจำนวนเงินทั้งหมดของน้ำหนักในกรณี ATSP การสร้างกราฟที่คุณแทนที่แต่ละน้ำหนักกับโค้งจากไปวี $r=1,2,\cdots,w_\mbox{sum}$ $w_\mbox{sum}$ $n$ $G_r$ $w_{uv}$ $r^{w_{uv}}$ $u$ $v$

โดยการแก้นับรอบมิลสำหรับแต่ละคุณสามารถสร้างผ่านการแก้ไขพหุนามพหุนามกับเท่ากับจำนวนของทัวร์ TSP ในรูปแบบของกราฟเดิมของน้ำหนักลิตรดังนั้นตำแหน่งที่เล็กที่สุดเช่นว่าเป็นที่ไม่ใช่ศูนย์แก้ปัญหา $G_r$ $\sum_{l=0}^{w_\mbox{sum}} a_lr^l$ $a_l$ $l$ $l$ $a_l$

— Andreas Björklund
แหล่งที่มา

ขอบคุณมาก! ฉันไม่ทราบว่าการเชื่อมต่อกับการนับรอบมิลโตเนียนนี้

— Alex Golovnev

@AlexGolovnev: แต่การลดลงนั้นมากหรือน้อยกว่าเช่นใน Kohn, Gottlieb, Kohn ทำให้คุณอ้างถึงคำตอบของคุณเองหรือ มันเป็นการฝังแบบง่าย ๆ ของการหาค่าบวกต่ำสุดของจำนวนเต็ม อย่างไรก็ตามขอขอบคุณที่ทำให้ฉันรู้ว่าเอกสารฉบับต่อไปของฉันควรระบุสิ่งนี้อย่างชัดเจน

— Andreas Björklund

ฉันได้ศึกษาปัญหาและพบผลลัพธ์บางอย่าง Shortest Common Superstring (SCS) สามารถแก้ไขได้ในเวลาด้วยพื้นที่พหุนามเท่านั้น ( Kohn, Gottlieb, Kohn ; Karp ; Bax, Franklin ) $2^n$

ค่าประมาณที่รู้จักกันดีที่สุดคือ (Paluch) $2\frac{11}{30}$

การประมาณการบีบอัดที่รู้จักกันดีที่สุดคือ (Paluch) $3\over4$

หาก SCS สามารถประมาณค่าได้โดยปัจจัยมากกว่าตัวอักษรไบนารีก็สามารถประมาณค่าได้โดยปัจจัยอยู่เหนือตัวอักษรใด ๆ ( Vassilevska-Williams ) $\alpha$ $\alpha$

SCS ไม่สามารถประมาณได้ด้วยอัตราส่วนที่ดีกว่าเว้นแต่ว่า P = NP ( Karpinski, Schmied ) $1.0029$

การบีบอัดสูงสุดไม่สามารถประมาณได้ด้วยอัตราส่วนที่ดีกว่ายกเว้น P = NP ( Karpinski, Schmied ) $1.0048$

ฉันจะขอบคุณสำหรับการเพิ่มเติมและข้อเสนอแนะใด ๆ

— อเล็กซ์ Golovnev
แหล่งที่มา

นี่เป็นปัญหา superstring สั้น: คุณจะได้รับสตริงบางตัวอักษรและคุณต้องการที่จะหาสตริงที่สั้นกว่าที่มีแต่ละเป็น subsequence ของตัวละครต่อเนื่องเช่นสตริงย่อย $n$ $s_1,\ldots, s_n$ $\Sigma$ $\Sigma$ $s_i$

เมื่อเราพูดถึงอัลกอริธึมที่แน่นอนสำหรับปัญหาการค้นหาความยาวของ superstring ที่สั้นที่สุดเทียบเท่ากับการค้นหาการบีบอัดสูงสุดซึ่งเป็นผลรวมของการซ้อนทับสตริงทั้งหมดที่อยู่ติดกันใน superstring สุดท้ายเช่น $L$ $C$ . $C=\sum_i |s_i|-L$

เท่าที่ฉันรู้อัลกอริทึมที่แน่นอนที่เร็วที่สุดสำหรับ superstring ที่สั้นที่สุดจะทำงานใน ( ) โดยที่คือจำนวนสตริง นี่เป็นอัลกอริทึมการเขียนโปรแกรมแบบไดนามิกที่เรียบง่ายคล้ายกับอัลกอริทึมการเขียนโปรแกรมแบบไดนามิกสำหรับเส้นทางที่ยาวที่สุด (และปัญหาอื่น ๆ ): $O^*$ $2^n$ $n$

For each subset of strings $S$ and string $v$ in $S$ we compute the maximum compression over all superstrings over $S$ where $v$ is the first string appearing in the superstring, storing this as C(( $v,S$ )). We do this by first processing all subsets with only one element, and then building up the C(( $v,S$ )) values for subsets $S$ on $k$ strings from those on $k-1$ strings. Specifically:

For each string $u$ we look at all subsets $S'$ on $k-1$ strings that don't include $u$ and set the value for ( $u,{u}\cup S'$ ) to the maximum over strings $v$ in $S'$ of the sum of the maximum overlap of $u$ with $v$ with C(( $v,S'$ )).

The final runtime is no more than O( $n^2 2^n + n^2 l$ ) where $l$ is the maximum string length.

There are better algorithms if you assume that $l$ is small, or the pairwise overlaps are small, the alphabet size is small etc, but I am not aware of any algorithm that's faster than $2^n$ .

— virgi
แหล่งที่มา

OP knows

O^{*} (2^{n})

$O^*(2^n)$ algorithm, he asked for faster solution.

— Saeed

as I said, I don't believe a faster solution is known.

— virgi

@virgi, thank you very much! Your algorithm is very nice. But I think inclusion-exclusion principle gives us even

O^{*} (2^{n})

$O^*(2^n)$ -algorithm with polynomial space for the Superstring problem. I'm really interesting in faster algorithms, may be with some constraints (small alphabet, short answer etc). Thank you very much!

— Alex Golovnev