ชั้นเรียนภาษาพิเศษ: ภาษา "วงกลม" มันเป็นที่รู้จักกัน?


20

กำหนดคลาสของภาษา "แบบวงกลม" ต่อไปนี้บนซิกม่าตัวอักษรที่ จำกัด จริงๆแล้วชื่อมีอยู่แล้วเพื่อแสดงถึงสิ่งที่แตกต่างที่ดูเหมือนว่าใช้ในด้านการคำนวณดีเอ็นเอ AFAICT นั่นเป็นคลาสภาษาอื่น

ภาษา L นั้น IFF วงกลมสำหรับทุกคำWwในΣ *Σเรามี:

Wwเป็น L และถ้าหากสำหรับทุกจำนวนเต็ม k > 0k>0 , W kwkเป็นลิตร

ภาษานี้เป็นที่รู้จักกันในระดับ? ฉันสนใจภาษาวงกลมซึ่งปกติและโดยเฉพาะอย่างยิ่งใน:

  • ชื่อสำหรับพวกเขาหากพวกเขาเป็นที่รู้จักกันแล้ว

  • decidability ของปัญหาให้อัตโนมัติ (โดยเฉพาะอย่างยิ่ง: DFA) ไม่ว่าจะเป็นภาษาที่ยอมรับได้ปฏิบัติตามคำนิยามข้างต้น


1
นี่เป็นคำถามที่น่าสนใจมาก คำถามที่เกี่ยวข้องสองข้อ: 1) หากเรามีภาษาปกติ L และ DFA ที่เกี่ยวข้องเราสามารถทำให้เป็นวงกลมได้หรือไม่? 2) ในภาษาใด ๆ L มันเป็นกรณีที่ circ (L) เป็นปกติหรือมีคุณสมบัติที่ดีบางอย่าง?
Suresh Venkat

ป.ล. อาจเห็นได้ชัด แต่ทำไมคุณคิดว่าภาษาแบบวงกลมเป็นคลาสย่อยของภาษาปกติ
Suresh Venkat

3
@Suresh ฉันคิดว่าเขากำหนดภาษาที่จะเป็นวงกลมถ้ามันเป็น) ปกติ; ข) การตอบสนองที่พักปิดW L , n N : W nW L ,nN:wn L
Peter Taylor

Crosspost ในมิสซูรี่
Hsien-Chih Chang 張顯之

1
อาจจะขอบคุณไม่ควรโพสต์ แต่นี่เป็นคำถามแรกของฉันและฉันชื่นชมคุณภาพของความคิดเห็นคำตอบและการสนทนามากมาย ขอบคุณ
vincenzoml

คำตอบ:


19

ในส่วนแรกเราจะแสดงอัลกอริธึมชี้แจงสำหรับการตัดสินใจแบบวงกลม ในส่วนที่สองเราแสดงให้เห็นว่านี่เป็นปัญหาที่เกิดจาก coNP-hard ในส่วนที่สามเราแสดงให้เห็นว่าทุกภาษาวงกลมเป็นสหภาพของภาษาของรูปแบบr + (ที่นี่rอาจเป็น regexp ที่ว่างเปล่า); สหภาพไม่จำเป็นต้องแยกจากกัน ในส่วนที่สี่เราแสดงภาษาวงกลมซึ่งไม่สามารถเขียนเป็นผลรวมr + ir+Rr+ผมฉัน

แก้ไข: รวมการแก้ไขบางอย่างตามความเห็นของ Mark โดยเฉพาะอย่างยิ่งการกล่าวอ้างก่อนหน้านี้ของฉันว่าการแก้ไขแบบวงกลมคือ coNP-complete หรือ NP-hard ได้รับการแก้ไข

แก้ไข: แก้ไขรูปแบบปกติจากΣ R * ฉันจะΣ R +ฉัน จัดแสดงภาษา "ไม่ชัดเจนโดยเนื้อแท้"ΣrผมΣr+ผม


ต่อความคิดเห็นของ Peter Taylor ต่อไปนี้เป็นวิธีการตัดสินใจ (ไร้ประสิทธิภาพอย่างยิ่ง) ว่าภาษาใดบ้าง สร้าง DFA ใหม่ที่รัฐเป็นn- tuples ของรัฐเก่า DFA ใหม่นี้ใช้งานNสำเนาของ DFA เก่าแบบขนานnn

หากภาษาไม่ได้เป็นวงกลมแล้วมีคำWเช่นว่าถ้าเราทำงานมันผ่าน DFA ซ้ำ ๆ เริ่มต้นด้วยสถานะเริ่มต้นที่0แล้วเราได้รับรัฐs 1 , ... , s nดังกล่าวว่าs 1จะรับ แต่อย่างหนึ่ง ของคนอื่น ๆ ไม่ได้รับการยอมรับ (ถ้าทั้งหมดของพวกเขาได้รับการยอมรับแล้วจากนั้นลำดับs 0 , ... , s nวงจรต้องเพื่อให้W *อยู่เสมอในภาษา) กล่าวอีกนัยหนึ่งเรามีเส้นทางจากs 0 , ,Ws0s1, , sns1s0, , snW* * * * s n- 1ถึง s 1 ,, s nเมื่อ s 1ยอมรับ แต่คนอื่นไม่ยอมรับ ในทางกลับกันถ้าภาษานั้นเป็นวงกลมแล้วนั่นจะไม่เกิดขึ้นs0, , sn - 1s1, , sns1

ดังนั้นเราจึงลดปัญหาดังกล่าวเป็นการทดสอบการเข้าถึงโดยตรงแบบง่าย ๆ (แค่ตรวจสอบ " n " tuples ที่เป็นไปได้ทั้งหมด)n


ปัญหาของการเวียนคือ coNP-hard สมมติว่าเรากำลังได้รับเช่น 3SAT กับnตัวแปรxและเมตรข้อC 1 , ... , Cเมตร เราสามารถสันนิษฐานได้ว่าn = m (เพิ่มตัวแปรดัมมี่) และnนั้นเป็นไพร์ม (มิฉะนั้นจะหาไพร์มระหว่างnและ2 nnx⃗ ม.1, , Cม.n = mnn2 nโดยใช้การทดสอบแบบดั้งเดิมของ AKS และเพิ่มตัวแปรและประโยคจำลอง)

พิจารณาภาษาต่อไปนี้: "อินพุตไม่ได้อยู่ในรูปแบบx 1x nโดยที่x iเป็นการมอบหมายที่น่าพอใจสำหรับC i " มันง่ายที่จะสร้างO ( n 2 ) DFA สำหรับภาษานี้ หากภาษาไม่ได้เป็นวงกลมแล้วมีคำWในภาษาที่อำนาจของซึ่งบางคนไม่ได้อยู่ในภาษา ตั้งแต่คำพูดเพียงไม่ได้อยู่ในภาษาที่มีความยาวn 2 , Wจะต้องมีความยาว1หรือnx⃗ 1x⃗ nx⃗ ผมผมO(n2)wn2w1n nถ้ามันมีความยาว1พิจารณา w nแทน (ยังอยู่ในภาษา) เพื่อให้ wอยู่ในภาษาและ w nไม่ได้อยู่ในภาษา ความจริงที่ว่า w nไม่ได้อยู่ในภาษาหมายความว่า wคือการมอบหมายที่น่าพอใจ1wnwwnwnw

ในทางกลับกันการมอบหมายที่น่าพอใจใด ๆ แปลเป็นคำที่พิสูจน์ความไม่เป็นวงกลมของภาษา: การมอบหมายที่น่าพอใจwเป็นของภาษา แต่w nไม่ได้ ดังนั้นภาษาจึงเป็นแบบวงกลมถ้าอินสแตนซ์ 3SAT ไม่น่าพอใจwwn


ในส่วนนี้เราจะหารือเกี่ยวกับรูปแบบปกติสำหรับภาษาวงกลม พิจารณา DFA บางอย่างสำหรับภาษาวงกลมL ลำดับC = C 0 , เป็นจริงถ้าC 0 = s (สถานะเริ่มต้น) รัฐอื่น ๆ ทั้งหมดกำลังยอมรับและC i = C jหมายถึงC i + 1 = CLC=C0,C0=sCi=Cj j + 1Ci+1=Cj+1 1ดังนั้นลำดับที่แท้จริงทุกครั้งจะเป็นระยะและในที่สุดก็มีเพียงลำดับที่แท้จริงจำนวนมากเท่านั้น (เนื่องจาก DFA นั้นมีหลายรัฐที่มีขอบเขต)

เราบอกว่าเป็นคำที่จะทำงานตามCCถ้าคำเตะ DFA จากรัฐฉันไปยังรัฐฉัน+ 1สำหรับทุกฉัน ชุดของคำดังกล่าวทั้งหมดE ( C )เป็นปกติ (อาร์กิวเมนต์คล้ายกับส่วนแรกของคำตอบนี้) โปรดทราบว่าE ( C )เป็นส่วนหนึ่งของLcici+1iE(C)E(C)L

ได้รับจริงลำดับCกำหนดC kจะเป็นลำดับC k ( T ) = C ( k T ) ลำดับC kก็เป็นจริงเช่นกัน เนื่องจากมีเพียงขอบเขตหลายลำดับที่แตกต่างกันC kภาษาD ( C )ซึ่งเป็นสหภาพของทั้งหมดE (CCkCk(t)=C(kt)CkCkD(C) C k )ยังเป็นปกติE(Ck)

เราอ้างว่าD ( C )มีคุณสมบัติที่ว่าถ้าx , y ที่D ( C )แล้วx Y D ( C ) อันที่จริงสมมติว่าx C kและY Cลิตร จากนั้นx Y C k + L ดังนั้นD ( C ) = D ( C ) +สามารถเขียนในรูปแบบrD(C)x,yD(C)xyD(C)xCkyClxyCk+lD(C)=D(C)+ +r+สำหรับการแสดงออกปกติบางอย่างrr R

ทุกคำที่Wในสอดคล้องกับภาษาที่บางลำดับที่แท้จริงCคือมีอยู่ลำดับที่แท้จริงCที่Wพฤติกรรมตาม ดังนั้นLเป็นสหภาพของD ( C )มากกว่าทุกจริงลำดับC ดังนั้นทุกภาษาวงกลมมีตัวแทนของรูปแบบΣ R +ฉัน ในทางกลับกันทุกภาษาดังกล่าวเป็นวงกลม (เล็กน้อย)wCCwLD(C)Cr+i


พิจารณาภาษาวงกลมLของคำทั่ว, Bที่มีทั้งจำนวนหรือแม้กระทั่ง's หรือเลขคู่ของ ' s (หรือทั้งสอง) เราแสดงให้เห็นว่ามันไม่สามารถเขียนเป็นผลรวมdis r + i ; โดย "disjoint" เราหมายถึงr + ir + j = La,babr+ir+ir+j=

ให้N ฉันเป็นขนาดของ DFA บางค่าสำหรับr + iและN > max N iเป็นจำนวนเต็มคี่ พิจารณาx = a N b N ! . ตั้งแต่x L , x R + ผมบางผม โดยแทรกสูบน้ำที่เราสามารถปั๊มคำนำหน้าของxความยาวที่มากที่สุดN ดังนั้นr + i จึงสร้างz = a N !Nir+iN>maxNix=aNbN!xLxr+iixNr+i b N !z=aN!bN!. ในทำนองเดียวกันy = a N ! Nถูกสร้างขึ้นโดยบางR + Jซึ่งยังสร้างZ โปรดทราบว่าฉันเจตั้งแต่x Y L ดังนั้นการเป็นตัวแทนจึงไม่สามารถแยกออกจากกันได้y=aN!bNr+jzijxyL


ดูเหมือนจะมีข้อผิดพลาดจำนวนมากที่นี่ คุณกำลังลดจาก UNSAT ไม่ใช่ SAT ดังนั้นคุณจึงแสดงว่าเป็น coNP-hard เวลาพหุนามของคุณเป็นอย่างไรในการเป็นสมาชิก
Mark Reitblatt

"Since the only words not in the language have length n2n2" Shouldn't that be nmnm?
Mark Reitblatt

I don't think it's "trivially in coNP". At least, it's not trivially obvious to me. The "obvious" certificate would be a string ll in the language, and a power kk such that lklk isn't in the language. But it's not immediately obvious to me why such a word must be polynomially-sized. Maybe it's by a simple fact of automata theory that I'm overlooking.
Mark Reitblatt

An even more serious apparent flaw is that you jump from each clause being satisfiable individually to the whole formula being satisfiable. Unless I am misreading, of course.
Mark Reitblatt

ฉันยอมรับว่ามันไม่ชัดเจนว่าเวียนอยู่ใน coNP ในทางกลับกันฉันไม่เห็นปัญหาในการโต้แย้งที่เหลือ (ตอนนี้ฉันใส่n = m ) แล้ว หากแต่ละส่วนย่อยได้รับความพึงพอใจจากการมอบหมายเดียวกันอินสแตนซ์ 3SAT ก็จะได้รับความพึงพอใจจากการมอบหมายนี้ n=m
Yuval Filmus

17

นี่คือเอกสารบางส่วนที่พูดถึงภาษาเหล่านี้:

Thierry Cachat พลังของภาษาหนึ่งตัวอักษร DLT 2001, Springer LNCS # 2295 (2002), 145-154

S. Hovath, P. Leupold และ G. Lischke, รากและพลังของภาษาปกติ DLT 2002, Springer LNCS # 2450 (2003), 220-230

H. Bordihn, บริบท - freeness ของพลังของภาษาปลอดบริบทไม่สามารถตัดสินใจได้, TCS 314 (2004), 445-449


6

@Dave Clarke, L = a*|b* would be circular, but L* would be (a|b)*.

In terms of decidability, a language LL is circular if there is an LL such that LL is the closure under + of LL or if it is a finite union of circular languages.

(I'm dying to redefine "circular" replacing your >> with . It simplifies things a lot. We can then characterise the circular languages as those for which there exists a NDFA whose starting state has only epsilon-transitions to accepting states and has an epsilon-transition to each accepting state).


You are right. I've removed my incorrect post.
Dave Clarke

Regarding adaption with : I am thinking that a minimal DFA should always have exactly one accepting state, namely the start state. Maybe more accepting states can happen, but then they need an εε-transition to the start state.
Raphael

1
@Raphael, consider again L = a*|b*. A DFA whose start state is the only accepting state and which accepts a and b must accept (a|b)*.
Peter Taylor

On the question of decidability, again: suppose you have a DFA with nn states of which nana are accepting. Suppose it accepts a word ww, and also accepts w2w2, w3w3, ..., wna+1wna+1. Then it accepts wxwx for x>0x>0. (Proof is a straightforward application of the pigeonhole principle). If it's possible to show that the minimal (minimising |w||w|) counterexample (ww, xx) to the circularity of the language accepted by the DFA has length bounded by a function of nn then brute force testing is possible. I suspect that |w|<=n+1|w|<=n+1, but I haven't proved it.
Peter Taylor

To follow up on @Raphael's idea above. The idea of start state = only accept state is wrong for this problem, but it does capture some interesting property. When M is a minDFA, the start state is the only accept state if and only if L(M) is the Kleene star of a prefix-free language. This is one of my favorite DFA trivia tidbits and thus I am quick to share it! ;)
mikero

5

Edit: A complete (simplified) PSPACE-completeness proof appears below.

Two updates. First, the normal form described in my other answer appears already in a paper by Calbrix and Nivat titled Prefix and period languages of rational ωω-langauges, unfortunately not available online.

Second, deciding whether a language is circular given its DFA is PSPACE-complete.

Circularity in PSPACE. Since NPSPACE=PSPACE by Savitch's theorem, it is enough to give an NPSPACE algorithm for non-circularity. Let A=(Q,Σ,δ,q0,F)A=(Q,Σ,δ,q0,F) be a DFA with |Q|=n|Q|=n states. The fact that the syntactic monoid of L(A)L(A) has size at most nnnn implies that if L(A)L(A) is not circular then there is a word ww of length at most nnnn such that wL(A)wL(A) but wkL(A)wkL(A) for some knkn. The algorithm guesses ww and computes δw(q)=δ(q,w)δw(q)=δ(q,w) for all qQqQ, using O(nlogn)O(nlogn) space (used to count up to nnnn). It then verifies that δw(q0)Fδw(q0)F but δ(k)wFδ(k)wF for some knkn.

Circularity is PSPACE-hard. Kozen showed in his classic 1977 paper Lower bounds for natural proof systems that it is PSPACE-hard to decide, given a list of DFAs, whether the intersection of the languages accepted by them is empty. We reduce this problem to circularity. Given binary DFAs A1,,AnA1,,An, we find a prime p[n,2n]p[n,2n] and construct a ternary DFA AA accepting the language L(A)=¯{2w12w22wp:wiL(A1+(imodn))}.

L(A)={2w12w22wp:wiL(A1+(imodn))}¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯.
(With some more effort, we can make AA binary as well.) It is not difficult to see (using the fact that pp is prime) that L(A)L(A) is circular if and only if the intersection L(A1)L(An)L(A1)L(An) is empty.

0

Every sLsL of length p>0p>0 can be written as xyizxyiz where x=z=ϵx=z=ϵ , y=wϵy=wϵ . It's obvious that |xy|p|xy|p and |y|=|w|>0|y|=|w|>0. It follows that the language is regular for non-empty inputs, by the pumping lemma.

For w=ϵw=ϵ , the definition holds, since a NDFA that accepts the empty string will also accept any number of empty strings.

The union of the above languages is the language L and since regular languages are closed under union, it follows that every circular language is regular.

By Rice's theorem, CIRCULARITY/TMCIRCULARITY/TM is undecidable. The proof is similar to regularity.


1
The pumping lemma is a necessary, but not sufficient, condition for regularity. In particular, there are nonregular languages satisfying the pumping condition. Also, Rice's theorem would say that {M|L(M) is circular} is undecidable. This does not mean that {D|L(D) is circular} is undecidable (where D is a DFA, M a TM)! For instance, emptiness testing for DFAs is decidable, while emptiness testing for TMs is not.
alpoge

1
Here's a non-computable circular language. Let D={0x1:xR}, where R is some non-computable language (e.g. codes of halting TMs). Then D is circular but clearly non-computable (an oracle for D can be used to decide R).
Yuval Filmus

2
@Peter, have you read this answer? It was trying to prove that any circular language (without the condition of regularity) is regular.
Yuval Filmus

1
@Yuval, my mistake. @chazisop, the pumping lemma is useful for proving non-regularity of languages, but not regularity. (Besides, the assertion of your first sentence reduces to "Every sL of length p>0 can be written as yi where yϵ", which is clearly false).
Peter Taylor

1
Yes, I use CIRCULARITY/TM to refer to this. CIRCULARITY/DFA is probably decidable.
chazisop
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.