มี CFG ขนาดพหุนามที่อธิบายภาษา จำกัด นี้หรือไม่?


9

มีการเรียงสับเปลี่ยน π1,π2 และขนาดพหุนาม (ใน |w|=n) ไวยากรณ์อิสระบริบทที่อธิบายภาษาที่ จำกัด {wπ1(w)π2(w)} มากกว่าตัวอักษร {0,1}?

ปรับปรุง: สำหรับหนึ่งการเปลี่ยนแปลง π มันเป็นไปได้. π เป็นการกลับรายการหรือการปรับเปลี่ยนเล็กน้อยของการกลับรายการ


5
ยังถามเกี่ยวกับ math.stackexchange สิ่งที่เขาหมายถึงคือ: มีลำดับของการเรียงสับเปลี่ยนπ1n,π2nSn ดังกล่าวว่าภาษา Ln={wπ1(w)π2(w):w{0,1}n}มี CFG ขนาดพหุนามหรือไม่?
Yuval Filmus


1
เรารู้หรือไม่ว่ามี CFG หรือไม่ L=nLn?
Kaveh

4
@Kaveh: คำตอบคือไม่สำหรับลำดับของ perms ใด ๆ หากภาษาของคุณL ไม่มีบริบทจากนั้นจะมีความยาวปั๊ม p. ใช้บทแทรกสำหรับ CFG กับสตริงใน L ที่เกี่ยวข้องw=0p1p. lemma ของการสูบสำหรับ CFG ยังให้เราบอกว่าถ้า OQ มีคำตอบที่เป็นบวก CFG สำหรับLn ต้องใช้อย่างน้อย Ω(n/logn) ตัวแปรเนื่องจากเราต้องการ 3n จะน้อยกว่าความยาวของปั๊มเพื่อให้ CFG ของเรา Ln ไม่ยอมรับสตริงที่มีความยาวใด ๆ >3n. ฉันยังไม่เห็นวิธีการใช้สิ่งนี้เพื่อตัดคำตอบในเชิงบวกต่อ OQ แต่อาจเป็นไปได้
Joshua Grochow

1
@Kaveh: (นอกจากนี้หากลำดับของ perms สามารถเลือกได้ตามอำเภอใจแล้วภาษาของคุณ Lไม่จำเป็นต้องคำนวณแม้แต่ ... OQ ดูเหมือนจะไม่สม่ำเสมอโดยเนื้อแท้)
Joshua Grochow

คำตอบ:


13

ชอมสกีฟอร์มปกติ

CFG อยู่ใน CNF (รูปแบบปกติ Chomsky) หากโปรดักชั่นเดียวเท่านั้นที่อยู่ในรูปแบบ Aa และ ABC; ไวยากรณ์สามารถนำไปยัง CNF ด้วยการระเบิดกำลังสองเท่านั้น

สำหรับไวยากรณ์ Gใน CNF เรามี Subword Lemma ที่ดี: ถ้าG สร้างคำ wจากนั้นสำหรับแต่ละ wมีคำย่อย x ของ w ความยาว /2|x|< ซึ่งถูกสร้างขึ้นโดยบางส่วนที่ไม่ใช่ขั้วของ G. การพิสูจน์: สืบทอดแผนผังต้นไม้ (ไบนารี) ลงไปที่ลูกซึ่งสร้างคำย่อยที่ยาวกว่าเสมอ หากคุณเริ่มด้วยคำย่อยที่มีขนาดอย่างน้อยคุณไม่สามารถลงไปด้านล่าง /2.

สารละลาย

เราสามารถสันนิษฐานได้ว่าเป็นไวยากรณ์ Ln (เช่นภาษาที่มีเฉพาะ π1,π2Sn) อยู่ใน Chomsky Normal Form ภาษาLn ประกอบด้วยคำว่า w(x)=xπ1(x)π2(x) เพื่อทุกสิ่ง x{0,1}n.

ใช้ Subword Lemma สำหรับแต่ละคน w(x) เราสามารถหาซับสตริงได้ s(x) ความยาว

n2|s(x)|<n
สร้างโดยสัญลักษณ์บางอย่าง A(x) และเกิดขึ้นที่ตำแหน่ง p(x).

สมมติว่า p(x)=p(y) และ A(x)=A(y). ตั้งแต่|s(x)|<nคำย่อย s(x) ไม่สามารถตัดกันทั้งสอง x ส่วนหนึ่งและ π2(x) เป็นส่วนหนึ่งของ w(x); เราสามารถสรุปได้ว่ามันแยกจากกันxส่วนหนึ่ง ดังนั้นw(x) เป็นของแบบฟอร์ม xαs(x)β. นี่ก็หมายความว่าA(x) สร้างหนึ่งสตริงคือ s(x). ดังนั้นs(x)=s(y).

ตอนนี้ s(y) ตัดกันเช่นกัน π1(y) หรือ π2(y) อย่างน้อย n/4 สถานที่และอย่างน้อยก็กำหนด n/4 บิตของ y. ดังนั้นอย่างมาก23n/4 เงื่อนไข y{0,1}n สามารถมี p(x)=p(y) และ A(x)=A(y). เนื่องจากมีมากที่สุด3n ความเป็นไปได้สำหรับ p(y)เราเข้าใจว่ามีอย่างน้อย

2n/43n
ไม่ใช่เทอร์มินัลต่าง ๆ ในไวยากรณ์

ความคิดเห็น: หลักฐานเดียวกันทำงานถ้า π1,π2S{0,1}nคือการเรียงสับเปลี่ยนโดยพลการในชุดของทั้งหมด nคำศัพท์ ป.ร. ให้ไว้n/4 บิตของ πi(y)มีอย่างแน่นอน 23n/4 preimages y.

ตัวอย่างเพิ่มเติม

การใช้วิธีการเดียวกันเราสามารถพิสูจน์ได้ว่าภาษาที่ตัวละครแต่ละตัวปรากฏขึ้นสองครั้งนั้นต้องการ CFG ขนาดเอ็กซ์โพเนนเชียลในขนาดของตัวอักษร เราสามารถแทนที่ "สองครั้ง" ด้วยชุดย่อยใด ๆ ของN นอกเหนือจากสี่เรื่องเล็กน้อย (ไม่สนใจ 0ทั้งที่ไม่มี N1 หรือทั้งหมด)

ฉันขอขอบคุณการอ้างอิงสำหรับวิธีการพิสูจน์นี้


2
Yuval คุณช่วยคัดลอกโซลูชันได้ที่นี่ด้วย
Kaveh

ขอบคุณ Yuval หากวิธีการของคุณถูกต้องและแปลกใหม่ฉันยินดีที่จะอ่านบทความตรวจสอบกรณีทั่วไปมากขึ้นด้วยผลบวกหรือเชิงลบใน polysize CFGs สำหรับภาษาที่ จำกัด หรือไม่มีที่สิ้นสุด
jerr18

3
มีนี้เขียนเป็น: cs.toronto.edu/~yuvalf/cfg.pdf
Yuval Filmus

ฉันคิดว่าโดยข้อยกเว้น N1คุณหมายถึง "การเกิดขึ้นของเครื่องอย่างน้อยหนึ่งครั้ง" นี่หมายความว่าคุณสามารถสร้างพีชคณิตทั้งหมดได้ด้วยการตัดกันΣ|Σ|?
jerr18

1
See related question cstheory.stackexchange.com/q/5014 where Yuval posted an answer with a published reference.
András Salamon
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.