ก่อนและหลังมีการตั้งค่าสำหรับไวยากรณ์ที่ไม่มีบริบทหรือไม่

14

ให้ $G$ เป็นไวยากรณ์ที่ไม่มีบริบท สตริงของอาคารและ nonterminals ของ $G$ บอกว่าจะเป็นรูปแบบ sententialของ $G$ ถ้าคุณสามารถรับมันได้โดยการใช้โปรดักชั่นของ $G$ ศูนย์ครั้งหรือมากกว่าที่จะเป็นสัญลักษณ์ของการเริ่มต้นของS $S$ ให้ $\operatorname{SF}(G)$ เป็นชุดของรูปแบบ sentential ของG $G$

ให้ $\alpha \in \operatorname{SF}(G)$ และปล่อยให้ $\beta$ เป็นย่อยของ $\alpha$ - เราเรียกส่วนของ )ตอนนี้ให้ $\beta$ $\operatorname{SF}(G)$

$\operatorname{Before}(\beta) = \{ \gamma \ |\ \exists \delta . \gamma \beta \delta \in \operatorname{SF}(G) \}$

และ

$\operatorname{After}(\beta) = \{ \delta \ |\ \exists \gamma . \gamma \beta \delta \in \operatorname{SF}(G) \}$ }

อยู่และภาษาบริบทฟรีหรือไม่ เกิดอะไรขึ้นถ้าไม่คลุมเครือ? หากไม่มีความกำกวมเป็นและสามารถอธิบายได้ด้วยภาษาที่ไม่มีบริบทที่ชัดเจนหรือไม่? $\operatorname{Before}(\beta)$ $\operatorname{After}(\beta)$ $G$ $G$ $\operatorname{Before}(\beta)$ $\operatorname{After}(\beta)$

นี่คือการติดตามคำถามก่อนหน้าของฉันหลังจากความพยายามก่อนหน้าเพื่อทำให้คำถามของฉันง่ายขึ้นในการตอบล้มเหลว คำตอบเชิงลบจะทำให้คำถามที่ครอบคลุมฉันกำลังทำงานอย่างหนักเพื่อตอบ

— อเล็กซ์สิบบริงค์
แหล่งที่มา

8

ให้เราได้รับความรู้สึกและก่อน พิจารณาต้นไม้ที่มาซึ่งมี ; "บรรจุ" ที่นี่หมายความว่าคุณสามารถตัดทรีย่อยเพื่อให้เป็นคำย่อยของหน้าต้นไม้ จากนั้นชุดก่อน (หลัง) คือส่วนที่มีศักยภาพทั้งหมดของส่วนต้นไม้ที่เหลือ (ขวา) ของ : $\operatorname{Before}(\beta)$ $\operatorname{After}(\beta)$ $\beta$ $\beta$ $\beta$

ต้นไม้ที่มีก่อนและหลังชุด
^{[ แหล่งที่มา ]}

ดังนั้นเราต้องสร้างหลักไวยากรณ์สำหรับส่วนที่มีการเรียงในแนวนอน (แนวตั้ง) ของต้นไม้ ดูเหมือนง่ายพอที่เรามีไวยากรณ์สำหรับต้นไม้ทั้งหมดแล้ว เราก็ต้องให้แน่ใจว่าทุกรูปแบบ sentential เป็นคำ (เปลี่ยนตัวอักษร) กรองออกไปผู้ที่ไม่ได้มี (นั่นคือสถานที่ให้บริการปกติเช่นได้รับการแก้ไข) และตัดออกไปทุกอย่างหลังจาก (ก่อน) รวมทั้งβการตัดนี้ควรจะเป็นไปได้ $\beta$ $\beta$ $\beta$ $\beta$

ตอนนี้เพื่อพิสูจน์อย่างเป็นทางการ เราจะแปลงไวยากรณ์ตามที่อธิบายไว้และใช้คุณสมบัติการปิดของเพื่อทำการกรองและตัดเช่นเราดำเนินการพิสูจน์ที่ไม่สร้างสรรค์ $\mathrm{CFL}$

ให้ไวยากรณ์ที่ไม่มีบริบท มันง่ายที่จะเห็นว่าไม่มีบริบท สร้างเช่นนี้: $G = (N, T, \delta, S)$ $\operatorname{SF}(G)$ $G'=(N',T',\delta',N_S)$

$N' = \{N_A \mid A \in N\}$
$T' = N \cup T$
$\delta' = \{\alpha(A) \to \alpha(\beta)\mid A\to\beta \in \delta \} \cup \{N_A \to A \mid A\in N\}$

ด้วยสำหรับทุกและสำหรับทั้งหมด เป็นที่ชัดเจนว่า ; ดังนั้นการปิดคำนำหน้าที่เกี่ยวข้องและการปิดท้ายนั้นไม่มีบริบทเช่นกัน context $\alpha(t)=t$ $t \in T$ $\alpha(A)=N_A$ $a\in N$ $\mathcal{L}(G')=\operatorname{SF}(G)$ $\operatorname{Pref}(\operatorname{SF}(G))$ $\operatorname{Suff}(\operatorname{SF}(G))$

ตอนนี้สำหรับการใด ๆมีและภาษาปกติ เนื่องจากถูกปิดภายใต้จุดตัดและความฉลาดทางซ้าย / ขวาด้วยภาษาปกติเราได้รับ $\beta \in (N\cup T)^*$ $\mathcal{L}(\beta(N\cup T)^*)$ $\mathcal{L}((N\cup T)^*\beta)$ $\mathrm{CFL}$

$\qquad \displaystyle \operatorname{Before}(\beta) = (\operatorname{Pref}(\operatorname{SF}(G))\ \cap\ \mathcal{L}((N\cup T)^*\beta))\,/\,\beta \in \mathrm{CFL}$

และ

L $\qquad \displaystyle \operatorname{After}(\beta) = (\operatorname{Suff}(\operatorname{SF}(G))\ \cap\ \mathcal{L}(\beta(N\cup T)^*))\,\backslash\, \beta \in \mathrm{CFL}$

¹ ถูกปิดภายใต้ความฉลาดทางขวา (และซ้าย) ; และคล้ายกันสำหรับคำนำหน้า Yield ปิดท้าย $\mathrm{CFL}$ $\operatorname{Pref}(L) = L / \Sigma^*$ $\operatorname{Suff}$

— กราฟิลส์
แหล่งที่มา

ฉันเริ่มเขียนคำตอบแล้วรู้ว่าหลักฐานของฉันเหมือนกับของคุณ ฉันได้ใส่มันด้วยวิธีนี้ (บีบอัดเพื่อให้พอดีกับที่นี่): รูปแบบไวยากรณ์

โดยการเพิ่มขั้วใหม่(ก metavariable) สำหรับแต่ละไม่ใช่ขั้วและผลิต

รูปแบบประโยค

นั้นเป็นคำที่รู้จักโดย

ซึ่งประกอบด้วย metavariables นี่คือจุดตัดของ CFG ที่มีภาษาปกติและเป็นปกติ ชุดคำนำหน้าของ CFG คือ CFG (รับ PDA และทำให้ทุกสถานะเป็นขั้นสุดท้าย)

G^{'}

$G'$

\hat{A}

$\hat A$

A

$A$

A \to \hat{A}

$A\to\hat A$

G

$G$

G

$G$

เป็นอีกครั้ง CFG

B e f o r e (γ) = {γ ∣ γ β \in L (P r e f i x (\hat{G}))}

$\mathrm{Before}(\gamma) = \{\gamma \mid \gamma\beta\in L(\mathrm{Prefix}(\hat G))\}$

— Gilles 'หยุดความชั่วร้าย'

1

@Gilles ความคิดเห็นสามข้อเกี่ยวกับเรื่องนี้: 1) รูปแบบประโยคปกติ (อย่างถูกต้อง) มีภาษา 2) "ทำให้ทุกรัฐเป็นที่สิ้นสุด" - ไม่สามารถใช้งานได้; คุณจะยอมรับคำนำหน้าของคำที่ไม่ใช่คำด้วย 3) ขั้นตอนสุดท้ายของการ "ตัด" คำต่อท้ายดูเหมือนว่าจะยุ่งยากมาก : / คุณมีหลักฐานที่เข้มงวด แต่กะทัดรัดกว่าของฉันหรือไม่?

— Raphael

G

$G$

b

$b$

b

$b$

9

$\mbox{Before}(\beta)$ $\mbox{After}(\beta)$ $L$ คือ CF ดังนั้น:

$\mbox{Before}(L,\beta) = \{ \gamma \ |\ \exists \delta . \gamma \beta \delta \in L \}$

and

$\mbox{After}(L,\beta) = \{ \gamma \ |\ \exists \delta . \delta \beta \gamma \in L \}$

are CF.

Proof? For $\mbox{Before}(L,\beta)$ construct a non-deterministic finite-state transducer $T_{\beta}$ that scans a string, outputting every input symbol it sees and simultaneously searches non-deterministically for $\beta$ . Whenever $T_{\beta}$ sees the first symbol of $\beta$ it forks non-deterministically and ceases outputting symbols until either it finishes seeing $\beta$ or it sees sees a symbol that deviates from $\beta$ , stopping in either case. If $T_{\beta}$ sees $\beta$ in full, it accepts upon stopping, which is the only way it accepts. If it sees a deviation from $\beta$ , it rejects.

The lemma can be jiggered to handle cases where $\beta$ could overlap with itself (like $abab$ -- keep looking for $\beta$ even while in the midst of scanning for a prior $\beta$ ) or appears multiple times (actually, the original non-determinisic forking already handles that).

It's fairly clear that $T_\beta(L) = \mbox{Before}(L,\beta)$ , and since the CFLs are closed under finite-state transduction, $\mbox{Before}(L,\beta)$ is therefore CF.

A similar argument goes for $\mbox{After}(L,\beta)$ , or it could be done with string reversals from $\mbox{Before}(L,\beta)$ , CFLs also being closed under reversal:

$\mbox{After}(L,\beta) = \mbox{rev}(\mbox{Before}(\mbox{rev}(L),\mbox{rev}(\beta)))$

Actually, now that I see the reversal argument, it would be even easier to start with $\mbox{After}(L,\beta)$ , since the transducer for that is simpler to describe and verify -- it outputs the empty string while looking for a $\beta$ . When it finds $\beta$ it forks non-deterministically, one fork continuing to look for further copies of $\beta$ , the other fork copying all subsequent characters verbatim from input to output, accepting all the while.

What remains is to make this work for sentential forms as well as CFLs. But that is pretty straightforward, since the language of sentential forms of a CFG is itself a CFL. You can show that by replacing every non-terminal $X$ throughout $G$ by say $X^\prime$ , declaring $X$ to be a terminal, and adding all productions $X^\prime \rightarrow X$ to the grammar.

I'll have to think about your question on unambiguity.

— David Lewis
แหล่งที่มา