คำถามติดแท็ก regular-expressions

คำถามเกี่ยวกับทฤษฎีนิพจน์ทั่วไปทั้งในแง่ของนิยามดั้งเดิมของคลีนและนิพจน์ทั่วไปของ POSIX

4
การค้นหานิพจน์ปกติขั้นต่ำเป็นปัญหาที่ทำให้สมบูรณ์หรือไม่
ฉันกำลังคิดถึงปัญหาต่อไปนี้: ฉันต้องการค้นหานิพจน์ทั่วไปที่ตรงกับชุดสตริงเฉพาะ (เช่นที่อยู่อีเมลที่ถูกต้อง) และไม่ตรงกับที่อื่น (ที่อยู่อีเมลไม่ถูกต้อง) สมมติว่าโดยการแสดงออกปกติเราหมายถึงเครื่องสถานะ จำกัด ที่กำหนดไว้อย่างดีบางอย่างฉันไม่คุ้นเคยกับคำศัพท์ที่แน่นอน แต่เราเห็นด้วยกับบางคลาสของนิพจน์ที่ได้รับอนุญาต แทนที่จะสร้างนิพจน์ด้วยตนเองฉันต้องการตั้งค่าบวกและชุดตัวอย่างเชิงลบ จากนั้นควรมีนิพจน์ที่ตรงกับตัว + ปฏิเสธสิ่งที่อยู่ในนั้นและมีความหมายน้อยที่สุด (จำนวนสถานะในออโตมาตะ) คำถามของฉันคือ: ได้รับการพิจารณาปัญหานี้แล้วจะกำหนดได้อย่างเป็นรูปธรรมมากขึ้นและสามารถแก้ไขได้อย่างมีประสิทธิภาพได้อย่างไร เราสามารถแก้มันในเวลาพหุนามได้หรือไม่? มันเป็น NP ที่สมบูรณ์เราสามารถประมาณมันได้ไหม? สำหรับคลาสของนิพจน์ใดที่ใช้งานได้ ฉันขอขอบคุณตัวชี้ไปที่ตำราบทความหรือสิ่งที่กล่าวถึงหัวข้อนี้ สิ่งนี้เกี่ยวข้องกับความซับซ้อนของ Kolmogorov หรือไม่? สิ่งนี้เกี่ยวข้องกับการเรียนรู้หรือไม่? หากการแสดงออกปกติสอดคล้องกับตัวอย่างของฉันเราสามารถพูดบางสิ่งเกี่ยวกับอำนาจการวางนัยทั่วไปของมันในตัวอย่างที่มองไม่เห็นได้หรือไม่ เกณฑ์ใดสำหรับการย่อเล็กสุดจะเหมาะสมกว่าสำหรับเรื่องนี้? อันไหนจะมีประสิทธิภาพมากกว่ากัน? สิ่งนี้มีการเชื่อมต่อกับการเรียนรู้ของเครื่องหรือไม่? ตัวชี้ใด ๆ จะเป็นประโยชน์ ... ขออภัยสำหรับคำถามที่ยุ่ง ๆ ชี้ให้ฉันไปในทิศทางที่ถูกต้องเพื่อหาสิ่งนี้ ขอบคุณมาก!

6
การแสดงออกปกติไม่ได้
ถามคนที่มีพื้นฐานด้านวิทยาศาสตร์คอมพิวเตอร์ว่านิพจน์ปกติคืออะไรและคำตอบน่าจะเกินกว่าข้อ จำกัด ของการเข้าถึงออโตเมติก จำกัด ของรัฐ ตัวอย่างเช่น“ นิพจน์ทั่วไป” /^1?$|^(11+?)\1+$/ ที่สร้างขึ้นโดยบุคลิกภาพ Perl ตั้งข้อสังเกตAbigail (และเป็นส่วนหนึ่งของชุดทดสอบของ Perlตั้งแต่ปี 2002) อธิบายเครื่องที่ยอมรับตัวเลขเอกเพียงคอมโพสิต แต่การออกกำลังกาย 4.5 (ข)ในรุ่นที่สามของปีเตอร์ลินซ์ของแนะนำอย่างเป็นทางการภาษาและออโตมีการใช้ผู้อ่านแทรกสูบน้ำที่จะพิสูจน์ว่า L={an:n is not a prime number}L={an:n is not a prime number}\mathcal{L} = \left\{ a^n : n\ \mathrm{is\ not\ a\ prime\ number} \right\} ไม่ใช่ภาษาปกติ ในบริบทที่ความแตกต่างสำคัญเราควรเรียกการแสดงออกที่ทรงพลังกว่านี้อย่างเคร่งครัดว่าอย่างไร

4
มีเครื่อง "เล็ก" ที่สามารถจับคู่นิพจน์ปกติได้อย่างมีประสิทธิภาพหรือไม่
เป็นที่ทราบกันดีว่านิพจน์ทั่วไปสามารถรับรู้ได้โดย nondterministic finite automaton ที่มีขนาดตามสัดส่วนกับ expression ปกติหรือโดย FA ที่กำหนดขึ้นซึ่งอาจมีขนาดใหญ่ขึ้นแทน นอกจากนี้เมื่อพิจารณาจากสตริงและนิพจน์ทั่วไปr NFA สามารถทดสอบการเป็นสมาชิกในสัดส่วนเวลากับ| s | ⋅ | r | และ DFA สามารถทดสอบการเป็นสมาชิกในเวลาตามสัดส่วนกับ| s |sssRrr| s | ⋅ | r ||s|⋅|r||s| \cdot |r|| s ||s||s|. การชะลอตัวของ NFA เกิดขึ้นจากความจริงที่ว่าเราจำเป็นต้องติดตามชุดของสภาวะที่เป็นไปได้ที่หุ่นยนต์สามารถอยู่ได้ NFA เป็นไปได้ไหมที่จะมีประสิทธิภาพ (กล่าวคือในเวลาดีกว่าและพื้นที่ที่ดีกว่าO ( 2 | r | ) ) รู้จักการแสดงออกปกติถ้าเราอนุญาตให้ใช้เครื่องจักรที่ทรงพลังกว่าออโต จำกัด (ตัวอย่างเช่นมีความชัดเจนในการรับรู้ภาษาปกติด้วยการกดลงอัตโนมัติหรือเครื่องตอบโต้หรือไม่)O ( …

3
อัลกอริธึมที่รู้จักที่จะเปลี่ยนจาก DFA ไปเป็นนิพจน์ทั่วไป
ฉันสงสัยว่ามี '`ดีกว่า' '(ฉันจะอธิบายในแง่ใด) อัลกอริทึมที่จะเริ่มต้นจาก DFAและสร้างการแสดงออกปกติที่มากกว่าหนึ่งในหนังสือโดย Hopcroft และ Ullman (1979) ในการมีชุดที่ใช้แทนชุดของสตริงที่ใช้เอฟเอจากรัฐเพื่อโดยไม่ต้องผ่านรัฐใด ๆ เลขสูงกว่าkการก่อสร้างนี้ถึงแม้จะถูกต้องและมีประโยชน์มาก แต่ก็ค่อนข้างเป็นเรื่องเทคนิค r L ( A ) = L ( r ) R k i j q i q j kAA\mathcal{A}RRrL () = L ( r )L(A)=L(r)L(\mathcal{A})=L(r)RkฉันเจRijkR_{ij}^kQผมQผมq_iQJQJq_jkkk ฉันกำลังเขียนเอกสารเกี่ยวกับทฤษฎีออลพีชคณิตเกี่ยวกับพีชคณิตและฉันไม่ต้องการเบี่ยงเบนความสนใจผู้ชมของฉันด้วยรายละเอียดทางเทคนิคมากเกินไป (อย่างน้อยก็ไม่ใช่รายละเอียดที่ไม่เกี่ยวข้องกับผลลัพธ์ที่ฉันต้องการแสดง) แต่ฉันต้องการรวม หลักฐานการเทียบเท่าระหว่าง DFA และนิพจน์ทั่วไปเพื่อความสมบูรณ์ สำหรับบันทึกฉันใช้ Glushkov ออโตมาตะจากนิพจน์ทั่วไปไปยัง DFA ดูเหมือนง่ายกว่า -transitions …

1
ทำไมภาษาปกติจึงเรียกว่า“ ปกติ”
ทำไมภาษาปกติ (และจากนิพจน์ทั่วไปนั้น) เรียกว่า "ปกติ" มีความสม่ำเสมอมากในภาษาอื่น ๆ ที่ไม่มีบริบท ฉันคิดว่าในตอนแรกคำคุณศัพท์ "ปกติ" ถูกนำมาใช้เพื่อแยกความแตกต่างของภาษาประเภทอื่น ๆ "ไม่ใช่ปกติ" หรือภาษาผิดปกติอย่างใด ถ้าเป็นเช่นนั้นสิ่งที่ประเภทอื่น ๆ เหล่านี้และสิ่งที่ไม่สม่ำเสมอของพวกเขาคืออะไร?

2
หมายเลขพาร์ติชันโปรโตคอลและความซับซ้อนของการสื่อสารที่กำหนดขึ้น
นอกจากนี้(กำหนด) การสื่อสารความซับซ้อน ของความสัมพันธ์อีกมาตรการพื้นฐานสำหรับจำนวนของการสื่อสารที่จำเป็นเป็นจำนวนพาร์ทิชันโปรโตคอล(R) ความสัมพันธ์ระหว่างสองมาตรการนี้เป็นที่ทราบกันดีถึงปัจจัยคงที่ เอกสารโดย Kushilevitz และ Nisan (1997) ให้R p p ( R )c c ( R )cc(R)cc(R)RRR p p ( R )pp(R)pp(R) คค( R ) / 3 ≤ บันทึก2( พีพี( R ) ) ≤ คค( R )cc(R)/3≤log2⁡(pp(R))≤cc(R).cc(R)/3 \le \log_2(pp(R)) \le cc(R). เกี่ยวกับความไม่เท่าเทียมกันที่สองมันเป็นเรื่องง่ายที่จะให้ (ครอบครัวไม่มีที่สิ้นสุดของ) ความสัมพันธ์กับ(R)log 2 ( p p …

1
นิพจน์ทั่วไปใดที่
เป็นที่ทราบกันดีว่าปัญหาต่อไปนี้เป็น PSPACE-complete: รับนิพจน์ทั่วไป , L ( β ) = Σ ∗หรือไม่ββ\betaL ( β) = Σ* * * *L(β)=Σ∗L(\beta) = \Sigma^* สิ่งที่เกี่ยวกับการพิจารณาความเท่าเทียมกับนิพจน์ปกติอื่น ๆ (คงที่) ?αα\alpha รับนิพจน์ทั่วไป , L ( β ) = L ( α )หรือไม่ββ\betaL ( β) = L ( α )L(β)=L(α)L(\beta) = L(\alpha) ต่อไปนี้เป็นที่รู้จักกัน: สำหรับปัญหาคือ PSPACE-completeα = ( 0 …

4
การใช้งาน REGEX ส่วนใหญ่อยู่ที่ระดับความซับซ้อนได้อย่างไร
การใช้งานที่ทันสมัยที่สุดของการแสดงออกปกติเช่นใน Perl หรือ. NET ไปไกลกว่าคำนิยามวิทยาศาสตร์คอมพิวเตอร์คลาสสิกของ REGEX ด้วยคุณสมบัติเช่น lookahead และ lookbehind คุณสมบัติเหล่านี้ช่วยให้พวกเขาวิเคราะห์คำสั่งที่ไม่สามารถอธิบายได้ด้วยระบบออโตเมติกที่ จำกัด และไม่มีการพุชดาวน์หรือไม่? การเข้าใกล้ทัวริงสมบูรณ์มากแค่ไหนที่ทำให้พวกเขาสามารถทำได้

2
JSON เป็นภาษาปกติหรือไม่
ฉันสงสัยว่าข้อมูลจำเพาะJSONกำหนดภาษาปกติหรือไม่ ดูเหมือนง่ายพอ แต่ฉันไม่แน่ใจว่าจะพิสูจน์ด้วยตัวเองได้อย่างไร เหตุผลที่ฉันถามก็เพราะฉันสงสัยว่าใครสามารถใช้การแสดงออกปกติเพื่อแยกวิเคราะห์ JSON ได้อย่างมีประสิทธิภาพ มีคนที่มีตัวแทนเพียงพอโปรดสร้างแท็ก json และ ภาษาปกติ สำหรับฉัน

3
สามารถ จำกัด ขอบเขตของออโตมาตา (NDFA) nondeterministic ได้อย่างมีประสิทธิภาพเพื่อกำหนดเป็นออโตมาตา (DFA) ในพื้นที่ / เวลาที่ จำกัด
ยี่สิบปีที่ผ่านมาฉันสร้างแพคเกจนิพจน์ทั่วไปที่รวมการแปลงจากนิพจน์ทั่วไปไปยังเครื่องสถานะ จำกัด (DFA) และสนับสนุนโฮสต์ของการดำเนินการนิพจน์ปกติที่ปิด ฉันไม่แน่ใจเกี่ยวกับประสิทธิภาพที่ดีที่สุดของแพ็คเกจ DFA มีพลังการแสดงออกเช่นเดียวกับ NDFA เนื่องจาก n-state NDFA สามารถแปลงเป็น DFA ที่มีสถานะ 2 ^ n เล็กน้อย อย่างไรก็ตามมีการรับประกันขอบเขตล่างที่ต่ำกว่าสำหรับการแปลงที่ไม่ต้องการการระเบิดแบบเลขชี้กำลังในสถานะหรือไม่? ฉันไม่สามารถหาตัวอย่างนิพจน์ทั่วไปหรือ NDFA ที่ไม่เหมาะสม แต่ฉันไม่ได้ใช้เวลาคิดมากกับมัน ฉันคาดเดาการแสดงออกปกติเช่น (((((| E | A | B | C) * (e | D | E | F)) * (e | G | H | I | J …

2
ลดขนาดของการแสดงออกปกติสำหรับชุด จำกัด
เป็นที่ทราบกันว่าการลดขนาดของการแสดงออกปกตินั้นเป็นสิ่งที่สมบูรณ์แบบของ PSPACE แม้ว่าเราจะมี DFA เป็นข้อกำหนดของภาษาก็ตาม ผลลัพธ์จะเป็นอย่างไรหากภาษามี จำกัด หนึ่งสามารถพิจารณาปัญหานี้ในสองรุ่น: อินพุตเป็นสตริงทั้งหมดในภาษาและเราวัดขนาดอินพุตด้วยผลรวมของความยาวของสตริงทั้งหมด อินพุตเป็น DFA และเราวัดขนาดอินพุตตามจำนวนสถานะของ DFA Kleene star ไม่มีประโยชน์ในกรณีที่มี จำกัด ดังนั้น , | และ⋅ (การต่อข้อมูล) ใช้ในนิพจน์ แน่นอนว่าความยาวของการแสดงออกปกติดูเหมือนจะไม่แน่นอน แต่เราสามารถให้น้ำหนักกับแต่ละการดำเนินการ (รวมถึงการเพิ่มวงเล็บ) และขอให้ลดน้ำหนักของนิพจน์ปกติ( )()()|||⋅⋅\cdot แก้ไข:ตามที่ระบุไว้ adrianN จะเกี่ยวข้องกับรหัสที่ใช้ไวยากรณ์ มันเป็น NP-complete ในการสร้างไวยากรณ์ฟรีบริบทความยาวต่ำสุดเพื่ออธิบายชุด จำกัด ยังไม่ชัดเจนว่าทำไมไวยากรณ์ฟรีขนาดบริบทขั้นต่ำสามารถบอกเป็นนัยเกี่ยวกับการแสดงออกปกติขนาดขั้นต่ำได้มาก บางทีกฎการเขียนใหม่ที่ฉลาดสามารถเชื่อมโยงสองสิ่งนี้เข้าด้วยกันและพิสูจน์ว่าในรุ่นแรกปัญหาอยู่ใน NP

3
ความคืบหน้าของปัญหาความสูงดาวทั่วไปหรือไม่
ความสูงของดาว (ทั่วไป) ของภาษาคือการซ้อนขั้นต่ำสุดของดาว Kleene ที่ต้องการเพื่อแสดงภาษาโดยการแสดงออกปกติที่ขยายออกไป จำได้ว่านิพจน์ปกติที่ขยายไปเหนือตัวอักษร จำกัดตอบสนองต่อไปนี้:AAA (1) และaเป็นนิพจน์ปกติที่เพิ่มขึ้นสำหรับa ∈ A ทั้งหมด∅ , 1∅,1\emptyset, 1aaaa ∈ Aa∈Aa\in A (2) สำหรับนิพจน์ทั่วไปที่ขยายทั้งหมด ; E ∪ F , E F , E ∗และE cเป็นการขยายการแสดงออกปกติE, FE,FE,F E∪ FE∪FE\cup FEFEFEFE* * * *E∗E^*EคEcE^c หนึ่งประโยคของปัญหาความสูงของดาวทั่วไปคือว่ามีอัลกอริทึมในการคำนวณความสูงของดาวที่ต่ำที่สุดหรือไม่ เกี่ยวกับปัญหานี้ฉันมีคำถามสองสามข้อ มีความคืบหน้าเมื่อเร็ว ๆ นี้ (หรืองานวิจัยที่สนใจ) เกี่ยวกับปัญหานี้หรือไม่? ฉันรู้มาหลายปีแล้วที่ Pin Straubing และThérienตีพิมพ์บทความในพื้นที่นี้ ปัญหาความสูงของดาวที่ถูก …

4
ลำดับชั้นในภาษาปกติ
มีลำดับชั้น "ดี" เป็นที่รู้จักหรือไม่ (อาจมี จำกัด ) ภายในชั้นเรียนของภาษาปกติหรือไม่ โดยที่นี่ชั้นเรียนในแต่ละลำดับชั้นจับความหมาย / พลังงาน / ความซับซ้อนที่แตกต่างกัน นอกจากนี้การเป็นสมาชิกของแต่ละชั้นก็มีองค์ประกอบบางอย่างที่แสดงให้เห็นอย่างชัดเจน (ซึ่งแตกต่างจากปัญหาระดับความสูงของดาวที่อาจเป็นปัญหา)L0⊆L1⊆L2⊆…L0⊆L1⊆L2⊆…L_0 \subseteq L_1 \subseteq L_2 \subseteq \dotsLLL ขอขอบคุณ!

1
ค่าใช้จ่ายของแบบสอบถามที่เท่ากันสำหรับ DFA
ได้รับแรงบันดาลใจจากคำถามนี้ฉันอยากรู้เกี่ยวกับสิ่งต่อไปนี้: ความซับซ้อนของกรณีที่เลวร้ายที่สุดในการตรวจสอบว่า DFA ที่ระบุนั้นยอมรับภาษาเดียวกันกับนิพจน์ทั่วไปหรือไม่ เป็นที่รู้จักกันไหม? หวังว่าจะเป็นปัญหานี้ใน P - ว่ามีพหุนามอัลกอริทึมในขนาดของทั้งสอง

1
ความซับซ้อนของการกำหนดพารามิเตอร์ของการรวมภาษาปกติ
ฉันสนใจในปัญหาคลาสสิกอย่างเป็นทางการรวมถึงภาษา รับนิพจน์ทั่วไปเราแสดงโดยภาษาปกติที่เกี่ยวข้อง (นิพจน์ทั่วไปใช้ตัวอักษรคงที่ , กับสหภาพการดำเนินงาน, Kleene-star และการต่อข้อมูล)EEEL(E)L(E)L(E)ΣΣ\Sigma การป้อนข้อมูล:สองแสดงออกปกติและคำถาม:มันคือความจริงที่ ?E1E1E_1E2E2E_2 L(E1)⊆L(E2)L(E1)⊆L(E2)L(E_1)\subseteq L(E_2) การรวมภาษาปกติเป็นที่รู้จักกันในชื่อ PSPACE-complete [1] วิธีคลาสสิกในการแก้ปัญหา (ใน PSPACE) คือการสร้าง NFAsและเกี่ยวข้องกับและเพื่อสร้าง DFAจากเสริมให้เป็น DFAและในที่สุดก็สร้างทางแยกจากและที่สอดคล้องกับจุดตัดของและ C ตอนนี้และถ้าหากไม่มีเส้นทางที่ยอมรับในA_PA1A1A_1A2A2A_2E1E1E_1E2E2E_2D2D2D_2A2A2A_2DC2D2CD_2^CAPAPA_PA1A1A_1DC2D2CD_2^CL(E1)L(E1)L(E_1)L(E2)CL(E2)CL(E_2)^CL(E1)⊆L(E2)L(E1)⊆L(E2)L(E_1)\subseteq L(E_2)APAPA_P ถ้าฉันไม่ผิดกระบวนการทั้งหมดสามารถทำได้ในเวลาพหุนามเมื่อเป็นภาษาคงที่ตั้งแต่เพียงชี้แจงระเบิดขึ้นมาจากการเปลี่ยนเข้าD_2ยิ่งไปกว่านั้นปัญหาคือ FPT เมื่อพารามิเตอร์โดยความยาวของE_2E2E2E_2A2A2A_2D2D2D_2|E2||E2||E_2|E2E2E_2 สิ่งนี้กระตุ้นให้คำถามของฉัน: คำถาม:เมื่อเป็นนิพจน์ที่คงที่ความซับซ้อนของการรวมภาษาประจำคืออะไร มันยังคงอยู่ใน PSPACE หรือไม่E1E1E_1 [1] LJ Stockmeyer และ AR Meyer ปัญหา Word ที่ต้องใช้เวลาเอ็กซ์โปเนนเชียล: รายงานเบื้องต้น รายงานการประชุม ACM ประจำปีครั้งที่ห้าในทฤษฎีคอมพิวเตอร์, STOC '73, หน้า 1-9 หมายเหตุ: …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.