คำถามติดแท็ก parsing

การแยกหมายถึงการแบ่งสิ่งประดิษฐ์ลงในองค์ประกอบที่เป็นองค์ประกอบและจับความสัมพันธ์ระหว่างองค์ประกอบเหล่านั้น แท็กนี้ไม่ได้มีคำถามเกี่ยวกับแพลตฟอร์มการแยกวิเคราะห์ที่โฮสต์ด้วยตนเอง (ใช้แท็ก [แยกวิเคราะห์แพลตฟอร์ม]) หรือข้อผิดพลาดในการแยกวิเคราะห์ในภาษาการเขียนโปรแกรมเฉพาะ (ใช้แท็กภาษาที่เหมาะสมแทน)

12
อ่านไฟล์ทีละบรรทัดใน Go
ฉันไม่พบfile.ReadLineฟังก์ชันใน Go ฉันสามารถหาวิธีเขียนได้อย่างรวดเร็ว แต่ฉันแค่สงสัยว่าฉันมองอะไรบางอย่างที่นี่ หนึ่งจะอ่านไฟล์ทีละบรรทัดได้อย่างไร
334 string  file  parsing  go  line 

4
แนวปฏิบัติที่ดีที่สุดในการใช้ไฟล์การตั้งค่าใน Python คืออะไร [ปิด]
ปิด คำถามนี้จะต้องมีมากขึ้นมุ่งเน้น ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้มุ่งเน้นที่ปัญหาเดียวโดยแก้ไขโพสต์นี้ ปิดให้บริการใน2 ปีที่ผ่านมา ปรับปรุงคำถามนี้ ฉันมีสคริปต์บรรทัดคำสั่งที่ฉันทำงานด้วยข้อโต้แย้งมากมาย ตอนนี้ฉันมาถึงจุดที่ฉันมีข้อโต้แย้งมากเกินไปและฉันต้องการมีข้อโต้แย้งในรูปแบบพจนานุกรมด้วย ดังนั้นเพื่อลดความซับซ้อนของสิ่งที่ฉันต้องการเรียกใช้สคริปต์ด้วยไฟล์การตั้งค่าแทน ฉันไม่รู้จริงๆว่าควรใช้ไลบรารี่ใดในการแยกวิเคราะห์ไฟล์ การปฏิบัติที่ดีที่สุดในการทำสิ่งนี้คืออะไร แน่นอนฉันสามารถทุบบางสิ่งบางอย่างออกมาเอง แต่ถ้ามีห้องสมุดสำหรับเรื่องนี้ฉันหูทั้งหมด 'ความต้องการ' ไม่กี่: แทนที่จะใช้pickleฉันต้องการให้เป็นไฟล์ข้อความที่สามารถอ่านและแก้ไขได้อย่างง่ายดาย ฉันต้องการที่จะสามารถเพิ่มข้อมูลเหมือนพจนานุกรมลงในแผ่นงานได้เช่นรูปแบบการซ้อนควรได้รับการสนับสนุน ไฟล์ตัวอย่างหลอกง่าย: truck: color: blue brand: ford city: new york cabriolet: color: black engine: cylinders: 8 placement: mid doors: 2

7
Pandas read_csv low_memory และ dtype ตัวเลือก
เมื่อโทรมา df = pd.read_csv('somefile.csv') ฉันเข้าใจ: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: คอลัมน์ (4,5,7,16) มีประเภทผสม ระบุตัวเลือก dtype ในการนำเข้าหรือตั้งค่า low_memory = False ทำไมdtypeตัวเลือกถึงเกี่ยวข้องlow_memoryและเหตุใดจึงทำให้Falseเกิดปัญหานี้

5
lexers เทียบกับ parsers
lexers และ parsers แตกต่างกันจริงๆในทางทฤษฎีหรือไม่ ดูเหมือนว่าแฟชั่นจะเกลียดการแสดงออกปกติ: การเข้ารหัสสยองขวัญ , บล็อกโพสต์อีก อย่างไรก็ตามเครื่องมือที่ได้รับความนิยมจาก lexing: pygments , geshiหรือprettifyทั้งหมดใช้การแสดงออกปกติ พวกเขาดูเหมือนจะเป็นอะไรที่ ... เมื่อ lexing เพียงพอคุณต้องการ EBNF เมื่อใด มีใครบ้างที่ใช้โทเค็นที่ผลิตโดย lexers เหล่านี้กับเครื่องกำเนิดไฟฟ้าตัวแยกวิเคราะห์กระทิงหรือ antlr
308 parsing  antlr  lexer  pygments 

5
วิธีการวิเคราะห์ JSON ใน Python
โครงการของฉันกำลังรับข้อความ JSON ใน python ซึ่งฉันต้องได้รับข้อมูลบางส่วน เพื่อจุดประสงค์นี้ลองตั้งค่าเป็น JSON แบบง่าย ๆ ในสตริง: jsonStr = '{"one" : "1", "two" : "2", "three" : "3"}' จนถึงขณะนี้ผมได้รับการสร้าง JSON คำขอใช้รายการแล้วแต่จะทำตรงข้ามของนี้ผมคิดว่าผมจำเป็นต้องใช้json.dumps json.loadsอย่างไรก็ตามฉันไม่ได้โชคดีกับมัน ทุกคนสามารถให้ข้อมูลโค้ดที่จะกลับมา"2"พร้อมกับการป้อนข้อมูล"two"ในตัวอย่างข้างต้นหรือไม่
282 python  json  parsing 

30
การเพิ่มพารามิเตอร์ไปยัง URL ด้วย JavaScript
ในเว็บแอปพลิเคชันที่ใช้การโทร AJAX ฉันต้องส่งคำขอ แต่เพิ่มพารามิเตอร์ไปยังจุดสิ้นสุดของ URL ตัวอย่างเช่น URL ดั้งเดิม: http: //server/myapp.php id = 10 URL ผลลัพธ์ http: //server/myapp.php? id = 10 & enabled = true ค้นหาฟังก์ชัน JavaScript ที่แยกวิเคราะห์ URL ที่ดูแต่ละพารามิเตอร์จากนั้นเพิ่มพารามิเตอร์ใหม่หรืออัพเดตค่าหากมีอยู่แล้ว

19
แยกสตริง URI ลงในชุดชื่อมูลค่า
ฉันมี URI เช่นนี้: https://google.com.ua/oauth/authorize?client_id=SS&response_type=code&scope=N_FULL&access_type=offline&redirect_uri=http://localhost/Callback ฉันต้องการคอลเล็กชันที่มีองค์ประกอบแยกวิเคราะห์: NAME VALUE ------------------------ client_id SS response_type code scope N_FULL access_type offline redirect_uri http://localhost/Callback เป็นที่แน่นอนฉันต้องเทียบเท่า Java สำหรับ C # /. NET HttpUtility.ParseQueryStringวิธี กรุณาให้คำแนะนำกับฉัน ขอบคุณ

8
วิธีอ่าน XML โดยใช้ XPath ใน Java
ฉันต้องการอ่านข้อมูล XML โดยใช้ XPath ใน Java ดังนั้นสำหรับข้อมูลที่ฉันรวบรวมฉันไม่สามารถแยกวิเคราะห์ XML ตามความต้องการของฉัน นี่คือสิ่งที่ฉันต้องการจะทำ: รับไฟล์ XML จากออนไลน์ผ่าน URL จากนั้นใช้ XPath เพื่อแยกวิเคราะห์ฉันต้องการสร้างสองวิธีในนั้น หนึ่งในนั้นคือฉันป้อนรหัสแอตทริบิวต์โหนดที่เฉพาะเจาะจงและฉันได้รับโหนดเด็กทั้งหมดเป็นผลและที่สองคือฉันคิดว่าฉันต้องการที่จะได้รับค่าโหนดเด็กที่เฉพาะเจาะจงเท่านั้น <?xml version="1.0"?> <howto> <topic name="Java"> <url>http://www.rgagnonjavahowto.htm</url> <car>taxi</car> </topic> <topic name="PowerBuilder"> <url>http://www.rgagnon/pbhowto.htm</url> <url>http://www.rgagnon/pbhowtonew.htm</url> </topic> <topic name="Javascript"> <url>http://www.rgagnon/jshowto.htm</url> </topic> <topic name="VBScript"> <url>http://www.rgagnon/vbshowto.htm</url> </topic> </howto> ในตัวอย่างด้านบนฉันต้องการอ่านองค์ประกอบทั้งหมดถ้าฉันค้นหาผ่าน @name และฟังก์ชั่นเดียวที่ฉันต้องการ url จาก @name 'Javascript' จะคืนค่าองค์ประกอบโหนดเดียว
273 java  xml  parsing  xpath 

25
แยกสตริงการสืบค้นบน Android
Java EE มีServletRequest.getParameterValues ​​()() บนแพลตฟอร์มที่ไม่ใช่ EE, URL.getQuery ()จะส่งคืนสตริง เป็นวิธีปกติในการแยกวิเคราะห์สตริงแบบสอบถามใน URL อย่างถูกต้องเมื่อไม่ได้อยู่ใน Java EE อะไร < คุยโว > เป็นที่นิยมในคำตอบให้ลองทำ parser ของคุณเอง นี่เป็นโครงการไมโครโค้ดที่น่าสนใจและน่าตื่นเต้น แต่ฉันไม่สามารถพูดได้ว่ามันเป็นความคิดที่ดี :( ตัวอย่างโค้ดด้านล่างนี้มีข้อบกพร่องหรือเสียโดยทั่วไป btw ทำลายพวกเขาคือการออกกำลังกายที่น่าสนใจสำหรับผู้อ่าน และเพื่อแฮกเกอร์โจมตีเว็บไซต์ที่ใช้งานและให้แฮกเกอร์โจมตีเว็บไซต์ที่ใช้พวกเขา การแยกสตริงข้อความค้นหาเป็นปัญหาที่กำหนดไว้อย่างดี แต่การอ่านข้อมูลจำเพาะและทำความเข้าใจกับความแตกต่างนั้นไม่ใช่เรื่องเล็กน้อย มันดีกว่าที่จะปล่อยให้ coder ไลบรารีแพลตฟอร์มทำงานหนักและทำการแก้ไขสำหรับคุณ! < / คุยโว >
271 java  android  parsing  url 

30
ฉันจะอ่านและแยกไฟล์ CSV ใน C ++ ได้อย่างไร
ฉันต้องการโหลดและใช้ข้อมูลไฟล์ CSV ใน C ++ ณ จุดนี้มันสามารถเป็นตัวแยกวิเคราะห์เครื่องหมายจุลภาค (เช่นไม่ต้องกังวลเกี่ยวกับการหลบหนีบรรทัดใหม่และเครื่องหมายจุลภาค) ความต้องการหลักคือตัวแยกวิเคราะห์บรรทัดต่อบรรทัดที่จะส่งคืนเวกเตอร์สำหรับบรรทัดถัดไปในแต่ละครั้งที่เรียกใช้เมธอด ฉันพบบทความนี้ซึ่งดูมีแนวโน้มมาก: http://www.boost.org/doc/libs/1_35_0/libs/spirit/example/fundamental/list_parser.cpp ฉันไม่เคยใช้วิญญาณของ Boost แต่ยินดีที่จะลอง แต่ถ้าไม่มีวิธีแก้ปัญหาที่ตรงไปตรงมามากกว่านี้
264 c++  parsing  text  csv 


8
วิธีแปลงสตริงเป็นทศนิยมใน JavaScript?
ฉันพยายามแยกค่าสองค่าจากดาตาแกรม ฟิลด์เป็นตัวเลขและเมื่อมีเครื่องหมายจุลภาค (เช่น 554,20) ฉันจะไม่สามารถรับตัวเลขหลังเครื่องหมายจุลภาค ฉันได้พยายามและparseInt parseFloatฉันจะทำสิ่งนี้ได้อย่างไร

7
ใน Java ฉันจะแยกวิเคราะห์ XML เป็นสตริงแทนไฟล์ได้อย่างไร
ฉันมีรหัสต่อไปนี้: DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(xmlFile); ฉันจะให้มันแยกวิเคราะห์ XML ที่มีอยู่ใน String แทนที่จะเป็นไฟล์ได้อย่างไร
249 java  xml  string  file  parsing 

21
ฉันจะตรวจสอบว่าสตริง C ++ std :: เริ่มต้นด้วยสตริงที่แน่นอนและแปลงสตริงย่อยเป็น int ได้อย่างไร
ฉันจะใช้สิ่งต่อไปนี้ (Python pseudocode) ใน C ++ ได้อย่างไร if argv[1].startswith('--foo='): foo_value = int(argv[1][len('--foo='):]) (ตัวอย่างเช่นถ้าargv[1]เป็น--foo=98เช่นนั้นfoo_valueคือ98) อัปเดต:ฉันลังเลที่จะดู Boost เนื่องจากฉันแค่มองการเปลี่ยนแปลงเล็กน้อยเป็นเครื่องมือบรรทัดคำสั่งเล็ก ๆ น้อย ๆ (ฉันไม่ต้องการเรียนรู้วิธีเชื่อมโยงและใช้ Boost สำหรับผู้เยาว์ การเปลี่ยนแปลง)

13
Python: ลบ \ xa0 จากสตริงหรือไม่
ขณะนี้ฉันกำลังใช้ Beautiful Soup เพื่อแยกไฟล์ HTML และการโทรget_text()ออก แต่ดูเหมือนว่าฉันถูกทิ้งให้อยู่กับ \ xa0 Unicode จำนวนมากแทนช่องว่าง มีวิธีที่มีประสิทธิภาพในการลบทั้งหมดใน Python 2.7 และเปลี่ยนเป็นช่องว่างหรือไม่ ฉันเดาคำถามทั่วไปมากขึ้นจะมีวิธีลบการจัดรูปแบบ Unicode หรือไม่ ฉันลองใช้: line = line.replace(u'\xa0',' ')ตามที่เธรดอื่นแนะนำ แต่เปลี่ยน \ xa0 เป็น u ดังนั้นตอนนี้ฉันมี "u" ทุกที่แทน ): แก้ไข: ปัญหาดูเหมือนว่าจะได้รับการแก้ไขstr.replace(u'\xa0', ' ').encode('utf-8')แต่เพียงทำ.encode('utf-8')โดยไม่replace()ดูเหมือนว่าจะทำให้มันคายออกแม้ตัวละคร Weirder \ xc2 เช่น มีใครอธิบายเรื่องนี้ได้บ้าง
241 python  parsing  unicode 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.