การเขียนโปรแกรม parsing

12

ฉันไม่พบfile.ReadLineฟังก์ชันใน Go ฉันสามารถหาวิธีเขียนได้อย่างรวดเร็ว แต่ฉันแค่สงสัยว่าฉันมองอะไรบางอย่างที่นี่ หนึ่งจะอ่านไฟล์ทีละบรรทัดได้อย่างไร

334 string file parsing go line

4

แนวปฏิบัติที่ดีที่สุดในการใช้ไฟล์การตั้งค่าใน Python คืออะไร [ปิด]

ปิด คำถามนี้จะต้องมีมากขึ้นมุ่งเน้น ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้มุ่งเน้นที่ปัญหาเดียวโดยแก้ไขโพสต์นี้ ปิดให้บริการใน2 ปีที่ผ่านมา ปรับปรุงคำถามนี้ ฉันมีสคริปต์บรรทัดคำสั่งที่ฉันทำงานด้วยข้อโต้แย้งมากมาย ตอนนี้ฉันมาถึงจุดที่ฉันมีข้อโต้แย้งมากเกินไปและฉันต้องการมีข้อโต้แย้งในรูปแบบพจนานุกรมด้วย ดังนั้นเพื่อลดความซับซ้อนของสิ่งที่ฉันต้องการเรียกใช้สคริปต์ด้วยไฟล์การตั้งค่าแทน ฉันไม่รู้จริงๆว่าควรใช้ไลบรารี่ใดในการแยกวิเคราะห์ไฟล์ การปฏิบัติที่ดีที่สุดในการทำสิ่งนี้คืออะไร แน่นอนฉันสามารถทุบบางสิ่งบางอย่างออกมาเอง แต่ถ้ามีห้องสมุดสำหรับเรื่องนี้ฉันหูทั้งหมด 'ความต้องการ' ไม่กี่: แทนที่จะใช้pickleฉันต้องการให้เป็นไฟล์ข้อความที่สามารถอ่านและแก้ไขได้อย่างง่ายดาย ฉันต้องการที่จะสามารถเพิ่มข้อมูลเหมือนพจนานุกรมลงในแผ่นงานได้เช่นรูปแบบการซ้อนควรได้รับการสนับสนุน ไฟล์ตัวอย่างหลอกง่าย: truck: color: blue brand: ford city: new york cabriolet: color: black engine: cylinders: 8 placement: mid doors: 2

332 python parsing configuration yaml settings

7

Pandas read_csv low_memory และ dtype ตัวเลือก

เมื่อโทรมา df = pd.read_csv('somefile.csv') ฉันเข้าใจ: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: คอลัมน์ (4,5,7,16) มีประเภทผสม ระบุตัวเลือก dtype ในการนำเข้าหรือตั้งค่า low_memory = False ทำไมdtypeตัวเลือกถึงเกี่ยวข้องlow_memoryและเหตุใดจึงทำให้Falseเกิดปัญหานี้

320 python parsing numpy pandas dataframe

5

lexers เทียบกับ parsers

lexers และ parsers แตกต่างกันจริงๆในทางทฤษฎีหรือไม่ ดูเหมือนว่าแฟชั่นจะเกลียดการแสดงออกปกติ: การเข้ารหัสสยองขวัญ , บล็อกโพสต์อีก อย่างไรก็ตามเครื่องมือที่ได้รับความนิยมจาก lexing: pygments , geshiหรือprettifyทั้งหมดใช้การแสดงออกปกติ พวกเขาดูเหมือนจะเป็นอะไรที่ ... เมื่อ lexing เพียงพอคุณต้องการ EBNF เมื่อใด มีใครบ้างที่ใช้โทเค็นที่ผลิตโดย lexers เหล่านี้กับเครื่องกำเนิดไฟฟ้าตัวแยกวิเคราะห์กระทิงหรือ antlr

308 parsing antlr lexer pygments

5

วิธีการวิเคราะห์ JSON ใน Python

โครงการของฉันกำลังรับข้อความ JSON ใน python ซึ่งฉันต้องได้รับข้อมูลบางส่วน เพื่อจุดประสงค์นี้ลองตั้งค่าเป็น JSON แบบง่าย ๆ ในสตริง: jsonStr = '{"one" : "1", "two" : "2", "three" : "3"}' จนถึงขณะนี้ผมได้รับการสร้าง JSON คำขอใช้รายการแล้วแต่จะทำตรงข้ามของนี้ผมคิดว่าผมจำเป็นต้องใช้json.dumps json.loadsอย่างไรก็ตามฉันไม่ได้โชคดีกับมัน ทุกคนสามารถให้ข้อมูลโค้ดที่จะกลับมา"2"พร้อมกับการป้อนข้อมูล"two"ในตัวอย่างข้างต้นหรือไม่

282 python json parsing

30

การเพิ่มพารามิเตอร์ไปยัง URL ด้วย JavaScript

ในเว็บแอปพลิเคชันที่ใช้การโทร AJAX ฉันต้องส่งคำขอ แต่เพิ่มพารามิเตอร์ไปยังจุดสิ้นสุดของ URL ตัวอย่างเช่น URL ดั้งเดิม: http: //server/myapp.php id = 10 URL ผลลัพธ์ http: //server/myapp.php? id = 10 & enabled = true ค้นหาฟังก์ชัน JavaScript ที่แยกวิเคราะห์ URL ที่ดูแต่ละพารามิเตอร์จากนั้นเพิ่มพารามิเตอร์ใหม่หรืออัพเดตค่าหากมีอยู่แล้ว

276 javascript url parsing parameters query-string

19

แยกสตริง URI ลงในชุดชื่อมูลค่า

ฉันมี URI เช่นนี้: https://google.com.ua/oauth/authorize?client_id=SS&response_type=code&scope=N_FULL&access_type=offline&redirect_uri=http://localhost/Callback ฉันต้องการคอลเล็กชันที่มีองค์ประกอบแยกวิเคราะห์: NAME VALUE ------------------------ client_id SS response_type code scope N_FULL access_type offline redirect_uri http://localhost/Callback เป็นที่แน่นอนฉันต้องเทียบเท่า Java สำหรับ C # /. NET HttpUtility.ParseQueryStringวิธี กรุณาให้คำแนะนำกับฉัน ขอบคุณ

274 java parsing uri namevaluecollection

8

วิธีอ่าน XML โดยใช้ XPath ใน Java

ฉันต้องการอ่านข้อมูล XML โดยใช้ XPath ใน Java ดังนั้นสำหรับข้อมูลที่ฉันรวบรวมฉันไม่สามารถแยกวิเคราะห์ XML ตามความต้องการของฉัน นี่คือสิ่งที่ฉันต้องการจะทำ: รับไฟล์ XML จากออนไลน์ผ่าน URL จากนั้นใช้ XPath เพื่อแยกวิเคราะห์ฉันต้องการสร้างสองวิธีในนั้น หนึ่งในนั้นคือฉันป้อนรหัสแอตทริบิวต์โหนดที่เฉพาะเจาะจงและฉันได้รับโหนดเด็กทั้งหมดเป็นผลและที่สองคือฉันคิดว่าฉันต้องการที่จะได้รับค่าโหนดเด็กที่เฉพาะเจาะจงเท่านั้น <?xml version="1.0"?> <howto> <topic name="Java"> <url>http://www.rgagnonjavahowto.htm</url> <car>taxi</car> </topic> <topic name="PowerBuilder"> <url>http://www.rgagnon/pbhowto.htm</url> <url>http://www.rgagnon/pbhowtonew.htm</url> </topic> <topic name="Javascript"> <url>http://www.rgagnon/jshowto.htm</url> </topic> <topic name="VBScript"> <url>http://www.rgagnon/vbshowto.htm</url> </topic> </howto> ในตัวอย่างด้านบนฉันต้องการอ่านองค์ประกอบทั้งหมดถ้าฉันค้นหาผ่าน @name และฟังก์ชั่นเดียวที่ฉันต้องการ url จาก @name 'Javascript' จะคืนค่าองค์ประกอบโหนดเดียว

273 java xml parsing xpath

25

แยกสตริงการสืบค้นบน Android

Java EE มีServletRequest.getParameterValues ()() บนแพลตฟอร์มที่ไม่ใช่ EE, URL.getQuery ()จะส่งคืนสตริง เป็นวิธีปกติในการแยกวิเคราะห์สตริงแบบสอบถามใน URL อย่างถูกต้องเมื่อไม่ได้อยู่ใน Java EE อะไร < คุยโว > เป็นที่นิยมในคำตอบให้ลองทำ parser ของคุณเอง นี่เป็นโครงการไมโครโค้ดที่น่าสนใจและน่าตื่นเต้น แต่ฉันไม่สามารถพูดได้ว่ามันเป็นความคิดที่ดี :( ตัวอย่างโค้ดด้านล่างนี้มีข้อบกพร่องหรือเสียโดยทั่วไป btw ทำลายพวกเขาคือการออกกำลังกายที่น่าสนใจสำหรับผู้อ่าน และเพื่อแฮกเกอร์โจมตีเว็บไซต์ที่ใช้งานและให้แฮกเกอร์โจมตีเว็บไซต์ที่ใช้พวกเขา การแยกสตริงข้อความค้นหาเป็นปัญหาที่กำหนดไว้อย่างดี แต่การอ่านข้อมูลจำเพาะและทำความเข้าใจกับความแตกต่างนั้นไม่ใช่เรื่องเล็กน้อย มันดีกว่าที่จะปล่อยให้ coder ไลบรารีแพลตฟอร์มทำงานหนักและทำการแก้ไขสำหรับคุณ! < / คุยโว >

271 java android parsing url

30

ฉันจะอ่านและแยกไฟล์ CSV ใน C ++ ได้อย่างไร

ฉันต้องการโหลดและใช้ข้อมูลไฟล์ CSV ใน C ++ ณ จุดนี้มันสามารถเป็นตัวแยกวิเคราะห์เครื่องหมายจุลภาค (เช่นไม่ต้องกังวลเกี่ยวกับการหลบหนีบรรทัดใหม่และเครื่องหมายจุลภาค) ความต้องการหลักคือตัวแยกวิเคราะห์บรรทัดต่อบรรทัดที่จะส่งคืนเวกเตอร์สำหรับบรรทัดถัดไปในแต่ละครั้งที่เรียกใช้เมธอด ฉันพบบทความนี้ซึ่งดูมีแนวโน้มมาก: http://www.boost.org/doc/libs/1_35_0/libs/spirit/example/fundamental/list_parser.cpp ฉันไม่เคยใช้วิญญาณของ Boost แต่ยินดีที่จะลอง แต่ถ้าไม่มีวิธีแก้ปัญหาที่ตรงไปตรงมามากกว่านี้

264 c++ parsing text csv

17

วิธีการแยกสตริงเพื่อ int ใน C ++?

C + + วิธีการแยกสตริง (ที่กำหนดเป็นถ่าน *) ลงใน int คืออะไร? จัดการข้อผิดพลาดที่แข็งแกร่งและชัดเจนเป็นบวก (แทนกลับเป็นศูนย์ )

261 c++ parsing

8

วิธีแปลงสตริงเป็นทศนิยมใน JavaScript?

ฉันพยายามแยกค่าสองค่าจากดาตาแกรม ฟิลด์เป็นตัวเลขและเมื่อมีเครื่องหมายจุลภาค (เช่น 554,20) ฉันจะไม่สามารถรับตัวเลขหลังเครื่องหมายจุลภาค ฉันได้พยายามและparseInt parseFloatฉันจะทำสิ่งนี้ได้อย่างไร

255 javascript parsing floating-point

7

ใน Java ฉันจะแยกวิเคราะห์ XML เป็นสตริงแทนไฟล์ได้อย่างไร

ฉันมีรหัสต่อไปนี้: DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(xmlFile); ฉันจะให้มันแยกวิเคราะห์ XML ที่มีอยู่ใน String แทนที่จะเป็นไฟล์ได้อย่างไร

249 java xml string file parsing

21

ฉันจะตรวจสอบว่าสตริง C ++ std :: เริ่มต้นด้วยสตริงที่แน่นอนและแปลงสตริงย่อยเป็น int ได้อย่างไร

ฉันจะใช้สิ่งต่อไปนี้ (Python pseudocode) ใน C ++ ได้อย่างไร if argv[1].startswith('--foo='): foo_value = int(argv[1][len('--foo='):]) (ตัวอย่างเช่นถ้าargv[1]เป็น--foo=98เช่นนั้นfoo_valueคือ98) อัปเดต:ฉันลังเลที่จะดู Boost เนื่องจากฉันแค่มองการเปลี่ยนแปลงเล็กน้อยเป็นเครื่องมือบรรทัดคำสั่งเล็ก ๆ น้อย ๆ (ฉันไม่ต้องการเรียนรู้วิธีเชื่อมโยงและใช้ Boost สำหรับผู้เยาว์ การเปลี่ยนแปลง)

242 c++ string parsing substring startswith

13

Python: ลบ \ xa0 จากสตริงหรือไม่

ขณะนี้ฉันกำลังใช้ Beautiful Soup เพื่อแยกไฟล์ HTML และการโทรget_text()ออก แต่ดูเหมือนว่าฉันถูกทิ้งให้อยู่กับ \ xa0 Unicode จำนวนมากแทนช่องว่าง มีวิธีที่มีประสิทธิภาพในการลบทั้งหมดใน Python 2.7 และเปลี่ยนเป็นช่องว่างหรือไม่ ฉันเดาคำถามทั่วไปมากขึ้นจะมีวิธีลบการจัดรูปแบบ Unicode หรือไม่ ฉันลองใช้: line = line.replace(u'\xa0',' ')ตามที่เธรดอื่นแนะนำ แต่เปลี่ยน \ xa0 เป็น u ดังนั้นตอนนี้ฉันมี "u" ทุกที่แทน ): แก้ไข: ปัญหาดูเหมือนว่าจะได้รับการแก้ไขstr.replace(u'\xa0', ' ').encode('utf-8')แต่เพียงทำ.encode('utf-8')โดยไม่replace()ดูเหมือนว่าจะทำให้มันคายออกแม้ตัวละคร Weirder \ xc2 เช่น มีใครอธิบายเรื่องนี้ได้บ้าง

241 python parsing unicode

คำถามติดแท็ก parsing