วิธีการแยกเพียงส่วนหนึ่งของสตริง


0

ฉันมีไฟล์แบตช์โดยใช้ wget และ grep ที่ดาวน์โหลดเว็บไซต์จากนั้นแยกสตริงที่ร่วงออกมาจากซอร์สโค้ด

<p>11.59 €</p>

อย่างที่คุณเห็น grep รวมแท็กวรรคซึ่งฉันต้องการแยกออก จะทำอย่างไร?

คำตอบ:


0

ฉันอยากจะแนะนำการแสดงออก regex บางทีสิ่งนี้: /<[^>]*>/g

นิพจน์ควรยกเว้นแท็กที่คุณพูดถึงรวมถึงสิ่งต่าง ๆ เช่น

เป็นต้น


คุณไม่สามารถแยกวิเคราะห์ [x] html โดยใช้นิพจน์ทั่วไป RegEx จับคู่แท็กที่เปิดอยู่ยกเว้น XHTML แท็กที่จัดเก็บในตัวเอง ;)
DavidPostill

LMFAO วิธีที่โพสต์จบลงจะสวยงาม :) การแสดงออกนั้นจะไม่ทำงานกับตัวอย่างบรรทัดของเขาที่ฉันคิดว่ามันจะเป็นแค่ <p> </p> เป็นต้นหรือไม่ ฉันจะอัปเดตการใช้ถ้อยคำของฉัน :)
Abraxas

regexpal.comแนะนำว่ามันจะโอเคสำหรับกรณีง่าย ๆ ของ OP;)
DavidPostill
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.