ฉันอยู่ระหว่างการทำสคริปต์ทุบตีเพื่อขูด weather.com เพื่อรับรายงานสภาพอากาศ ฉันต้องการประมวลผลบรรทัดข้อความที่มีอักขระผิดปกติ นี่คือข้อความ:
30 ° FHigh 35 °สูง 52 °สูง 45 °สูง 43 °สูง
มีวงกลมเล็ก ๆ ระหว่างตัวเลขและตัวอักษร นี่คือรหัส:
#!/bin/bash
clear
lynx --dump http://www.weather.com/weather/5-day/New+York+NY+10001 | \
egrep ' Today | Tonight ' -A 22 | awk 'BEGIN {print "\n\t\t\b\b\b\b\b\bTHE FIVE DAY\
WEATHER REPORT FOR THE NYC: 10001\n"} \
/[0-9][0-9]*[a-z|A-Z]+/{print $1"\t\t"$2" "$3"\t\t"$4" "$5"\n"}' 2>> error.txt
สิ่งนี้ไม่ให้ผลลัพธ์