ฉันจะแยกลิงก์ภายนอกทั้งหมดของหน้าเว็บและบันทึกลงในไฟล์ได้อย่างไร
หากคุณมีเครื่องมือบรรทัดคำสั่งใด ๆ ที่จะดี
ฉันจะแยกลิงก์ภายนอกทั้งหมดของหน้าเว็บและบันทึกลงในไฟล์ได้อย่างไร
หากคุณมีเครื่องมือบรรทัดคำสั่งใด ๆ ที่จะดี
คำตอบ:
คุณจะต้องใช้ 2 เครื่องมือlynxและawkลองสิ่งนี้:
$ lynx -dump http://www.google.com.br | awk '/http/{print $2}' > links.txt
หากคุณต้องการหมายเลขบรรทัดใช้ command nlลองทำดังนี้:
$ lynx -dump http://www.google.com.br | awk '/http/{print $2}' | nl > links.txt
นี่คือการปรับปรุงคำตอบของ lelton: คุณไม่ต้องการ awk เลยเพราะ lynx มีตัวเลือกที่มีประโยชน์
lynx -listonly -nonumbers -dump http://www.google.com.br
ถ้าคุณต้องการตัวเลข
lynx -listonly -dump http://www.google.com.br
ฉันอยากจะแนะนำ Beautiful Soup ผ่านเทคนิคการคัดแยกหน้าจอ
หากบรรทัดคำสั่งไม่ใช่แรงคุณสามารถใช้ส่วนขยายCopy All Links Firefox