ฉันต้องการรวบรวมข้อมูลลิงก์ภายใต้ www.website.com/XYZ และดาวน์โหลดเฉพาะลิงค์ที่อยู่ภายใต้ www.website.com/ABC
ฉันใช้คำสั่ง wget ต่อไปนี้เพื่อรับไฟล์ที่ฉันต้องการ:
wget -I ABC -r -e robots=off --wait 0.25 http://www.website.com/XYZ
มันทำงานได้อย่างสมบูรณ์แบบเมื่อฉันใช้ wget 1.13.4 แต่ปัญหาคือฉันต้องใช้คำสั่งนี้บนเซิร์ฟเวอร์ที่มี wget 1.11 และเมื่อฉันใช้คำสั่งเดียวกันมันจะสิ้นสุดการดาวน์โหลดโดเมนเพิ่มเติมเช่น:
www.website.de
www.website.it
...
ฉันจะหลีกเลี่ยงปัญหานี้ได้อย่างไร ฉันพยายามใช้
--exclude domains=www.website.de,www.website.it
อย่างไรก็ตามมันยังคงดาวน์โหลดโดเมนเหล่านั้น
นอกจากนี้โปรดทราบว่าฉันไม่สามารถใช้งานได้--no-parent
เนื่องจากไฟล์ที่ฉันต้องการอยู่ในระดับสูงกว่า (ฉันต้องการไฟล์ภายใต้ website.com/ABC โดยรวบรวมข้อมูลลิงก์ภายใต้ website.com/XYZ)
คำใบ้ใด ๆ
wget
ไม่ควรข้ามโฮสต์โดยค่าเริ่มต้นและคุณต้องการ-H
/ --span-hosts
ตัวเลือกเพื่อข้ามโฮสต์เมื่อทำการเรียกซ้ำ "www.website.com" เป็นโฮสต์ที่แตกต่างจาก "www.website.de" โดยสิ้นเชิง
-H
จำเป็นต้องเรียกคืนนอกโฮสต์เดิมเสมอ ไม่-D www.website.com
ช่วยเหลือ?