ฉันต้องการดาวน์โหลดเว็บไซต์ทั้งหมด (พร้อมไซต์ย่อย) มีเครื่องมืออะไรบ้าง?
--convert-links
ใน wget) จะไม่เปิดเผยไซต์ที่เปิดเผยโดยการส่งแบบฟอร์มและอื่น ๆ เท่านั้น
ฉันต้องการดาวน์โหลดเว็บไซต์ทั้งหมด (พร้อมไซต์ย่อย) มีเครื่องมืออะไรบ้าง?
--convert-links
ใน wget) จะไม่เปิดเผยไซต์ที่เปิดเผยโดยการส่งแบบฟอร์มและอื่น ๆ เท่านั้น
คำตอบ:
ลองตัวอย่างที่ 10 จากที่นี่ :
wget --mirror -p --convert-links -P ./LOCAL-DIR WEBSITE-URL
–mirror
: เปิดตัวเลือกที่เหมาะสมสำหรับการมิเรอร์
-p
: ดาวน์โหลดไฟล์ทั้งหมดที่จำเป็นในการแสดงหน้า HTML ที่ถูกต้อง
--convert-links
: หลังจากดาวน์โหลดแล้วให้แปลงลิงค์ในเอกสารเพื่อการดูในเครื่อง
-P ./LOCAL-DIR
: บันทึกไฟล์และไดเรกทอรีทั้งหมดไปยังไดเรกทอรีที่ระบุ--wait=seconds
โต้เถียงหากคุณต้องการเป็นมิตรกับเว็บไซต์มากกว่า; มันจะรอจำนวนวินาทีที่ระบุระหว่างการดึงข้อมูล
เมื่อwget
คุณสามารถดาวน์โหลดทั้งเว็บไซต์ได้คุณควรใช้-r
สวิตช์เพื่อดาวน์โหลดแบบเรียกซ้ำ ตัวอย่างเช่น,
wget -r http://www.google.com
WEBHTTRACK เว็บไซต์เครื่องถ่ายเอกสารเป็นเครื่องมือที่มีประโยชน์ในการดาวน์โหลดเว็บไซต์ทั้งหมดบนฮาร์ดดิสก์ของคุณสำหรับการเรียกดูออฟไลน์ เปิดศูนย์ซอฟต์แวร์อูบุนตูและพิมพ์ "webhttrack website copier" โดยไม่ต้องใส่เครื่องหมายคำพูดลงในช่องค้นหา เลือกและดาวน์โหลดจากศูนย์ซอฟต์แวร์ลงในระบบของคุณ เริ่ม webHTTrack จาก laucher หรือเมนูเริ่มจากตรงนั้นคุณสามารถเริ่มเพลิดเพลินกับเครื่องมือที่ยอดเยี่ยมนี้สำหรับการดาวน์โหลดไซต์ของคุณ
ฉันไม่รู้เกี่ยวกับโดเมนย่อยเช่นไซต์ย่อย แต่สามารถใช้ wget เพื่อคว้าไซต์ที่สมบูรณ์ได้ ลองดูที่คำถามยอดนิยมนี้ มันบอกว่าคุณสามารถใช้-D domain1.com,domain2.com
เพื่อดาวน์โหลดโดเมนที่แตกต่างกันในสคริปต์เดียว ฉันคิดว่าคุณสามารถใช้ตัวเลือกนั้นเพื่อดาวน์โหลดโดเมนย่อยเช่น-D site1.somesite.com,site2.somesite.com
ฉันใช้Burp - เครื่องมือสไปเดอร์นั้นฉลาดกว่า wget มากและสามารถกำหนดค่าให้หลีกเลี่ยงส่วนต่างๆได้หากจำเป็น Burp Suite เป็นชุดเครื่องมือที่ทรงพลังเพื่อช่วยในการทดสอบ แต่เครื่องมือ Spider นั้นมีประสิทธิภาพมาก
คุณสามารถดาวน์โหลดคำสั่งเว็บไซต์ทั้งหมด:
wget -r -l 0 website
ตัวอย่าง:
wget -r -l 0 http://google.com
หากความเร็วเป็นสิ่งที่น่ากังวล (และคุณภาพชีวิตของเซิร์ฟเวอร์ไม่ดี) คุณสามารถลองใช้pufซึ่งใช้งานได้เหมือนwgetแต่สามารถดาวน์โหลดหลายหน้าพร้อมกัน อย่างไรก็ตามไม่ใช่ผลิตภัณฑ์สำเร็จรูปไม่ได้รับการบำรุงรักษาและไม่มีเอกสารที่น่ากลัว ยังคงสำหรับการดาวน์โหลดเว็บไซต์ที่มีไฟล์ขนาดเล็กจำนวนมากและนี่อาจเป็นตัวเลือกที่ดี