ฉันจะดาวน์โหลดหน้าทั้งหมดจากเว็บไซต์ได้อย่างไร
แพลตฟอร์มใดก็ได้
ฉันจะดาวน์โหลดหน้าทั้งหมดจากเว็บไซต์ได้อย่างไร
แพลตฟอร์มใดก็ได้
คำตอบ:
HTTRACK ใช้งานได้อย่างยอดเยี่ยมสำหรับการคัดลอกเนื้อหาของเว็บไซต์ทั้งหมด เครื่องมือนี้สามารถจับชิ้นส่วนที่จำเป็นในการสร้างเว็บไซต์ที่มีเนื้อหารหัสที่ใช้งานทำงานแบบออฟไลน์ ฉันประหลาดใจกับสิ่งที่สามารถจำลองแบบออฟไลน์ได้
โปรแกรมนี้จะทำทุกอย่างที่คุณต้องการ
การล่าสัตว์ที่มีความสุข!
Wgetเป็นเครื่องมือบรรทัดคำสั่งแบบคลาสสิกสำหรับงานประเภทนี้ มันมาพร้อมกับระบบ Unix / Linux ส่วนใหญ่และคุณสามารถใช้กับ Windows ได้เช่นกัน สำหรับ Mac นั้นHomebrewเป็นวิธีที่ง่ายที่สุดในการติดตั้ง ( brew install wget
)
คุณต้องการทำสิ่งที่ชอบ:
wget -r --no-parent http://site.com/songs/
สำหรับรายละเอียดเพิ่มเติมดูคู่มือ Wgetและตัวอย่างหรือตัวอย่างเหล่านี้:
ใช้ wget:
wget -m -p -E -k www.example.com
ตัวเลือกที่อธิบาย:
-m, --mirror Turns on recursion and time-stamping, sets infinite
recursion depth, and keeps FTP directory listings.
-p, --page-requisites Get all images, etc. needed to display HTML page.
-E, --adjust-extension Save HTML/CSS files with .html/.css extensions.
-k, --convert-links Make links in downloaded HTML point to local files.
--mirror
อธิบายตนเองได้มากนี่มาจาก man page: " ตัวเลือกนี้เปิดการเรียกซ้ำและการลงเวลาตั้งค่าความลึกการวนซ้ำแบบไม่สิ้นสุดและเก็บรายชื่อไดเรกทอรี FTP ปัจจุบันเทียบเท่ากับ -r -N - l inf - no-remove-listing ")
wget --mirror -p --html-extension --convert-links www.example.com
และมันเพิ่งดาวน์โหลดดัชนี ฉันคิดว่าคุณจำเป็นต้อง-r
ดาวน์โหลดเว็บไซต์ทั้งหมด
-w seconds
(เพื่อรอจำนวนวินาทีในระหว่างคำขอหรือ--limit-rate=amount
เพื่อระบุแบนด์วิดท์สูงสุดที่จะใช้ขณะดาวน์โหลด
Internet Download Managerมียูทิลิตี Grabber ไซต์พร้อมตัวเลือกมากมาย - ให้คุณดาวน์โหลดเว็บไซต์ใด ๆ ที่คุณต้องการตามที่คุณต้องการ
คุณสามารถกำหนดขีด จำกัด ตามขนาดของหน้า / ไฟล์ที่จะดาวน์โหลด
คุณสามารถกำหนดจำนวนสาขาของเว็บไซต์ที่จะเยี่ยมชม
คุณสามารถเปลี่ยนวิธีการทำงานของสคริปต์ / ป๊อปอัป / การทำซ้ำ
คุณสามารถระบุโดเมนได้เฉพาะภายใต้โดเมนหน้า / ไฟล์ทั้งหมดที่ตรงกับการตั้งค่าที่ต้องการจะถูกดาวน์โหลด
ลิงก์สามารถแปลงเป็นลิงก์ออฟไลน์เพื่อเรียกดูได้
คุณมีเทมเพลตที่ให้คุณเลือกการตั้งค่าด้านบนได้
อย่างไรก็ตามซอฟต์แวร์นี้ไม่ฟรี - ดูว่าเหมาะสมกับความต้องการของคุณหรือไม่ใช้เวอร์ชันทดลองใช้
itsucks - นั่นคือชื่อของโปรแกรม!
ฉันจะระบุบัฟเฟอร์ออนไลน์ที่เบราว์เซอร์ใช้ ...
โดยทั่วไปแล้วเบราว์เซอร์ส่วนใหญ่ใช้แคชการค้นหาเพื่อเก็บไฟล์ที่คุณดาวน์โหลดจากเว็บไซต์ไว้สักระยะหนึ่งเพื่อให้คุณไม่ต้องดาวน์โหลดรูปภาพและเนื้อหาแบบคงที่ซ้ำแล้วซ้ำอีก สิ่งนี้สามารถเร่งความเร็วของสิ่งต่าง ๆ ได้ค่อนข้างน้อยในบางสถานการณ์ โดยทั่วไปแคชของเบราว์เซอร์ส่วนใหญ่จะ จำกัด ขนาดที่แน่นอนและเมื่อถึงขีด จำกัด ดังกล่าวแคชนั้นจะลบไฟล์ที่เก่าที่สุดในแคช
ผู้ให้บริการอินเทอร์เน็ตมักจะมีเซิร์ฟเวอร์แคชที่เก็บสำเนาของเว็บไซต์ที่เข้าถึงได้ทั่วไปเช่น ESPN และ CNN วิธีนี้ช่วยให้พวกเขาไม่ต้องกดปุ่มเว็บไซต์เหล่านี้ทุกครั้งที่มีคนในเครือข่ายไปถึงที่นั่น สิ่งนี้สามารถช่วยประหยัดเงินได้อย่างมากในจำนวนคำขอซ้ำซ้อนไปยังไซต์ภายนอกไปยัง ISP
ผมชอบออฟไลน์ Explorer ที่
มันเป็นแชร์แวร์ แต่มันดีและใช้งานง่าย
WebZipเป็นผลิตภัณฑ์ที่ดีเช่นกัน
มันเป็นเบราว์เซอร์ออฟไลน์ฟรีที่ทรงพลัง โปรแกรมดาวน์โหลดและดูเว็บไซต์แบบหลายเธรดความเร็วสูง ด้วยการส่งคำขอเซิร์ฟเวอร์หลาย ๆ ตัวพร้อมกัน BackStreet Browser สามารถดาวน์โหลดเว็บไซต์ทั้งหมดหรือบางส่วนของเว็บไซต์อย่างรวดเร็วเช่น HTML, กราฟิก, Java Applets, เสียงและไฟล์อื่น ๆ ที่ผู้ใช้กำหนดได้และบันทึกไฟล์ทั้งหมดในฮาร์ดไดรฟ์ของคุณ หรือเป็นไฟล์บีบอัดและดูแบบออฟไลน์
Teleport Proเป็นโซลูชันฟรีอีกตัวที่จะคัดลอกไฟล์ใด ๆ และทั้งหมดจากสิ่งที่คุณกำหนดเป้าหมาย (ยังมีเวอร์ชันที่ต้องชำระเงินซึ่งจะช่วยให้คุณดึงหน้าเนื้อหาได้มากขึ้น)
DownThemAllเป็นส่วนเสริมของ Firefox ที่จะดาวน์โหลดเนื้อหาทั้งหมด (ไฟล์เสียงหรือวิดีโอเป็นต้น) สำหรับหน้าเว็บหนึ่ง ๆ ในคลิกเดียว นี่ไม่ได้ดาวน์โหลดทั้งไซต์ แต่อาจเป็นสิ่งที่คำถามกำลังมองหาอยู่
สำหรับ Linux และ OS X: ฉันเขียนgrab-siteเพื่อเก็บถาวรทั้งเว็บไซต์ไปยังไฟล์WARC ไฟล์ WARC เหล่านี้สามารถเรียกดูหรือแตกไฟล์ได้ grab-site ให้คุณควบคุม URL ที่จะข้ามโดยใช้นิพจน์ทั่วไปและสิ่งเหล่านี้สามารถเปลี่ยนแปลงได้เมื่อการรวบรวมข้อมูลกำลังทำงาน นอกจากนี้ยังมาพร้อมกับชุดค่าเริ่มต้นมากมายสำหรับละเว้น URL ขยะ
มีเว็บแดชบอร์ดสำหรับตรวจสอบการรวบรวมข้อมูลรวมถึงตัวเลือกเพิ่มเติมสำหรับการข้ามเนื้อหาวิดีโอหรือการตอบกลับในขนาดที่กำหนด
ในขณะที่ wget ได้กล่าวถึงทรัพยากรนี้แล้วและบรรทัดคำสั่งนั้นราบรื่นมากฉันคิดว่ามันสมควรได้รับการกล่าวถึง:
wget -P /path/to/destination/directory/ -mpck --user-agent="" -e robots=off --wait 1 -E https://www.example.com/
FreeDownloadManager.org ที่เคารพมีคุณสมบัตินี้เช่นกัน
ตัวจัดการดาวน์โหลดฟรีมีสองรูปแบบในสองรูปแบบ: Site Explorer และ Site Spider :
Site Explorer
Site Explorer ช่วยให้คุณดูโครงสร้างโฟลเดอร์ของเว็บไซต์และดาวน์โหลดไฟล์หรือโฟลเดอร์ที่จำเป็น
HTML Spider
คุณสามารถดาวน์โหลดเว็บเพจทั้งหมดหรือแม้แต่เว็บไซต์ทั้งหมดด้วย HTML Spider เครื่องมือสามารถปรับให้ดาวน์โหลดไฟล์ที่มีนามสกุลเฉพาะเท่านั้น
ฉันพบว่า Site Explorer มีประโยชน์ในการดูว่าโฟลเดอร์ใดที่จะรวม / ไม่รวมก่อนที่คุณจะพยายามดาวน์โหลดทั้งเว็บไซต์โดยเฉพาะเมื่อมีฟอรัมทั้งหมดซ่อนอยู่ในไซต์ที่คุณไม่ต้องการดาวน์โหลดตัวอย่าง
ดาวน์โหลด HTTracker มันจะดาวน์โหลดเว็บไซต์ตามขั้นตอนง่าย ๆ ดังนี้
ลิงค์ดาวน์โหลด: http://www.httrack.com/page/2/
วิดีโอที่สามารถช่วยคุณได้: https://www.youtube.com/watch?v=7IHIGf6lcL4
ฉันเชื่อว่า google chrome สามารถทำได้บนอุปกรณ์เดสก์ท็อปเพียงไปที่เมนูเบราว์เซอร์และคลิกบันทึกหน้าเว็บ
นอกจากนี้โปรดทราบว่าบริการเช่นกระเป๋าอาจไม่ได้บันทึกเว็บไซต์จริง ๆ และมีความเสี่ยงที่จะเชื่อมโยงเน่า
สุดท้ายโปรดทราบว่าการคัดลอกเนื้อหาของเว็บไซต์อาจเป็นการละเมิดลิขสิทธิ์หากมีการใช้งาน