เครื่องมือดาวน์โหลดเว็บไซต์ (แคช) เพื่อดูไซต์ออฟไลน์


9

มีวิธีพกพาในการดาวน์โหลดหรือแคชทุกหน้าของเว็บไซต์เพื่อดูแบบออฟไลน์หรือไม่? ฉันมีเที่ยวบินข้ามประเทศในวันพรุ่งนี้และฉันต้องการแคชหน้าเว็บบางหน้า (โดยเฉพาะหน้าpython doc ( http://docs.python.org/ ) และการอ้างอิง pyqt ( http: // www) riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html )

โดยหลักการแล้วฉันต้องการ Add-on ของ Firefox หรืออะไรทำนองนั้น แต่ทุกอย่างจะใช้ได้ดีตราบใดที่ฉันสามารถรันบน Linux ได้


คำตอบ:


15

ผมใช้HTTrack

ช่วยให้คุณสามารถดาวน์โหลดเว็บไซต์ World Wide จากอินเทอร์เน็ตไปยังไดเรกทอรีท้องถิ่นสร้างไดเรกทอรีทั้งหมดซ้ำรับ HTML, ภาพและไฟล์อื่น ๆ จากเซิร์ฟเวอร์ไปยังคอมพิวเตอร์ของคุณ


ฉันเคยใช้อันนี้ในอดีตโซลูชั่นฟรีดี
MaQleod

1
HTTrack นั้นดีที่สุดสำหรับทั้ง Linux และ Windows และมีรายการตัวเลือกมากมายสำหรับกำหนดค่ากระบวนการดาวน์โหลด .. ฉันชอบมาก ๆ
eslambasha

ฉันก็ใช้มันเช่นกัน ตอนนี้พวกเขาเสนอเวอร์ชั่น Android ด้วย
gparyani

-1 มันไม่ได้สร้าง "ไดเรกทอรีทั้งหมด" มันไม่ได้รับ "รูปภาพและไฟล์อื่น ๆ " .. มันจะได้รับสิ่งที่เชื่อมโยงไปเท่านั้น
barlop

6

ฉันใช้ wget กับตัวเลือกเหล่านี้เพื่อทำมิเรอร์ไซต์สำหรับใช้งานออฟไลน์

wget -cmkE -np http://example.com/a/section/i/like

ที่ไหน

-m เปิดใช้งานตัวเลือกการมิเรอร์สำหรับการทำมิเรอร์ไซต์ภายใน

-c ทำการดาวน์โหลดต่อไปก่อนหน้านี้ในกรณีที่ฉันได้ดาวน์โหลดไปแล้วบางหน้า

-k แปลง href แบบสัมบูรณ์เพื่อชี้ไปที่คนในพื้นที่สำหรับการดูแบบออฟไลน์

- E ช่วยให้มั่นใจว่าไฟล์มีนามสกุล. html หลังจากดาวน์โหลด

-np ดาวน์โหลดเฉพาะวัตถุภายใต้ / a / section / i / และไม่แคชทั้งไซต์

ตัวอย่างเช่นฉันต้องการดาวน์โหลดเอกสารใต้ แต่ไม่ใช่ตั๋วใต้ ฯลฯ ...

wget -cmkE -np http://south.aeracode.org/docs/index.html

ผมใช้ Windows และวิ่ง wget บน Cygwin แต่ยังมีหน้าต่างพื้นเมือง wget พอร์ต

แม้ว่าในกรณีของคุณคุณสามารถดาวน์โหลดเอกสารแบบหลามออฟไลน์ได้จากส่วนเอกสารหลาม


1

ลองhttp://www.downthemall.net/ปลั๊กอิน Firefox ฉันใช้มันเพื่อดาวน์โหลดไฟล์ PDF 250 หน้าใน 20 ไฟล์แยกต่างหาก มันมีพลังมาก มันมีรูปแบบไวด์การ์ด / เคียวรีที่ให้คุณผ่าตัดได้เฉพาะไฟล์ที่คุณต้องการและไม่มีไฟล์ที่ไม่เกี่ยวข้องที่คุณไม่ต้องการ '


1

ส่วนขยายของ Firefox บางอย่างที่ฉันรู้:

  • เรื่องที่สนใจ

    ช่วยให้คุณบันทึกเว็บเพจและจัดการคอลเลกชันได้อย่างง่ายดาย คุณสมบัติที่สำคัญคือความเบาความเร็วความแม่นยำและการรองรับหลายภาษา คุณสมบัติที่สำคัญคือ:

    • บันทึกเว็บเพจ
    • บันทึกตัวอย่างของหน้าเว็บ
    • บันทึกเว็บไซต์
    • จัดระเบียบคอลเล็กชันในลักษณะเดียวกับบุ๊กมาร์ก
    • ค้นหาข้อความแบบเต็มและค้นหาตัวกรองอย่างรวดเร็วของคอลเลกชัน
    • การแก้ไขเว็บเพจที่รวบรวมไว้
    • คุณสมบัติการแก้ไขข้อความ / HTML คล้ายกับหมายเหตุของ Opera
  • ScrapBook Plus

    ความแตกต่างระหว่าง ScrapBook Plus และ ScrapBook:

    • เรียงลำดับเร็วขึ้น
    • การนำเข้าและส่งออกที่เร็วขึ้น
    • เปิดหน้าต่างเพื่อจัดการคอลเลกชันของคุณโดยตรงจากแถบด้านข้าง
    • ทำให้การจัดการ "รวมตัวช่วยสร้าง" ง่ายขึ้น
    • คุณสมบัติใหม่สำหรับ "การจับภาพหลาย ๆ URL" (ตัวกรองเพื่อแยกลิงค์ใช้ชื่อของเว็บไซต์หรือชื่อของลิงค์เป็นชื่อใหม่สำหรับรายการในแถบด้านข้างระบุเวลารอระหว่างการดาวน์โหลดจาก 0 ถึง 3 วินาทีใช้ UTF-8 หรือ ISO-8859-1 เป็นชุดอักขระ)
    • หน้าต่าง "จับภาพ" ใหม่ (ต้องเริ่มการดาวน์โหลดด้วยตนเองปิดการเลื่อนอัตโนมัติ)
    • 6 ปากกาเน้นข้อความในเครื่องมือแก้ไข
  • UnMHT

    ช่วยให้คุณดูไฟล์รูปแบบเก็บถาวรเว็บ MHT (MHTML) และบันทึกหน้าเว็บที่สมบูรณ์รวมถึงข้อความและกราฟิกลงในไฟล์ MHT เดียว

  • พ็อกเก็ต (ไม่ใช่ส่วนขยายคุณลักษณะ Firefox ในตัว)

    ให้คุณบันทึกหน้าเว็บและวิดีโอลงใน Pocket ได้ในคลิกเดียว พ็อกเก็ตจะขจัดความยุ่งเหยิงและบันทึกเพจในมุมมองที่สะอาดไร้สิ่งรบกวนและช่วยให้คุณสามารถเข้าถึงพวกมันได้ในแอพ Pocket

    โปรดทราบว่า:

    การบันทึกและเข้าถึงรายการพ็อกเก็ตของคุณบน Firefox ต้องใช้การเชื่อมต่ออินเทอร์เน็ต การดูแบบออฟไลน์สามารถทำได้ในอุปกรณ์อื่นด้วยแอพ Pocket


0

คุณสามารถดาวน์โหลดทั้งเว็บไซต์หรือบางส่วนของเว็บไซต์ด้วย wget

wget -r http://docs.python.org/

ตรวจสอบคู่มือ wget สำหรับตัวเลือกอื่น ๆ ที่คุณอาจต้องการผ่านเช่นเพื่อ จำกัด การใช้แบนด์วิดท์ของคุณเพื่อควบคุมความลึกของการเรียกซ้ำเพื่อตั้งค่ารายการยกเว้น

อีกวิธีหนึ่งในการเรียกดูออฟไลน์คือการใช้แคชพร็อกซี Wwwoffleเป็นหนึ่งในคุณสมบัติที่มีจำนวนมากเพื่ออำนวยความสะดวกในการเก็บข้อมูลสำหรับการเรียกดูออฟไลน์เช่นการแทนที่วันหมดอายุของเซิร์ฟเวอร์ที่ระบุและความสามารถในการดึงข้อมูลแบบเรียกซ้ำ (ฉันใช้ wwwoffle ตั้งแต่วันผ่านสายโทรศัพท์)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.