ฉันใช้ wget เพื่อดาวน์โหลดไฟล์ html รูปภาพในไฟล์เก็บไว้ที่ไหน


15

Firefox โหลดช้ามากฉันจึงตัดสินใจใช้wgetบันทึกไฟล์ HTML ฉันใช้คำสั่งต่อไปนี้

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

ไฟล์ถูกบันทึกไว้ในโฟลเดอร์บ้านของฉัน แต่ฉันไม่รู้ว่าเก็บรูปภาพไว้ที่ไหนฉันต้องการใช้Ankiมัน

ภาพจะถูกเก็บไว้ที่ไหน?


บทความนี้จะอธิบายถึงตัวเลือกและวิธีการที่มีประโยชน์
วิลฟ์

คำตอบ:


34

ฉันชอบที่จะใช้--page-requisites( -pสั้น ๆ ) แทนที่จะ-rเป็นที่นี่เพราะมันดาวน์โหลดทุกสิ่งที่หน้าเว็บต้องการแสดง แต่ไม่มีหน้าอื่น ๆ และฉันไม่ต้องคิดเกี่ยวกับไฟล์ที่ฉันต้องการ

จริงๆแล้วฉันมักจะใช้สิ่งที่ชอบ

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

หมายความว่า:

  • -E: ต่อท้าย.htmlชื่อไฟล์หากเป็นไฟล์ HTML แต่ไม่สิ้นสุด.htmlหรือคล้ายกัน
  • -H: ดาวน์โหลดไฟล์จากโฮสต์อื่นเช่นกัน
  • -k: หลังจากดาวน์โหลดแปลงลิงค์ใด ๆ ในนั้นพวกเขาชี้ไปที่ไฟล์ที่ดาวน์โหลด
  • -p: ดาวน์โหลดทุกสิ่งที่หน้าต้องการสำหรับการดูออฟไลน์ที่เหมาะสม

ฉันมาที่นี่เพื่อค้นหา-Hและมีความสุขที่ได้เรียนรู้-Eและ-kเช่นกัน ขอบคุณ!
Charles Clayton

2

การใช้พารามิเตอร์ -r ควรเปิดใช้งาน wget เพื่อดาวน์โหลดทั้งโฟลเดอร์รวมถึงรูปภาพของคุณ

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

2

การดาวน์โหลดไฟล์ภาพแยกเช่นกัน

ฉันคิดว่าคำสั่งนี้จะช่วยให้คุณเริ่มต้นได้

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

อนุญาตให้คุณระบุตำแหน่งเพื่อบันทึกรูปภาพและประเภทไฟล์ที่คุณต้องการ อาจจะดาวน์โหลดภาพได้ง่ายกว่านี้

ที่มา :

-r เปิดใช้งานการเรียกซ้ำ ดูดาวน์โหลดแบบเรียกซ้ำสำหรับข้อมูลเพิ่มเติม

-P ตั้งค่าคำนำหน้าไดเรกทอรีที่ไฟล์และไดเรกทอรีทั้งหมดจะถูกบันทึกไว้

-A ตั้งรายการที่อนุญาตสำหรับการดึงไฟล์บางประเภทเท่านั้น ยอมรับเงื่อนไขและรูปแบบและสามารถใช้ทั้งคู่ในรายการที่คั่นด้วยเครื่องหมายจุลภาค (ตามที่เห็นด้านบน) ดูประเภทของไฟล์สำหรับข้อมูลเพิ่มเติม

คัดลอกไฟล์ภาพจากโฟลเดอร์ของคุณ

ฉันสังเกตว่าเว็บไซต์ใช้ไฟล์รูปภาพ PNG คุณสามารถคัดลอกจากโฟลเดอร์ของคุณ ควรเรียกใช้ในโฟลเดอร์ที่คุณจัดเก็บเว็บเพจ

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;

1

เพียงแค่ดาวน์โหลดไฟล์ HTML ของหน้าไม่ใช่รูปภาพในหน้าเนื่องจากรูปภาพในไฟล์ HTML ของหน้าเขียนเป็น URL หากต้องการทำสิ่งที่คุณต้องการให้ใช้-R(ซ้ำ) -Aตัวเลือกที่มีส่วนต่อท้ายของไฟล์รูปภาพ--no-parentตัวเลือกเพื่อไม่ให้ขึ้นและ--levelตัวเลือกที่มี1ตัวเลือกที่มี

เฉพาะ wget -R -A .jpg,.png,.gif --no-parent --level <url>

ยิ่งไปกว่าเบราว์เซอร์ส่วนใหญ่มีวิธีการสำหรับการบันทึกหน้าสำหรับดูแบบออฟไลน์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.