วิธีแก้ไขส่วนหัว 'ที่แก้ไขล่าสุด' หายไปอย่างไร


13

ฉันทำงานwgetแบบนี้:

wget --mirror --adjust-extension --convert-links --no-cookies http://tshepang.net -o log-main

ฉันได้รับข้อความเหล่านี้:

Last-modified header missing -- time-stamps turned off.

ฉันคิดว่านั่นหมายความว่าหน้าเว็บจะได้รับการดาวน์โหลดซ้ำแม้ว่าฉันจะมีอยู่ในเครื่องก็ตาม

หมายเหตุ : ฉันต้องการสิ่งนี้เพื่อที่ฉันจะได้ไม่ต้องดาวน์โหลดไฟล์ที่มีอยู่ทุกครั้งที่ฉันเรียกใช้มิเรอร์คำสั่ง


คุณเป็นเจ้าของหน้า (ถ้าเป็น tshepang.net จริงๆ) ถ้าเป็นเช่นนั้นเว็บเซิร์ฟเวอร์ apache และคุณมีการควบคุมการกำหนดค่าของมันหรือไม่? หรืออย่างน้อยเปิดใช้งาน. htaccess พร้อมตัวเลือกแทนที่ได้หรือไม่
forcefsck

@forcefsck: ไม่เว็บไซต์นี้ถูกดูแลโดย Posterous พวกเขามี API สำหรับอ่านโพสต์ทั้งหมด แต่เป็นช่วงการเรียนรู้สำหรับฉันเทคโนโลยีเว็บเหล่านี้
tshepang

คำตอบ:


10

คุณลองเพิ่ม-cพารามิเตอร์หรือไม่

ข้อความที่ตัดตอนมาจากคู่มือ wget:

-c - ยุติ

เริ่มต้นด้วย Wget 1.7 หากคุณใช้ -c กับไฟล์ที่ไม่ว่างเปล่าและปรากฎว่าเซิร์ฟเวอร์ไม่รองรับการดาวน์โหลดอย่างต่อเนื่อง Wget จะปฏิเสธที่จะเริ่มดาวน์โหลดตั้งแต่เริ่มต้นซึ่งจะทำลายเนื้อหาที่มีอยู่อย่างมีประสิทธิภาพ หากคุณต้องการให้การดาวน์โหลดเริ่มต้นจากศูนย์ให้ลบไฟล์

นอกจากนี้เริ่มต้นด้วย Wget 1.7 หากคุณใช้ -c กับไฟล์ที่มีขนาดเท่ากันบนเซิร์ฟเวอร์ Wget จะปฏิเสธที่จะดาวน์โหลดไฟล์และพิมพ์ข้อความอธิบาย สิ่งเดียวกันจะเกิดขึ้นเมื่อไฟล์มีขนาดเล็กบนเซิร์ฟเวอร์มากกว่าในเครื่อง (อาจเนื่องมาจากมีการเปลี่ยนแปลงบนเซิร์ฟเวอร์นับตั้งแต่ที่คุณพยายามดาวน์โหลดครั้งล่าสุด) --- เนื่องจาก '' ดำเนินการต่อ '' ไม่มีความหมายไม่มีการดาวน์โหลดเกิดขึ้น

ในอีกด้านหนึ่งของเหรียญขณะใช้ -c ไฟล์ใด ๆ ที่ใหญ่กว่าบนเซิร์ฟเวอร์ที่อยู่ในตัวเครื่องจะถือว่าเป็นการดาวน์โหลดที่ไม่สมบูรณ์และจะต้องดาวน์โหลดไบต์ "(ความยาว (ระยะไกล) - ความยาว (ภายใน)) เท่านั้น" (ความยาว จุดสิ้นสุดของไฟล์โลคัล พฤติกรรมนี้อาจเป็นที่ต้องการในบางกรณีตัวอย่างเช่นคุณสามารถใช้ wget -c เพื่อดาวน์โหลดเฉพาะส่วนใหม่ที่ผนวกเข้ากับการรวบรวมข้อมูลหรือไฟล์บันทึก

สำหรับความรู้ของฉันก็ควรข้ามไฟล์ที่ดาวน์โหลดมาแล้วและมีขนาดเท่ากัน


ถ้าไฟล์มีขนาดเล็กจะเป็นอย่างไร?
CJ7
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.