ฉันพยายามดาวน์โหลดสองเว็บไซต์เพื่อรวมไว้ในซีดี:
http://boinc.berkeley.edu/trac/wiki
http://www.boinc-wiki.info
ปัญหาที่ฉันมีอยู่ก็คือพวกมันเป็นวิกิ ดังนั้นเมื่อดาวน์โหลดด้วยเช่น:
wget -r -k -np -nv -R jpg,jpeg,gif,png,tif http://www.boinc-wiki.info/
ฉันได้รับไฟล์จำนวนมากเพราะมันติดตามลิงค์เช่น ... ? action = edit ... ? action = diff & version = ...
มีใครรู้วิธีที่จะหลีกเลี่ยงปัญหานี้หรือไม่?
ฉันต้องการหน้าปัจจุบันโดยไม่มีภาพและไม่มีความต่างเป็นต้น
PS:
wget -r -k -np -nv -l 1 -R jpg,jpeg,png,gif,tif,pdf,ppt http://boinc.berkeley.edu/trac/wiki/TitleIndex
สิ่งนี้ใช้ได้กับ berkeley แต่ boinc-wiki.info ยังคงทำให้ฉันมีปัญหา: /
PPS:
ฉันได้รับสิ่งที่ดูเหมือนจะเป็นหน้าที่เกี่ยวข้องมากที่สุดด้วย:
wget -r -k -nv -l 2 -R jpg,jpeg,png,gif,tif,pdf,ppt http://www.boinc-wiki.info