คำถามติดแท็ก httrack

6
ปัญหาในการใช้ wget หรือ httrack เพื่อสะท้อนเว็บไซต์ที่เก็บถาวร
ฉันพยายามใช้ wget เพื่อสร้างมิเรอร์ท้องถิ่นของเว็บไซต์ แต่ฉันพบว่าฉันไม่ได้รับหน้าเชื่อมโยงทั้งหมด นี่คือเว็บไซต์ http://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/ ฉันไม่ต้องการหน้าเว็บทั้งหมดที่เริ่มต้นด้วยแต่ฉันต้องการให้หน้าทั้งหมดที่ขึ้นต้นด้วยweb.archive.orghttp://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/ เมื่อฉันใช้wget -rในโครงสร้างไฟล์ของฉันฉันพบ web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/index.html, แต่ฉันไม่มีไฟล์ทั้งหมดที่เป็นส่วนหนึ่งของฐานข้อมูลนี้เช่น web.archive.org/web/20110808041151/http://cst-www.nrl.navy.mil/lattice/struk/d0c.html. บางที httrack อาจจะทำได้ดีกว่า แต่ตอนนี้มันโลภมากเกินไป ดังนั้นวิธีที่เป็นไปได้ที่จะคว้าสำเนาของเว็บไซต์ที่เก็บถาวรจากInternet Way Way Machine Machine?

1
ฉันจะดาวน์โหลดสคริปต์ที่สร้างภาพจากเว็บไซต์ได้อย่างไร
ฉันกำลังพยายามทำเว็บไซต์ มันเป็นไปตามรูปแบบที่เรียบง่ายของไฟล์. htm แต่มีสิ่งหนึ่งที่จับได้ แต่ละไฟล์มีบรรทัดต่อไปนี้: <img width="100%" src="http://DOMAIN.org/CREATE_IMAGE.php"> ฉันต้องดาวน์โหลดภาพนี้ แต่ httrack และ wget ทั้งคู่ไม่สนใจเอาต์พุตสคริปต์เมื่อทำการดาวน์โหลดไฟล์ สคริปต์ php ไม่ใช้พารามิเตอร์ใด ๆ มันเป็นตัวกำหนดภาพที่จะส่งออกภายใน ไฟล์. htm แต่ละไฟล์จะได้รับเอาต์พุตที่แตกต่างกัน ดังนั้นฉันไม่สามารถเรียกไฟล์ php ได้ จำเป็นต้องดาวน์โหลดเป็นไฟล์ประเภท. htm ที่เกี่ยวข้อง ฉันจะกำหนดค่า wget หรือ httrack หรือเครื่องมืออื่น ๆ เพื่อให้ได้สิ่งที่ฉันต้องการได้อย่างไร

1
มีอะไรดีไปกว่า httrack ในการดาวน์โหลดไฟล์?
ฉันพยายามดาวน์โหลดเอกสาร (pdf, tiff, images) จากหน้าเว็บที่มีจาวาสคริปต์และเฟรมอยู่ ตัวอย่าง: http://127.0.0.1/web/guest/en/websys/webArch/mainFrame.cgi 'httrack --get-files' ไม่ดาวน์โหลดเลยมีวิธีอื่นที่คุณคิดอีกมั้ย โปรแกรมอื่น ฉันจะต้องเขียนโปรแกรมนั้นด้วยตัวเองหรือไม่? ขอบคุณมาก!
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.