คำถามติดแท็ก webarchive

6
ปัญหาในการใช้ wget หรือ httrack เพื่อสะท้อนเว็บไซต์ที่เก็บถาวร
ฉันพยายามใช้ wget เพื่อสร้างมิเรอร์ท้องถิ่นของเว็บไซต์ แต่ฉันพบว่าฉันไม่ได้รับหน้าเชื่อมโยงทั้งหมด นี่คือเว็บไซต์ http://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/ ฉันไม่ต้องการหน้าเว็บทั้งหมดที่เริ่มต้นด้วยแต่ฉันต้องการให้หน้าทั้งหมดที่ขึ้นต้นด้วยweb.archive.orghttp://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/ เมื่อฉันใช้wget -rในโครงสร้างไฟล์ของฉันฉันพบ web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/index.html, แต่ฉันไม่มีไฟล์ทั้งหมดที่เป็นส่วนหนึ่งของฐานข้อมูลนี้เช่น web.archive.org/web/20110808041151/http://cst-www.nrl.navy.mil/lattice/struk/d0c.html. บางที httrack อาจจะทำได้ดีกว่า แต่ตอนนี้มันโลภมากเกินไป ดังนั้นวิธีที่เป็นไปได้ที่จะคว้าสำเนาของเว็บไซต์ที่เก็บถาวรจากInternet Way Way Machine Machine?

1
วิธีที่ดีที่สุดในการเก็บถาวรเว็บไซต์เป็นระยะ
ฉันกำลังดำเนินการเพื่อจัดเก็บเว็บไซต์ของเรา (สร้างขึ้นแบบไดนามิก) เป็นระยะ ๆ (พูดทุกเดือน) และทำให้เป็นเวอร์ชันเพื่อให้ฉันสามารถย้อนกลับและดึงหน้าเว็บในช่วงเวลาหนึ่ง วิธีการเริ่มต้นของฉันคือการรวบรวมข้อมูลเว็บไซต์ซ้ำและส่งมอบให้กับพื้นที่เก็บข้อมูลการโค่นล้มเพื่อให้ฉันสามารถใช้คุณสมบัติการโค่นล้มประวัติและการส่งออก มีวิธีแก้ไขปัญหาอื่นที่ดีที่สุดที่ใช้พื้นที่น้อยที่สุดเท่าที่จะทำได้หรือไม่? นอกจากนี้ฉันไม่แน่ใจว่าการโค่นล้มของไซต์ทั้งหมดจะใช้เวลานานเท่าใดจึงต้องการโซลูชันที่รวดเร็วยิ่งขึ้น
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.