หากต้องการบันทึกหน้าเดียวผ่านเครื่อง Waybackฉันสามารถไปที่:
ฉันจะเก็บถาวรเว็บไซต์ซ้ำด้วยเครื่อง Wayback ได้อย่างไร
มีบางโครงการเช่นwayback-machine-downloader
แต่ฉันกำลังมองหาคุณสมบัติที่ช่วยให้ฉันอัปโหลดเว็บไซต์ซ้ำ
หากต้องการบันทึกหน้าเดียวผ่านเครื่อง Waybackฉันสามารถไปที่:
ฉันจะเก็บถาวรเว็บไซต์ซ้ำด้วยเครื่อง Wayback ได้อย่างไร
มีบางโครงการเช่นwayback-machine-downloader
แต่ฉันกำลังมองหาคุณสมบัติที่ช่วยให้ฉันอัปโหลดเว็บไซต์ซ้ำ
คำตอบ:
เนื่องจากWayback Machineไม่มีคุณสมบัติดังกล่าวฉันจึงพบวิธีแก้ปัญหาบางอย่าง
ขั้นแรกให้สะท้อนถึงเว็บไซต์ที่ใช้wget
เช่น
wget -m https://example.com/
จากนั้นใช้curl
เพื่อเก็บถาวรทุกหน้าทีละอย่างที่คุณดาวน์โหลด
find . -name "*.html" -exec curl -v "https://web.archive.org/save/https://{}" ';'
หมายเหตุ: คุณสามารถเปลี่ยน.html
ไป.php
หรือรวมบางประเภทของไฟล์
-name "*.html"
เพื่อ-type f
ที่จะรวมไฟล์ทั้งหมด
หากคุณต้องการเก็บเว็บไซต์ขนาดเล็กที่ทีม ArchiveรักษาArchiveBot , บอท IRC ที่คุณสามารถขอไปยังเว็บไซต์ที่รวบรวมข้อมูล ทีมเก็บถาวรจะส่งหน้าที่รวบรวมข้อมูลไปยังเครื่อง Wayback ของ Internet Archive
เครื่อง Wayback ไม่ได้เสนอวิธีการส่งทั้งเว็บไซต์เพียงหน้าเดียวเท่านั้นที่คุณได้พบแล้ว นี่คือสิ่งที่สัมผัสในจุดสองสามของเครื่อง Wayback ของพวกเขาคำถามที่พบบ่อย :
ฉันสามารถเพิ่มหน้าไปยังเครื่อง Wayback ได้หรือไม่?
ในhttps://archive.org/webคุณสามารถใช้คุณสมบัติ "บันทึกหน้าได้ทันที" เพื่อบันทึกหน้าเฉพาะหนึ่งครั้ง สิ่งนี้ไม่ได้เพิ่ม URL ให้กับการรวบรวมข้อมูลในอนาคตและจะไม่บันทึกมากกว่าหนึ่งหน้า มันไม่ได้บันทึกหน้าหลายไดเรกทอรีหรือเว็บไซต์ทั้งหมด
และ
ฉันจะทำให้เว็บไซต์ของฉันรวมอยู่ในเครื่อง Wayback ได้อย่างไร
ข้อมูลเว็บที่เก็บถาวรของเราส่วนใหญ่มาจากการรวบรวมข้อมูลของเราเองหรือจากการรวบรวมข้อมูลของ Alexa Internet ทั้งสององค์กรไม่มี "รวบรวมข้อมูลเว็บไซต์ของฉันตอนนี้!" ขั้นตอนการส่ง การรวบรวมข้อมูลของ Internet Archive มีแนวโน้มที่จะค้นหาเว็บไซต์ที่เชื่อมโยงจากเว็บไซต์อื่นเป็นอย่างดี วิธีที่ดีที่สุดเพื่อให้แน่ใจว่าเราพบเว็บไซต์ของคุณคือตรวจสอบให้แน่ใจว่ามันรวมอยู่ในไดเรกทอรีออนไลน์และลิงค์ที่คล้ายกัน / เว็บไซต์ที่เกี่ยวข้องกับคุณ
นี้บทความใน archive.org ยังแสดงให้เห็นเป็นบริการชำระเงินซึ่งจะทำการรวบรวมข้อมูลสำหรับคุณได้บ่อยเท่าที่คุณต้องการ:
- ลงทะเบียนสำหรับบัญชี Archive-It
เก็บถาวร -เป็นบริการสมัครสมาชิกที่จัดทำโดย Internet Archive ที่ให้คุณเรียกใช้โครงการรวบรวมข้อมูลของคุณเองโดยไม่มีความเชี่ยวชาญด้านเทคนิคใด ๆ บอกเราว่าจะรวบรวมข้อมูลและความถี่ในการรวบรวมข้อมูลและเราดำเนินการรวบรวมข้อมูลและวางผลลัพธ์ในเครื่อง Wayback
นี่อาจไม่ใช่สิ่งที่คุณต้องการ แต่สำหรับบางธุรกิจบริการนี้อาจมีประโยชน์ ฉันคิดว่ามันจะช่วยให้กองทุน archive.org ซึ่งฟรี