วิธีการสำรองข้อมูลบล็อกทำงานบน posterous.com


4

ฉันต้องการสำรองเนื้อหาของบล็อกซึ่งขับเคลื่อนโดย posterous.com ฉันต้องการบันทึกข้อความและรูปภาพทั้งหมดลงในดิสก์ภายในเครื่อง ความสามารถในการเรียกดูแบบออฟไลน์นั้นเป็นข้อดี

สิ่งที่ฉันได้ลองไปแล้ว:

wget

wget -mk http://myblogurl

มันจะดาวน์โหลดหน้าแรกที่มีรายการโพสต์จากนั้นหยุดด้วย20 redirections exceededข้อความ ""

WinHttpTrack

มันดาวน์โหลดหน้าแรกด้วยการเปลี่ยนเส้นทางไปที่หน้าแรกwww.posterous.comแทนเนื้อหาของหน้าจริง

แก้ไข: URL ของเว็บไซต์ที่ฉันพยายามสำรองคือblog.safabyte.net


ฉันลองใช้ผู้ใช้แบบสุ่มบนโปสเตอร์และมันทำงานได้โดยไม่มีปัญหา วิธีการเกี่ยวกับการให้ URL เว็บไซต์จริงกับเรา
กอริลลา

เพิ่มลิงก์แล้ว ดูด้านล่างของคำถาม
Martin Vobr

เพิ่งลองมารับเนื้อหาในบล็อกทั้งหมดของคุณ
Sathyajith Bhat

คุณสามารถโพสต์บรรทัดคำสั่งได้หรือไม่ ในกรณีของฉัน 'wget -mk blog.safabyte.com ' รับ index.html เท่านั้น ไม่มีการดาวน์โหลดรูปภาพ ไม่มีการดาวน์โหลดหน้าเว็บที่มีโพสต์ ฉันใช้ wget 1.11.3 จาก cygwin ที่ทำงานบน WinXP
Martin Vobr

@Martin Vobr: wget -mk http://blog.safabyte.netGNU Wget 1.11.1 ใน openSUSE 11.0
Sathyajith Bhat

คำตอบ:


1

Posterous.com ดูแล API ที่อาจช่วยคุณได้ โดยเฉพาะอย่างยิ่งhttp://posterous.com/api/reading API อาจใช้งานได้ คุณสามารถใช้เพื่อรับไฟล์ XML ที่มีโพสต์และเนื้อหาทั้งหมดของคุณ

ตัวอย่างเช่นhttp://posterous.com/api/readposts?hostname=jasonpearce จะดึงข้อมูลการโพสต์ทั้งหมด 12 โพสต์ที่ฉันทำไว้กับ Posterous


1

สิ่งนี้ใช้ได้กับฉัน:

wget -r -l inf -k -E -p -nc http://blog.safabyte.net/

ดูเหมือนว่าจะใช้การ-mเปิด-N(การประทับเวลา) และผู้โพสต์ไม่ได้ส่งส่วนหัวที่แก้ไขล่าสุดซึ่งทำให้เสียอารมณ์ดังนั้นฉันเพิ่งใช้-r -l infโดยตรง

ตัวเลือกที่ใช้คือ:

-rไฟล์ html ที่มี
-l infความลึกไม่ จำกัดแบบเรียกซ้ำแบบเรียกซ้ำ
-kด้วย. html
-Eอัพเดตไฟล์ที่บันทึกพร้อมลิงก์ไปยังไฟล์โลคัล
-pหน้าดาวน์โหลดทรัพยากร
-ncไม่ต้องดาวน์โหลดURL ซ้ำมากกว่าหนึ่งครั้ง

คำสั่งนี้ยังคงไม่ดาวน์โหลดทรัพยากรจากโดเมนอื่นซึ่งหมายความว่าคำสั่งจะไม่ดึงรูปภาพขณะที่โฮสต์ใน CDN อื่น


0

จัดการเพื่อดาวน์โหลดเนื้อหา HTML อย่างน้อยที่สุด รหัสต่อไปนี้ดูเหมือนว่าจะดาวน์โหลดทุกหน้าจากบล็อก (โดยใช้ Wget 1.11.3 บน Windows XP):

wget -mk http://blog.safabyte.net/*

รูปภาพของโพสต์ยังไม่ถูกดาวน์โหลด ดูเหมือนว่าอาจเป็นเพราะพวกเขาถูกเก็บไว้ในโดเมนที่ต่างกัน

เนื้อหา Html อยู่ที่ blog.safabyte.com/* ขณะที่รูปภาพอยู่ในhttp://posterous.com/getfile/files.posterous.com/cheated-by-safabyte/ * และ files.posterous.com

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.