วิธีการถ่ายโอนมีเดียวิกิเพื่อใช้งานออฟไลน์


16

ฉันต้องการสร้างไซต์ MediaWiki รุ่นออฟไลน์เป็นรายสัปดาห์

DumpHTMLนามสกุลจริงไม่สิ่งที่ฉันต้องการเป็นมันทิ้งบทความทั้งหมดและไฟล์สื่อ แต่ฉันไม่สามารถดูดัชนีของบทความทั้งหมดที่ได้ทิ้งใด ๆ ดังนั้นฉันไม่สามารถนำทางในการถ่ายโอนข้อมูล

เมื่ออ่านเกี่ยวกับคุณสมบัติการถ่ายโอนข้อมูล XML MediaWiki มีฉันสงสัยว่ามันจะเป็นไปได้หรือไม่ที่จะใช้โปรแกรมเพื่อดูไฟล์เหล่านี้หรืออาจแปลงเป็น html?

หรือมีวิธีอื่นในการสร้างเว็บไซต์ MediaWiki รุ่นออฟไลน์หรือไม่


คุณต้องการดัชนีหรือไม่ เพียงแค่เริ่มMain Pageและตามลิงค์จากที่นั่น
Ilmari Karonen

นี่คือคำแนะนำของ Cam Webbสำหรับการสร้างเว็บไซต์ MediaWiki รุ่นคงที่ ที่นี่ฉันเองในกรณีที่พวกเขาช่วยใคร ทั้งสองให้ลิงก์ไปยังผลลัพธ์คงที่ ( ของฉันที่นี่ )
Michael Allan

คำตอบ:


8

คุณสามารถใช้เครื่องมือ webcrawler ซึ่งจะบันทึกไซต์เป็นไฟล์ HTML ลิงก์ทั้งหมดจะถูกแปลงเพื่อให้คุณสามารถเปิดหน้าหลักพูดแล้วคลิกที่ลิงก์และไปที่ไซต์ทั้งหมด

มีเครื่องมือเหล่านี้จำนวนมาก ฉันใช้wgetซึ่งเป็นบรรทัดคำสั่งและมีตัวเลือกนับพันจึงไม่เป็นมิตรมาก อย่างไรก็ตามมันค่อนข้างทรงพลัง

ตัวอย่างเช่นนี่คือบรรทัดคำสั่งที่ฉันใช้เพื่อถ่ายโอนข้อมูลไซต์ mediawiki ของฉันเอง ฉันขอแนะนำให้คุณเข้าใจตัวเลือกแต่ละตัวก่อนใช้งานด้วยตัวคุณเอง:

"c:\program files\wget\wget" -k -p -r -R '*Special*' -R '*Help*' -E http://example.com/wiki

10

คุณสามารถรับ-pages-articles.xml.bz2จากไซต์ทิ้ง Wikimediaและประมวลผลด้วยWikiTaxi (ดาวน์โหลดที่มุมบนซ้าย) เครื่องมือนำเข้า Wikitaxi จะสร้างไฟล์.taxi(ประมาณ 15Gb สำหรับ Wikipedia) จาก.bz2ไฟล์ ไฟล์นั้นจะถูกใช้โดยโปรแกรม WikiTaxi เพื่อค้นหาบทความ ประสบการณ์นั้นคล้ายกับประสบการณ์ของเบราว์เซอร์มาก

หรือคุณสามารถใช้Kiwixได้เร็วขึ้นในการตั้งค่าเพราะยังมีการถ่ายโอนข้อมูลที่ประมวลผลแล้ว ( .zimไฟล์) เนื่องจากความคิดเห็นระบุไว้เพื่อใช้ไซต์ MediaWiki อื่น ๆ สำหรับ kiwix mwofflinerสามารถใช้งานได้อาจไม่ทำงานทั้งหมดเนื่องจากอาจมีความแตกต่างที่กำหนดเอง แต่เป็นตัวแปรเดียวที่ฉันพบ

การใช้ Wikimedia กับสิ่งwgetนั้นไม่ใช่วิธีปฏิบัติที่ดี หากมีคนจำนวนมากเกินไปที่จะทำเช่นนั้นมันอาจทำให้เว็บไซต์ร้องขอ


แก้ไขภายหลังสำหรับกรณีที่คุณต้องการให้รูปภาพออฟไลน์ด้วย:

โครงการ XOWA

หากคุณต้องการมิรเรอร์ที่สมบูรณ์ของ Wikipedia (รวมถึงรูปภาพ) การจัดรูปแบบ HTML เต็มรูปแบบเหมือนเดิมซึ่งจะดาวน์โหลดในเวลาประมาณ 30 ชั่วโมงคุณควรใช้:

วิกิพีเดียภาษาอังกฤษมีข้อมูลจำนวนมาก มีหน้า 13.9 ล้านหน้าพร้อมข้อความขนาด 20.0+ GB และรูปขนาดย่อ 3.7+ ล้านรูป

XOWA :

การตั้งค่าทั้งหมดนี้บนคอมพิวเตอร์ของคุณจะไม่เป็นกระบวนการที่รวดเร็ว ... การนำเข้าเองนั้นจะต้องใช้พื้นที่ดิสก์ 80GB และใช้เวลาประมวลผลห้าชั่วโมงสำหรับเวอร์ชั่นข้อความ หากคุณต้องการรูปภาพด้วยตัวเลขจะเพิ่มพื้นที่ว่างในดิสก์เป็น 100GB และใช้เวลาประมวลผล 30 ชั่วโมง อย่างไรก็ตามเมื่อคุณทำเสร็จแล้วคุณจะมีสำเนา Wikipedia ภาษาอังกฤษฉบับสมบูรณ์พร้อมรูปภาพที่สามารถใส่ลงในการ์ด SD ขนาด 128GB

แต่เวอร์ชันออฟไลน์นั้นเหมือนกับเวอร์ชั่นออนไลน์มากรวมถึงรูปถ่ายและอื่น ๆ : (ฉันทดสอบบทความด้านล่างอย่างสมบูรณ์) ป้อนคำอธิบายรูปภาพที่นี่


แก้ไขภายหลังหากไม่มีข้อใดข้อหนึ่งข้างต้นที่บังคับใช้:

หากวิกินั้นไม่ได้เป็นส่วนหนึ่งของ Wikimedia หรือไม่มีการถ่ายโอนข้อมูลแสดงว่ามีโครงการบน github ที่ดาวน์โหลดวิกินั้นโดยใช้ API:

WikiTeam - เราเก็บถาวรวิกิจากวิกิพีเดียไปเป็นน้อยที่สุดวิกิ


1
ในกรณีที่มีการทิ้งการติดตั้งมีเดียวิกิแบบกำหนดเอง XOWA นั้นค่อนข้างมีความสามารถในการทำเช่นนั้น (อาจมีปัญหาบางอย่าง) บทความต่อไปนี้xowa.org/home/wiki/App/Wiki_types/Wikia.comค่อนข้างมีประโยชน์ การใช้งาน Kiwix กับ wikis ที่กำหนดเองนั้นยังไม่ได้ทำการทดสอบ (หนึ่งต้องทิ้ง wiki ด้วยgithub.com/kiwix/mwofflinerหรือเครื่องมืออื่นก่อน)
บันไดเลื่อน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.