ข้อดีของการจัดรูปแบบ DOCX ผ่าน DOC


9

วันนี้ฉันได้พบโดยบังเอิญว่า. docx เป็น. zip เดียวกัน (หรือไม่มีความแตกต่างอย่างมากระหว่างพวกเขา) เมื่อคุณเปลี่ยน. docx เป็น. zip และเปิดด้วย WinRAR คุณจะเห็นไฟล์ XML จำนวนมากในโฟลเดอร์ ในไฟล์ XML นั้นจะถูกจัดเก็บข้อความแบบอักษรเจ้าของแก้ไขล่าสุดและอื่น ๆ ในคำว่าข้อมูลทั้งหมดจะถูกเก็บไว้เป็นข้อมูล XML

แต่ก็ไม่เหมาะสำหรับไฟล์นามสกุล. doc มันเป็นไปไม่ได้ที่จะเปิดพวกเขาในรูปแบบ. zip เป็น. rar

ดังนั้นคำถาม: ประโยชน์ของการจัดเก็บข้อมูล. docx ใน XML ที่ Microsoft เปลี่ยนวิธีการจัดเก็บข้อมูลคืออะไร แน่นอนฉันต้องการรู้ว่าไม่ใช่ข้อดีของรูปแบบ XML แต่ทำไม Microsoft ใช้หลายไฟล์ XML เพื่อจัดเก็บข้อมูล. docx ปรากฏว่า. docx ไม่ใช่รูปแบบใหม่ในรูท


ภายใน 1 นาที .. 5 คำตอบที่เกือบจะเหมือนกัน พลังของ SO
MRG

1
การมีข้อมูลในรูปแบบ XML ไม่ได้หมายความว่าไม่ใช่รูปแบบใหม่ คุณไม่สามารถฟีด XML นั้นลงใน OpenOffice และทำให้การแสดงผลถูกต้อง คุณชัดเจนต้องกำหนดสิ่งที่จะเป็นโครงสร้าง XML สิ่งแอตทริบิวต์สิ่งที่องค์ประกอบอื่น ๆ

1
ลองเปลี่ยนชื่อเรื่องเป็นข้อมูลเพิ่มเติม
Carl Bergquist

2
แน่นอนมันเป็นรูปแบบใหม่ มาเดี๋ยวนี้.

เรียน Janis Veinbergs และ Kyle Rozendo ฉันได้ทำงานกับ XML และ XSD หลายครั้งและฉันรู้ว่ามันทำงานอย่างไร !!! จะต้องใส่ใจฉันพูดว่า "ในราก" คุณไม่สามารถตกลงได้ว่าเป็นรูปแบบ XML ที่ใช้เพียงรูปแบบใหม่ !!!!
Narek

คำตอบ:


12

.docxไฟล์สามารถเก็บทรัพยากรที่ฝังตัวเช่นไฟล์ภาพไม่ได้เป็นเพียงไฟล์ XML แทนที่จะเข้ารหัสสิ่งใน base64 หรือบางอย่างและเก็บไว้ในไฟล์ XML หรือประดิษฐ์รูปแบบซีเรียลไลซ์เซชั่นอื่นพวกเขาตัดสินใจใช้รูปแบบ ZIP มาตรฐาน

นอกจากนั้น XML เป็นรูปแบบไฟล์ที่ละเอียดมากซึ่งมีรูปแบบที่ซ้ำซ้อนมากมาย คุณสามารถรับอัตราส่วนการบีบอัดสูงสำหรับไฟล์ XML

โดยวิธีการที่ฉันไม่ได้รับส่วน "หลอกเรา" มันจะดีกว่าที่จะคิดค้นรูปแบบไฟล์ลับใหม่ตั้งแต่เริ่มต้นหรือใช้รูปแบบมาตรฐานที่รู้จักกันดี?


ประโยชน์หลักที่ฉันเห็นคือมี Open APIs สำหรับการสร้างไฟล์เหล่านี้ดังนั้นการสร้างไฟล์. docx ตั้งแต่เริ่มต้นเป็นไปได้โดยไม่ต้องใช้ SDK ที่เป็นกรรมสิทธิ์ Microsoft SDK ยังให้วัสดุสะท้อนแสงเอกสารที่จะสร้างรหัส C # เพื่อสร้างเอกสารก่อนทำตั้งแต่เริ่มต้น
Will Eddins

@Guard: ใช่ คำตอบของฉันตอบคำถามรุ่นเดิม คำถามมีการเปลี่ยนแปลงอย่างมีนัยสำคัญตั้งแต่นั้นมา;) ชื่อเดิมคือ "Microsoft กำลังหลอก?"
Mehrdad Afshari

xml ในตัวมันเองไม่ได้ทำให้รูปแบบ "รู้จัก", .docx เป็นหนึ่งในตัวอย่างที่ดีที่สุด
artistoex

5

บทความวิกิพีเดียผลรวมมันได้สวยอย่าง:

"ไมโครซอฟท์ตกอยู่ภายใต้แรงกดดันที่เพิ่มขึ้นในการนำรูปแบบไฟล์เปิดมาใช้โดยเฉพาะในหลาย ๆ ประเทศที่นำกฎเกณฑ์มาใช้ว่าเอกสารอย่างเป็นทางการควรอยู่ในรูปแบบเปิด"

แก้ไข: และการบีบอัดข้อมูลนั้นสมเหตุสมผลมากเนื่องจาก XML นั้นละเอียดมากและบีบอัดได้ดีตามธรรมชาติ


3
"เปิด" ไม่ได้แปลว่า "สามารถคลายซิป"
Greg Hewgill

3
การซิปมีข้อดีอื่น ๆ นอกเหนือจากการบีบอัด มันทำหน้าที่เป็นที่เก็บไฟล์หลายไฟล์
Joey

3

การใช้ไฟล์. zip ที่ถูกเปลี่ยนชื่อเป็นวิธีปฏิบัติที่ใช้กันทั่วไปเช่นไฟล์ Quake III .pak เป็นไฟล์. zip จริงๆ ไม่มีประเด็นที่จะคิดค้นรูปแบบไฟล์บีบอัดของคุณเองเมื่อมีไฟล์ที่ดีอยู่แล้ว


1
ตัวอย่างเพิ่มเติมของการใช้ไฟล์เก็บถาวร ZIP: Java .jar, Winamp .wsz/ .wal(สกิน), Firefox .xpi(XPInstaller - ธีม, addons) ( tarไฟล์เก็บถาวรก็เป็นที่นิยมเช่นกัน)
user1686

1

ไม่ใช่ Office Open XML เท่านั้นที่ใช้ XML ที่ซิป OpenDocument ของ Open Office ทำแบบเดียวกันเบื้องหลัง

มีข้อดีอยู่เล็กน้อยในหน้า Wikipedia ใน Open Packaging Conventions :

ความร้าย

นำตัวอย่างของแคตตาล็อกที่มีโลโก้ซ้ำ 1,000 ครั้ง การใช้กลไกทางอ้อมหากเราต้องการเปลี่ยนโลโก้เราเพียงต้องการเปลี่ยนหนึ่งรายการในไฟล์เดียวโดยไม่ต้องทำการค้นหาเพราะเรารู้ว่าจะต้องดูที่ใด การบำรุงรักษานี้เพิ่มขึ้นอย่างมาก ถ้าคุณต้องการเปลี่ยนเลย์เอาต์ของเช่นไดเรกทอรี ZIP ที่จัดเก็บไฟล์ของคุณมันจะกลายเป็นเรื่องเล็กน้อยเพราะคุณไม่จำเป็นต้องรู้องค์ประกอบทุกอย่างที่สามารถชี้ไปที่ไฟล์ได้พวกเขาทั้งหมดอยู่ในจุดเดียว

การจัดเป็นกลุ่ม

มันสนับสนุนให้เอกสารถูกแบ่งออกเป็นชิ้นเล็ก ๆ เป็นการดียิ่งสำหรับการลดผลกระทบของความเสียหายของไฟล์ และดีกว่าสำหรับการเข้าถึงข้อมูล: ตัวอย่างเช่นข้อมูลสไตล์ทั้งหมดในส่วน XML เดียวแต่ละแผ่นงานหรือตารางแยกกันในส่วนต่าง ๆ ของตนเอง สิ่งนี้ช่วยให้เข้าถึงได้เร็วขึ้นและสร้างวัตถุน้อยลงสำหรับลูกค้าและทำให้กระบวนการหลายกระบวนการทำงานบนเอกสารเดียวกันได้ง่ายขึ้น

Chunking ยังเป็นประโยชน์ต่อโปรแกรมเมอร์ การแทนที่หนึ่งสไตล์ชีทด้วยสไตล์อื่นจะเป็นการดำเนินการกับไฟล์ ZIP ไม่ใช่การทำงานของ XML และลดจำนวนของสิ่งที่โปรแกรมเมอร์ต้องการเพื่อทำความเข้าใจเพราะพวกเขาสามารถเข้าหากลุ่มได้โดยสมมติว่าข้อมูลทั้งหมดในหัวข้อนั้นอยู่ในกลุ่มอันนั้น: พวกเขารอดชีวิตจิตใจที่ต้องค้นหาไฟล์ขนาดใหญ่ที่มีจำนวนมาก องค์ประกอบภายนอก

อ้อมญาติ

ใน Open Packaging Conventions แต่ละไฟล์ที่มีการอ้างอิงมีไฟล์ _rels ของตัวเองพร้อมกับรายการทางอ้อม สิ่งนี้ทำให้ง่ายต่อการตัดและวางข้อมูลบางส่วนด้วยทรัพยากรที่เกี่ยวข้องทั้งหมดในบางกรณีจัดเตรียมการกำหนดขอบเขตชื่อเพื่อลบโอกาสของการปะทะกันระหว่างชื่อไฟล์และอื่น ๆ


0

ประโยชน์ที่ใหญ่ที่สุดคือคุณสามารถเข้าถึงข้อมูลของคุณได้โดยการขยายไฟล์และคัดลอกข้อความจากไฟล์ xml สิ่งนี้สามารถทำได้ด้วยยูทิลิตี้ซิปและตัวแก้ไขข้อความแม้ว่าคุณจะไม่มีสำเนาของ Word 2007

นี่คือสิ่งที่ทำให้รูปแบบเปิดมากขึ้นซึ่งเป็นรูปแบบไบนารีที่เก่ากว่า

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.