“ ดูแหล่งที่มา” - เทียบเท่ากับเอกสาร Word หรือไม่


11

บางครั้งเอกสาร Word ดูเหมือนจะแบ่งมากหรือน้อยโดยปกติเมื่อเค้าโครงมีความซับซ้อนมากและเอกสารมีการเปลี่ยนมือและ / หรือรุ่นสองครั้ง อาการอาจเป็นได้ว่าไม่มีอะไรเกิดขึ้นเมื่อกดปุ่มBackspaceหรือEnterในตำแหน่งที่แน่นอนของเอกสารที่ควรใช้งานจริงหรือการฟอร์แมตดูเหมือนว่าจะนำไปใช้และรีเซ็ตตัวเองแบบสุ่มมากขึ้นหรือน้อยลง ฉันคิดว่าเราทุกคนเคยไปที่นั่น

บ่อยครั้งที่มันยากมากที่จะรู้ว่าสิ่งที่ผิดเพราะสิ่งที่เกิดขึ้นภายใต้ประทุนใน Word นั้นค่อนข้างทึบ คุณอาจมีเอกสารที่ดูว่างเปล่า แต่ในความเป็นจริงสถานะพื้นฐานเกี่ยวกับการจัดรูปแบบ ฯลฯ นั้นค่อนข้างซับซ้อน

ในกรณีเหล่านี้จะเป็นประโยชน์ในการดูรหัสต้นฉบับที่อยู่ด้านหลังสิ่งที่แสดงบนหน้า เช่นเดียวกับที่คุณทำในเบราว์เซอร์สามารถทำView Sourceและสามารถแก้ไขได้โดยตรงในซอร์สโค้ดเช่นเดียวกับที่คุณทำเมื่อใช้ลาเท็กซ์ มีคำสั่งหรือยูทิลิตี View Source-type สำหรับเอกสาร Microsoft Word หรือไม่

ฉันเดาว่าจะไม่มีคำสั่งดังกล่าวหรือฉันจะได้ยินเกี่ยวกับมัน ถ้าเป็นเช่นนั้นไม่มีใครมีวิธีการที่ดีเมื่อพูดถึงเรื่องการจัดรูปแบบที่ซ่อนอยู่ในเอกสาร Wordหรือไม่?

ฉันสงสัยว่าอาจมีความแตกต่างในรูปแบบ. doc และ. docx ฉันสนใจทั้งสองกรณี

คำตอบ:


11

หากการจัดรูปแบบคือสิ่งที่คุณสนใจในโปรแกรม Word แล้วจะมี feture ที่ดีสำหรับการตรวจสอบทุกประเภทของการจัดรูปแบบนำไปใช้กับข้อความและวัตถุที่เรียกว่าเปิดเผยการจัดรูปแบบ ใน Word 2007 และ 2010 ทางลัดสำหรับแผงนี้เป็น+ShiftF1

ป้อนคำอธิบายรูปภาพที่นี่

มิฉะนั้นหากคุณกำลังมองหาความเข้าใจที่ลึกซึ้งยิ่งขึ้นของรูปแบบเอกสารคุณสามารถดูไฟล์ XML สำหรับ DOCX

  1. ค้นหาเอกสาร DOCX ของคุณบนดิสก์
  2. เปลี่ยนนามสกุลของเอกสารจาก. docx เป็น. zip
  3. ดับเบิลคลิกที่ไฟล์และเปิดในตัวจัดการการจัดเก็บเริ่มต้น
  4. นำทางไปยัง "คำว่า" โฟลเดอร์ในโปรแกรมซิปและเปิด Document.xml นี่คือรหัสที่อยู่เบื้องหลังสิ่งที่ประกอบขึ้นเป็นกลุ่มของเนื้อหาเอกสารแม้ว่าไฟล์อื่น ๆ จะถูกนำมาใช้ในรูปแบบอื่นเช่นข้อมูลลักษณะหรือข้อมูลแบบอักษร

คุณจะต้องมีเครื่องมือแก้ไข XML ที่เหมาะสมเพื่อดูข้อมูลและแม้กระทั่งมันก็ค่อนข้างซับซ้อนและสำหรับเอกสารขนาดใหญ่นั้นจะยาวมาก

เมื่อพูดถึง DOC ไม่มีวิธีง่ายๆในการ "ดูแหล่งที่มา" เนื่องจากเป็นไฟล์ไบนารีที่ประกอบด้วยสตรีมแยกต่างหากและดังนั้นจึงไม่มีวิธีที่ง่ายในการดูเนื้อหา


มันค่อนข้างมีประโยชน์ฉันไม่รู้ ความอัปยศที่คุณไม่สามารถทำได้เหมือนกันสำหรับ. doc-files เนื่องจากเป็นสิ่งที่ บริษัท ของฉันยังคงใช้ ขอบคุณสำหรับคำอธิบายว่า!
Godsmith

1
@Godsmith คุณสามารถบันทึก DOC เป็น DOCX โดยใช้ Word เวอร์ชันที่ใหม่กว่าจากนั้นกลับไปที่ DOC หลังจากคุณทำการเปลี่ยนแปลงอะไรก็ตาม มีการสูญเสียรูปแบบในกระบวนการนี้ดังนั้นโปรดระมัดระวัง แต่คุณอาจพบว่าคุณสามารถเปลี่ยนแปลงหรือแก้ไขปัญหาในประเภท DOC ของคุณโดยทำใน DOCX
ThisClark

คุณยังสามารถบันทึกไฟล์ใด ๆ เป็น html โดยตรงใน MS Word หรือคุณสามารถบันทึกเป็น RTF และเปิดไฟล์ RTF เป็นข้อความได้
phuclv

3

ฉันเดาว่ารูปแบบ. doc ค่อนข้างยากดังนั้นฉันจึงไม่สามารถช่วยคุณได้ที่นี่ อย่างไรก็ตาม. docx เป็นจริงไฟล์ zip โดยมีรายละเอียดทั้งหมดเก็บไว้ในไฟล์ XML ดังนั้นให้เปลี่ยนชื่อไฟล์เป็น. zip และดูที่แหล่งที่มา!


0

เมื่อพูดถึงรูปแบบไบนารี่เช่น * .doc สิ่งต่าง ๆ จะมีความซับซ้อนกว่า คุณสามารถใช้ LibreOffice ของเค Dumper เพียงโคลนโซลูชันกับเครื่องของคุณและเรียกใช้

python doc-dump.py \path\to\file.doc >output.xml

ตอนนี้ทุกสิ่งในไฟล์ไบนารีจะถูกแปลงเป็น xml ในรูปแบบที่แน่นอนที่อธิบายไว้ในWord (.doc) รูปแบบไฟล์ไบนารี

นอกจากนี้ยังมีWordFileDumpซึ่งง่ายกว่า แต่ไม่แรงเท่า mso-dumper

น่าเสียดายที่สิ่งเหล่านี้มีไว้สำหรับการวิเคราะห์โครงสร้างเท่านั้นและไม่มีเครื่องมือในการรวบรวมเอาต์พุต xml กลับไปที่ไฟล์ * .doc ดังนั้นเมื่อคุณพบสาเหตุที่ทำให้คุณต้องใช้ Word เพื่อแก้ไขมัน ดังนั้นการแปลงเป็น * .docx ง่ายกว่าให้ตรวจสอบไฟล์ * .docx จากนั้นแปลงกลับเป็น * .doc หากจำเป็น

หรือคุณสามารถบันทึกไฟล์เป็นrtfซึ่งเป็นไฟล์ข้อความ "ที่มนุษย์อ่านได้" แทน office xml หรือบันทึกไฟล์คำเป็น html

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.