คำถามติดแท็ก microsoft-word

2
แปลง. docx เป็น. pdf ด้วย pandoc
ฉันพยายามแปลง. docx ที่ได้รับทางไปรษณีย์เป็น pdf ที่ถูกต้องโดยใช้ pandoc (ฉันใช้ GNU / Linux) ฉันมีข้อผิดพลาดเกี่ยวกับการเข้ารหัสอักขระ: $ pandoc file.docx -o file.pdf pandoc: Cannot decode byte '\x87': Data.Text.Encoding.decodeUtf8: Invalid UTF-8 stream ฉันพยายามระบุการเข้ารหัส: $ file -i file .docx file.docx: application/vnd.openxmlformats-officedocument.wordprocessingml.document; charset=binary ฉันประหลาดใจเล็กน้อยcharset=binary(ฉันคาดหวังcharset=iso8859-15) อย่างไรก็ตามฉันพยายามแปลง. docx เป็น utf8 อยู่ดีและมันไม่ทำงาน: $ iconv -t utf-8 file.docx P! $iconv: séquence d'échappement non …

1
การแปลงไฟล์. docx เป็นข้อความธรรมดาและเก็บรักษาตัวแบ่งบรรทัดเพื่อรักษาการอ้างอิงหมายเลขบรรทัดไปยังเอกสารต้นทาง: วิธีการ & นัย?
ฉันกำลังส่งออกเนื้อหาMS Wordเป็นข้อความธรรมดาเพื่อใช้กับโปรแกรมอรรถประโยชน์ข้อความและไฟล์ ฉันมีข้อ จำกัด ที่คุณสมบัติการกำหนดหมายเลขบรรทัดถูกเปิดใช้งานในซอฟต์แวร์ MS และการอ้างอิงใด ๆ กับหมายเลขบรรทัดในผลลัพธ์สุดท้ายจะต้องตรงกับการกำหนดหมายเลขนั้น ดังนั้นป้อน "หมายเลขบรรทัด": ( Poe, EA ) เห็นได้ชัดว่าสำหรับWord การเรียงลำดับหมายเลขนั้นไม่ทำให้บรรทัดใหม่ขึ้นบรรทัดใหม่แต่จะแบ่ง "บรรทัด" หลังจากระยะห่างที่ถูกต้อง (หรือบางอย่าง) สคริปต์เช่นdocx2txtนี้ไม่ได้พิจารณาถึงสิ่งนี้ตามค่าเริ่มต้นแล้วจะมีการขึ้นบรรทัดใหม่ที่บรรทัดใหม่ ดังนั้นหากฉันใช้grep -nกับการกำหนดหมายเลขบรรทัดจะไม่ตรงกับคุณลักษณะหมายเลขบรรทัดซอร์สดังที่แสดงด้านบน ยังไม่ชัดเจนจากเอกสารว่าฉันจะต้องแก้ไขสคริปต์ Perl เพื่อแปลงไฟล์แบบที่ฉันต้องการในกรณีนี้: our $config_newLine = "\n"; # Alternative is "\r\n". our $config_lineWidth = 80; # Line width, used for short line justification. ฉันพยายามทำหน้าที่แทน\nสำหรับ\r\nแต่ที่ดูเหมือนจะไม่ทำงานสำหรับฉัน ดังนั้นฉันจึงหันไปใช้การส่งออกเอกสารโดยตรงจากWordด้วยการตั้งค่าต่อไปนี้ (บันทึกเป็นข้อความธรรมดาบน v.2013,64 …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.