ส่งออก: คัดลอกข้อความจาก pdf โดยไม่มีตัวแบ่งบรรทัด


12

มี PDF บางส่วนอยู่ใน wild ที่ทุกบรรทัดของข้อความดูเหมือนว่าจะ hardcoded ดังนั้นเมื่อฉันคัดลอกบล็อกข้อความทุกอย่างมาพร้อมกับมัน: ตัวแบ่งบรรทัดและแม้แต่ตัวคั่น "-"

คำถามของฉันคือ: ฉันจะสร้าง PDF ใน InDesign ได้อย่างไรโดยที่พฤติกรรมนี้ไม่เกิดขึ้น

มีใครรู้เรื่องนี้บ้างไหม?


2
ฉันอยากจะแสดงความคิดเห็นว่านี่เป็นปัญหาใหญ่ในบทความทางวิชาการมากมายและฉันไม่พบเหตุผล / วิธีแก้ไขปัญหานี้ หวังว่าจะได้คำตอบที่ดี!
benteh

... ดังนั้นมันอาจเป็นฟังก์ชั่นการส่งออกโบราณในการฝึกงี่เง่าจากยุค precambrium ที่จะกล่าวโทษ
benteh

คำตอบ:


3

นั่นเป็นเพราะ PDF สามารถสร้างได้หลายวิธีจากซอฟต์แวร์และแอพออนไลน์มากมาย แต่ละข้อความเหล่านี้มีการรักษาบรรทัดข้อความที่แตกต่างกันดังนั้นคุณจึงไม่สามารถบอกได้ว่าข้อความถูกล้อมรอบจริงจนกว่าคุณจะพยายามคัดลอกวางจาก PDF กลับไปที่ InDesign

InDesign-export PDF ของอย่างไรก็ตามโดยทั่วไปแล้วจะมีช่องว่างในตอนท้ายของแต่ละบรรทัดดังนั้นคุณไม่ต้องกังวลกับการใส่ย่อหน้าส่งคืนหลังจากแต่ละบรรทัด เพื่อให้แน่ใจ 100% ตรวจสอบCreate Tagged PDFช่องทำเครื่องหมายเมื่อคุณส่งออก PDF จาก InDesign โดยส่วนตัวฉันจะทำเครื่องหมายที่ช่องนี้เสมอและรวมไว้ในค่าที่ตั้งไว้ที่ฉันใช้อยู่ รายละเอียดเพิ่มเติมเกี่ยวกับตัวเลือกนี้ที่นี่

หากคุณพบไฟล์ PDF ที่ส่งออกไม่ดีและจำเป็นต้องล้างย่อหน้าต่อท้ายส่งคืนหลังจากแต่ละบรรทัดของข้อความตัวเลือกที่เร็วที่สุดคือค้นหา / แทนที่ พิมพ์^pในFind whatฟิลด์และวางช่องว่างในChange toฟิลด์ เลือกอย่างใดอย่างหนึ่งStoryหรือSelectionด้านล่างขึ้นอยู่กับสถานการณ์ของคุณและควรล้างข้อความของคุณ

ค้นหากล่องโต้ตอบการเปลี่ยนแปลง


2

วิธีหนึ่งที่ใช้งานได้คือการส่งออก PDF เป็น HTML จาก Acrobat Proเปิดไฟล์นั้นในเว็บเบราว์เซอร์ของคุณแล้วคัดลอกข้อความจากที่นั่น

ซึ่งแตกต่างจากการส่งออกเป็นรูปแบบข้อความ, html มักจะไม่แบ่งบรรทัด

สำหรับความรู้ของฉันคุณไม่สามารถป้องกันสิ่งนี้จาก InDesign ดูเหมือนจะเป็นพฤติกรรมที่มาจากซอฟต์แวร์ PDF หรือ PDF เป็นไปได้ว่าซอฟต์แวร์การเผยแพร่ใด ๆ ที่ใช้ "กรอบข้อความ / กล่อง" จะสร้างข้อความประเภทนั้นในรูปแบบ PDF


-2

เป็นเพราะนี่คือวิธีที่ไฟล์ PDF รู้จักข้อความ - ทุกบรรทัดกลายเป็นย่อหน้าจริง ๆ (ดังนั้นกลับมาที่จุดสิ้นสุดของมัน) ไม่มีทางอ้อมคุณต้องเปลี่ยนมันทั่วโลกในเอกสารหลังจากคัดลอกโดยใช้ตัวเลือกค้นหา / แทนที่และตัวละครที่ซ่อนอยู่


1
แต่มีไฟล์ PDF ที่ไม่มีพฤติกรรมนี้ PDF เป็นที่ที่คุณสามารถคัดลอกทุกสิ่งได้โดยไม่ต้องยุ่งยาก ฉันแค่สงสัยว่ามันจะเกิดขึ้นได้อย่างไรในระหว่างการส่งออก
KSPR
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.