ฉันต้องการแปลงPDF นี้ซึ่งมีตารางเป็นสเปรดชีตที่เข้ากันได้กับ Excel สำหรับวัตถุประสงค์ในการทำแฟลชการ์ด
ไม่มีใครรู้วิธีการทำเช่นนี้โดยอัตโนมัติโดยไม่ต้องคัดลอกแต่ละวลีลงในคอลัมน์ที่ถูกต้อง?
ฉันต้องการแปลงPDF นี้ซึ่งมีตารางเป็นสเปรดชีตที่เข้ากันได้กับ Excel สำหรับวัตถุประสงค์ในการทำแฟลชการ์ด
ไม่มีใครรู้วิธีการทำเช่นนี้โดยอัตโนมัติโดยไม่ต้องคัดลอกแต่ละวลีลงในคอลัมน์ที่ถูกต้อง?
คำตอบ:
รูปแบบ PDF จากต้น (มากกว่า 20 ปีมาแล้ว) ไม่เคยตั้งใจที่จะเป็นเจ้าภาพในที่สกัด, ข้อมูลที่มีโครงสร้างมีความหมาย
จุดประสงค์ดั้งเดิมของมันคือการแสดงภาพข้อความและไดอะแกรมในเอกสารที่น่าเชื่อถือซึ่งเป็นกระดาษดิจิตอลชนิดหนึ่ง (ซึ่งสามารถถ่ายโอนไปยังกระดาษจริงผ่านการพิมพ์ได้อย่างน่าเชื่อถือ) ต่อมาในการพัฒนาคุณสมบัติเพิ่มเติมได้เพิ่มในหมู่พวกเขาบางอย่างที่จะช่วยในการแยกข้อมูลอีกครั้ง (google สำหรับTagged PDF )
สำหรับตัวอย่างของปัญหาที่เกิดขึ้นเมื่อตารางการขูดข้อมูลจาก PDF ดูบทความนี้:
ขัดแย้งกับจุดของฉัน '1. ' ด้านบนตอนนี้ฉันพูดแบบนี้: สำหรับกลุ่มเครื่องมือที่น่าทึ่งที่ดีขึ้นเรื่อย ๆ ในแต่ละสัปดาห์สำหรับการดึงข้อมูลตารางจาก PDF (ยกเว้นว่าเป็นหน้าสแกน) ดูลิงค์เหล่านี้:
ดังนั้น: ไปหา Tabula หากเครื่องมือใด ๆ สามารถทำสิ่งที่คุณต้องการในเวลานี้ (4 ปีหลังจากถามคำถามนี้) Tabula น่าจะเป็นงานที่ดีที่สุด!
PS: Tabula เป็นซอฟต์แวร์โอเพนซอร์สและฟรีเขียนใน Ruby
แปลงไฟล์ PDF เป็นเอกสาร Microsoft Excel แยกตาราง โปรแกรมแปลง PDF ฟรีและเครื่องมือสร้าง PDF นี้รวดเร็วและเชื่อถือได้ หวังว่านี่จะเป็นประโยชน์
ฉันรู้ว่านี่เป็นโพสต์เก่า แต่มีเครื่องมือฟรีมากมายที่คุณสามารถใช้สำหรับการแปลงแบบครั้งเดียว นี่คือตัวอย่างบางส่วน:
คุณจะพบสิ่งต่างๆมากมายหากคุณค้นหาPDF Table to Excel
ใน Google