ก่อนที่ฉันจะเริ่มใช้ Ubuntu ฉันใช้เครื่องอ่าน Nitro PDF เพื่อดึงภาพจากไฟล์ PDF โดยอัตโนมัติ มีโปรแกรมอ่าน PDF สำหรับ Linux หรือไม่
ฉันต้องการที่จะดึงภาพได้เร็วขึ้น / ง่ายขึ้นกว่าเมื่อถ่ายภาพ
ก่อนที่ฉันจะเริ่มใช้ Ubuntu ฉันใช้เครื่องอ่าน Nitro PDF เพื่อดึงภาพจากไฟล์ PDF โดยอัตโนมัติ มีโปรแกรมอ่าน PDF สำหรับ Linux หรือไม่
ฉันต้องการที่จะดึงภาพได้เร็วขึ้น / ง่ายขึ้นกว่าเมื่อถ่ายภาพ
คำตอบ:
pdfimages
pdfimages
เป็นเครื่องมือแยกรูปภาพ PDF ซึ่งบันทึกรูปภาพในไฟล์ PDF เป็นไฟล์ PPM, PBM, JPEG หรือ JPEG 2000
เป็นส่วนหนึ่งของpoppler-utils
แพ็คเกจที่คุณจะต้องติดตั้ง
การใช้งาน: pdfimages [options] <PDF-file> <image-root>
ตัวอย่าง:ข้อมูลต่อไปนี้จะแยกรูปภาพทั้งหมดออกจากไฟล์ PDF โดยบันทึกเป็นรูปแบบ JPEG
pdfimages -j in.pdf /tmp/out
จะบันทึกรูปภาพจากไฟล์ PDF in.pdf
ในไฟล์/tmp/out-000.jpg
(หรือ/tmp/out-000.pbm
ดูด้านล่าง) /tmp/out-001.jpg
ฯลฯ
-j: Normally, all images are written as PBM (for monochrome images) or PPM for
non-monochrome images) files. With this option, images in DCT format are
saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.
-all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt.
-all
สวิตช์นี้รองรับเฉพาะการแก้ไข poppler-utils ล่าสุด ตัวอย่างเช่นหากคุณยังอยู่ที่ 12.04 คุณจะไม่สามารถเข้าถึงตัวเลือกนี้ได้
-all
รูปแบบ PNM ได้ พวกมันไม่สูญเสียและคุณสามารถประมวลผลภาพเช่น PNG
$ pdfimages -list <PDF-file>
เพื่อตรวจสอบรูปแบบดั้งเดิมในคอลัมน์ "enc" ดังนั้นคุณไม่จำเป็นต้องเข้ารหัสรูปภาพอีกครั้งในรูปแบบอื่น
ฉันมักจะใช้ Inkscape สำหรับสิ่งนี้ โหลดหน้าและลบสิ่งอื่น ๆ ทั้งหมด ข้อดีคือคุณสามารถรับภาพเวกเตอร์ใน SVG และแก้ไขตามที่คุณเลือก
ฉันมีไฟล์ PDF สองคอลัมน์ที่มีรูปภาพฝังตัวที่สร้างขึ้นด้วย LaTeX ซึ่งมีรูปภาพต้นฉบับให้เป็น EPS ฉันลองใช้วิธีแก้ปัญหาที่เสนอตามpdfimages
แต่น่าเสียดายที่มันไม่ได้ส่งคืนรูปภาพใด ๆ ฉันพยายามใช้ Inkscape แล้ว แต่ภาพ SVG ที่สร้างขึ้นนั้นผิดเพี้ยนและฉันก็ไม่มีโชคที่ส่งออกเป็น EPS เช่นกัน
ซอฟต์แวร์ที่ทำงานให้เราเป็นMasterPdfEditor
นี่คือขั้นตอน
ผลลัพธ์มีคุณภาพสูงมาก แต่ซอฟต์แวร์ไม่เสียค่าใช้จ่าย มีรุ่นสาธิตที่ "ให้คุณลองใช้ฟีเจอร์ทั้งหมด" แต่มาพร้อมกับ "การเพิ่มลายน้ำในไฟล์เอาต์พุต" เพื่อความตรงไปตรงมาฉันไม่ได้สังเกตลายน้ำใด ๆ ใน PDF ที่สร้างขึ้น
คุณอาจลอง pdfmod มันเป็น GUI (ส่วนต่อแบบกราฟิก) ซึ่งสามารถแยกรูปภาพและจัดการไฟล์ PDF พื้นฐานอื่น ๆ
หากสิ่งที่คุณต้องการคือภาพที่ถูกครอบตัดในรูปแบบ pdf / eps ให้แตกหน้าด้วยภาพโดยใช้pdfmod
(ตามที่แนะนำโดยสิ่งที่ต้องทำ)
จากนั้นใช้pdfcrop
คุณสามารถครอบตัดมันได้อย่างถูกต้องตั้งค่าระยะขอบโดยการทดลองและข้อผิดพลาด:
pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf
ฉันใช้ pdfimages ซึ่งเป็นเครื่องมือบรรทัดคำสั่งและใช้งานได้ดีสำหรับฉัน มันใช้งานง่ายมากและคุณสามารถใช้ - ช่วยเหลือตัวเลือกเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับการใช้งาน ฉันใช้ Ubuntu และติดตั้งมาล่วงหน้า หากไฟล์ pdf ของคุณถูกเข้ารหัสหรือป้องกันด้วยรหัสผ่านจะมีตัวเลือกให้เลือกดังนั้นเครื่องมือนี้จึงใช้งานได้ดี คุณสามารถอ่าน เพิ่มเติมเกี่ยวกับ pdfimages ได้ ที่นี่
ด้วย pdfimages รูปภาพที่แยกอาจเป็นสองส่วนขึ้นไป วิธีง่ายๆในการรวมเข้าด้วยกันอีกครั้งโดยไม่ต้องกังวลเกี่ยวกับรูปแบบที่แยกออกคือการนำเข้าส่วนต่างๆลงใน LibreOffice Draw, ครอบตัดด้วยกล่องโต้ตอบการครอบตัดรูปภาพวางชิ้นส่วนปรับขนาดหน้าและส่งออกในรูปแบบที่คุณต้องการ
หากคุณต้องการครอบตัดรูปภาพจาก pdf ด้วย pdfviewer คุณสามารถลองใช้ได้ มันสามารถครอบตัดอะไร (ข้อความหรือรูปภาพ) ในรูปแบบ png หรือ jpeg หากคุณต้องการแยกภาพในรูปแบบ png จาก pdf คุณสามารถทำได้ด้วยคำสั่งขั้นต่ำด้วย pdftohtml มันแปลงไฟล์ PDF เป็น html plus images นี่คุณจะพบตัวอย่าง - https://www.youtube.com/watch?v=CG1rf7k3xo8 หากคุณต้องการดึงหลายภาพจาก pdf ฉันแนะนำให้คุณลองทำดู
ซอฟต์แวร์ที่ใช้: Xreader OS: Antergos
ขั้นตอน:
pdfimages
ทำมันได้ดี / worser กว่า NitroPDF?