ฉันจะบันทึกไฟล์ PDF ของรูปภาพเป็นรูปภาพได้อย่างไร


33

ฉันมี PDF ที่มีภาพสแกนของเอกสาร ฉันต้องการบันทึกเนื้อหาของ PDF นี้เป็นภาพเพื่อให้ฉันสามารถเรียกใช้ผ่านโปรแกรม OCR ที่ยอมรับเฉพาะไฟล์ประเภท. jpg, .png และ. gif

ฉันจะบันทึก / แปลง PDF นี้เป็นหนึ่งในรูปแบบภาพเหล่านั้นได้อย่างไร

แก้ไข: วิธีหนึ่งที่ฉันพบว่าทำเช่นนี้คือการคลิกที่แต่ละหน้า คัดลอกไปที่คลิปบอร์ด วางไปที่ Paint.net แล้วบันทึก อย่างไรก็ตามนี่เป็นเรื่องยุ่งยากเนื่องจากคุณสามารถเลือกได้ครั้งละหนึ่งหน้าเท่านั้นใน Acrobat Reader

คำตอบ:


20

โปรดใส่ใจกับคำตอบของ pooryorickซึ่งเขาชี้ให้เห็นว่าคำตอบของ sleskeนั้นจริง ๆ แล้วเป็นคำตอบที่ดีกว่ามากสำหรับปัญหานี้


ใช้GhostScript คำสั่งนี้ใช้ได้สำหรับฉัน:

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

มีอุปกรณ์ png pseudo หลายรายการโดยแยกความแตกต่างของสี: pngmono, pnggray, png16, png256, png16m และ pngalpha เลือกสิ่งที่เหมาะกับคุณที่สุด

คุณยังสามารถใช้ jpeg ได้ด้วยเว้นแต่ว่าคุณมีปัญหาเรื่องพื้นที่ดิสก์คุณต้องมีคุณภาพสูงเท่าที่คุณสามารถจัดการกับ OCR ของคุณและนั่นไม่ใช่ jpeg

GhostScript ไม่ได้รับการสนับสนุนสำหรับ gif อีกต่อไป แต่ฉันไม่สามารถจินตนาการได้ว่าทำไมคุณต้องใช้สิ่งนั้นด้วยการสนับสนุน png256


ฉันรัก GhostScript และถ้าคุณต้องการความสะดวกสบายในการ GUI สำหรับการตั้งค่าตัวเลือกการดู ฯลฯ ลอง GSview pages.cs.wisc.edu/~ghost/gsview
เดนนิส

ผลลัพธ์จะเป็นภาพขนาดใหญ่หนึ่งภาพหรือไม่
Xonatron

1
@Xonatron: ไม่หนึ่งภาพต่อหน้า %dในชื่อไฟล์ที่ส่งออกเป็นตัวแปรที่จะถูกแทนที่ด้วยจำนวนหน้าเว็บ (เกือบจะเป็นตัวเลขดิบแน่นอนไม่ใช่ตัวเลขภายใน PDF)
58

20

ติดตั้งImageMagick เปิดหน้าต่าง cmd หรือเทอร์มินัล:

convert myfile.pdf myfile.jpg

ผลลัพธ์จะเป็นไฟล์ jpg 1 ไฟล์สำหรับแต่ละหน้าใน pdf, test-0.jpg, test-1.jpg ของคุณเป็นต้น


+1 สำหรับ ImageMagick แต่ -2 สำหรับการแนะนำสำหรับงานที่ไม่ถูกต้อง JPEG นั้นดีสำหรับภาพถ่าย แต่เป็นรูปแบบที่แย่ที่สุดที่จะใช้เมื่อคุณมี egdes ที่คมชัดและมีคอนทราสต์สูง นอกจากนี้ ImageMagick ไม่ทำงานการแปลงตัวเองมันใช้ Ghostscript ในพื้นหลังเป็นทาส "มอบหมาย" ดังนั้นการทำด้วย Ghostscript โดยตรงจะช่วยให้คุณควบคุมพารามิเตอร์ที่ใช้มากขึ้น จากนั้นเลือก TIFF (ไม่ใช่ JPEG) เป็นรูปแบบผลลัพธ์เพื่อประโยชน์ของคริส!
Kurt Pfeifle

1
หมายเหตุบน windows ตรวจสอบให้แน่ใจว่าคุณติดตั้ง Ghostscript 32 บิตก่อน
ผู้ใช้

2
ตระหนักถึงการdensity, depthและ, qualityธงที่สามารถช่วยให้คุณเพิ่มประสิทธิภาพการส่งออกของคุณ ตัวอย่างเช่น: convert -density 300 -depth 8 -quality 85 a.pdf a.png ข้อมูลเพิ่มเติม
Nick

13

นอกจากนี้ยังมีpdfimagesจากเครื่องมือ Xpdf (หาได้จากเว็บไซต์ของ XpdfReader ) มันจะไม่แปลงทั้งหน้า PDF เป็นรูปภาพ แต่จะแยกรูปภาพที่ฝังไว้ออกจาก PDF

สิ่งนี้มีประโยชน์หาก PDF มีข้อความและรูปภาพและคุณต้องการเฉพาะภาพ นอกจากนี้มันจะแยกรูปภาพในรูปแบบดั้งเดิมดังนั้นจึงไม่มีการสูญเสียคุณภาพ (ซึ่งแตกต่างจากโปรแกรมที่แสดงหน้าทั้งหมดแล้วแปลงเป็น JPEG) ขึ้นอยู่กับความต้องการของคุณซึ่งอาจมีประโยชน์


การใช้งานง่าย:

pdfimages -j -list mydocument.pdf mydocument-images

นี้จะอ่านแฟ้มใส่mydocument.pdf, สารสกัดจากภาพทั้งหมดและเขียนให้กับบุคคลชื่อไฟล์mydocument-images-0000.jpg, mydocument-images-0001.jpgฯลฯ

ตัวเลือก-jทำให้มันเขียนรูปภาพที่บีบอัด JPEG ที่ฝังอยู่เป็นไฟล์ JPEG ไม่ใช่ไฟล์ PBM / PGM / PPM (ซึ่งไม่มีการบีบอัดและมีขนาดใหญ่มาก) โปรดทราบว่าอาจยังคงเขียนรูปภาพเป็นไฟล์ PBM / PGM / PPM หากเป็นวิธีที่จัดเก็บไว้ในไฟล์อินพุต PDF


สำหรับการอ้างอิงการใช้งานง่าย ๆนั้นpdfimages -j "yourinputfile.pdf" "outputimages"จะทำให้ "outputimages-0000.ppm" (หรือ "outputimages-0000.jpg" หากเป็นรูปแบบที่ถูกต้อง) ตัวอย่าง. NET สามารถต่อ
กิ่ง

ข้อแม้คือว่ามันอาจจะไม่สามารถบันทึกไฟล์เป็น JPG แต่เป็น PPM
drzaus

11

คุณสามารถทำได้โดยใช้โปรแกรมอ่าน adobe:

  1. คลิกที่ภาพ มันจะถูกเน้น
  2. คัดลอก (Ctrl-C) และวางลงใน 'ระบายสี'
  3. บันทึกเป็นไฟล์ประเภทใดก็ได้ที่คุณชอบ

2
น่าสนใจที่ทราบว่า Adobe Reader มีการตั้งค่าเพื่อแทนที่ dpi ของภาพที่ถ่ายด้วยเครื่องมือ snapshot เมื่อตั้งค่าเป็น 300dpi คุณจะได้ภาพรวมที่พร้อมสำหรับการพิมพ์ (โดยค่าเริ่มต้นความละเอียดหน้าจอจะถูกถ่าย เพื่อนำกลับมาใช้ในงานอื่น)
Stijn Sanders

3
+1 เพื่อความง่าย โปรแกรมอ่าน PDF ส่วนใหญ่อนุญาตให้คุณทำเช่นนี้ได้
Decio Lira

4
จะเกิดอะไรขึ้นถ้า PDF ของคุณมี 10,000 หน้าของรูปภาพ? คุณต้องทำ 10,000 ครั้งนี้หรือไม่
Guy

9

ยกเว้นคำตอบที่กล่าวถึง pdfimages คำตอบอื่น ๆ ทั้งหมดไม่สามารถพูดถึงได้ว่าโซลูชันของพวกเขาแปลงรหัสรูปภาพที่ฝังไว้จริงๆ นั่นคือคำตอบเหล่านั้นไม่เพียง แต่ดึงภาพต้นฉบับออกมาเท่านั้น แต่ยังแก้ไขภาพได้อีกด้วยซึ่งอาจเป็นผลเสียต่อภาพในระหว่างกระบวนการ pdfimages เท่านั้นที่แยกภาพต้นฉบับ สิ่งนี้เป็นจริงของ Ghostscript, Imagemagick, Adobe Reader, PDFFill, PDF Xchange Viewer, OS X Preview และซอฟต์แวร์ PDF อื่น ๆ ส่วนใหญ่


ด้วยบริบทของคำถามนี่เป็นจุดที่ดีมาก
58

FWIW "เครื่องมือ PDFill PDF" ช่วยให้คุณตั้ง DPI สำหรับการบันทึกเป็นภาพที่มีประโยชน์มาก ดังนั้นแต่ละหน้า (เริ่มจากข้อความรูปภาพหรือวัตถุใด ๆ ) จะได้รับการบันทึกตัวอย่างเช่น PNG ความละเอียดสูงที่ 4961x6520
Chris O

4

เครื่องมือ PDFill PDFเป็นวิธีที่ง่ายกว่าในการแปลง PDF ของคุณเป็นรูปภาพใน Windows มันจะช่วยให้คุณสามารถส่งออกหน้าทั้งหมดใน PDF เพื่อแยกภาพในช็อตเดียว นอกจากนี้ยังมีคุณสมบัติอื่น ๆ อีกมากมายที่ให้บริการฟรีซึ่งมีเฉพาะในโปรแกรมดู PDF อื่น ๆ หากคุณซื้อรุ่นโฆษณาหรือ "Pro"

ใช้ปุ่ม "แปลง PDF เป็นรูปภาพ" (ปุ่ม # 10) ในภาพหน้าจอด้านล่าง

ภาพหน้าจอเครื่องมือ PDFill PDFill

หากคุณต้องการต่อภาพให้เป็นภาพที่มีความสูงมากดังนั้นคุณต้องป้อนไฟล์หนึ่งไฟล์ไปยังโปรแกรม OCR ของคุณคุณสามารถใช้IrfanView


โปรดทราบว่านี่จะติดตั้งเครื่องมือสองแบบที่แตกต่างกันในระบบของคุณ ตัวหลักเป็นตัวแก้ไข PDFill ซึ่งเป็นตัวที่คุณไม่ต้องการ ไปที่เมนูเริ่มเพื่อเปิดอันนี้ ฉันได้รับการบันทึกโดยภาพหน้าจอโดยตระหนักว่ามีบางอย่างผิดปกติก่อนที่จะถอนการติดตั้ง
ufotds

ใช่ฉันเดาว่าฉันไม่ได้พูดถึงว่าติดตั้ง PDFill Editor เวอร์ชันแชร์แวร์รวมถึงเครื่องพิมพ์ PDF ด้วย ไฟล์ใด ๆ ที่สร้างด้วยโปรแกรมแก้ไข PDFill จะมีลายน้ำเว้นแต่คุณจะซื้อโปรแกรมแก้ไขในราคา $ 19.99 แต่ยูทิลิตี้ PDFill PDF Tools ฟรีไม่จำเป็นต้องซื้อใด ๆ ในเวอร์ชันที่ฉันมีคุณไม่สามารถถอนการติดตั้งตัวแก้ไข PDFill โดยไม่ต้องถอนการติดตั้ง PDFill PDF Tools ฟรี แต่การติดตั้งตัวแก้ไข PDFill ไม่เป็นอันตรายอะไรเลย
ปล้น

2

เนื่องจากคุณไม่ได้รวมแท็ก OS ฉันจะรวมคำตอบ OSX:

PDF เป็นค่าเริ่มต้นเปิดใน Preview.app ซึ่งช่วยให้คุณใช้File -> Save-As:

  • GIF
  • ว่ายน้ำ
  • JPEG
  • JPEG-2000
  • BMP
  • OpenEXR
  • Photoshop
  • PNG
  • TGA
  • TIFF

1

นอกจากนี้PDF Xchange Viewer (ฟรี)จะทำการส่งออกเป็นไฟล์ ไฟล์→ส่งออก→ส่งออกไปยังรูปภาพ

ไม่เพียงแค่นั้น แต่ฉันคิดว่ามันเป็นโปรแกรมดู PDF ฟรีที่ดีที่สุดสำหรับ Windows และมีความสามารถในการมาร์กอัปที่ดี ฉันมีใบอนุญาตสำหรับ Adobe Acrobat และฉันยังคงชอบสิ่งนี้อยู่เว้นแต่ฉันจะทำการแก้ไขอย่างละเอียดซึ่งไม่ค่อยเกิดขึ้น


สิ่งนี้ดูมีแนวโน้มจนกระทั่งฉันค้นพบว่าตัวเลือกในการส่งออกไปยังรูปภาพถูกปิดใช้งานเนื่องจากไฟล์ PDF ที่มีรหัสผ่านปลอดภัย
มิทช์

1

(ไม่ใช่ฟรี) Acrobat professional ทำสิ่งนี้:

ขั้นสูง -> การประมวลผลเอกสาร -> ส่งออกภาพทั้งหมด ...


0

หากไฟล์มีขนาดน้อยกว่า 5MB และคุณไม่กังวลเกี่ยวกับความเป็นส่วนตัว / ความลับแสดงว่าเป็นบริการออนไลน์ที่มีประโยชน์ที่http://www.go2convert.com/ซึ่งสามารถแปลงกราฟิกจำนวนมากได้ (รวมถึง pdf เป็น jpeg)


เพิ่งลองและได้รับข้อความแสดงข้อผิดพลาด "ขออภัยภาพนี้ไม่สามารถแปลงได้อย่างถูกต้อง"
Guy

-1

หากภาพมีขนาดเกินกว่าขนาดหน้าจอของคุณคุณอาจใช้FastStone Capture (คุณสมบัติ "หน้าต่างการจับภาพเลื่อน") และบันทึกภาพเป็น JPEG

ข้อความแสดงแทน


นั่นเป็นวิธีที่วงเวียนมากในการคว้าภาพ OP มีวิธีแก้ปัญหาที่ดีกว่า (ทำเครื่องหมายหน้าใน Acrobat)
sleske

-1

คุณสามารถตรวจสอบบทความนี้

มันแสดงรายการ 6 วิธีต่าง ๆ ในการแปลง pdf เป็นรูปภาพ

แปลง PDF เป็น JPG (เว็บเวย์)

ตัวแปลง PDF เป็น JPG สำหรับเดสก์ท็อป


อืมมทำไมต้องลงคะแนน
noob
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.