ฉันจะ deskew และครอบตัด PDF ที่ทำจากหน้าที่สแกน * โดยอัตโนมัติ * ได้อย่างไร [ซ้ำ]


13

ซ้ำได้:
ซอฟต์แวร์ฟรีใดที่ฉันสามารถใช้กับรูปภาพที่สแกนได้

ฉันมี PDF หลายอันประกอบไปด้วยการสแกนหน้าหนังสือ การสแกนทำครั้งละสองหน้าและการสแกนบางส่วนเบ้ทำให้ข้อความเอียงเล็กน้อย

ฉันกำลังมองหาเครื่องมือที่ช่วยให้ฉันสามารถทำการปรับให้เหมาะสมอัตโนมัติโดยให้การสแกนเป็นแบบตั้งโต๊ะโดยไม่สูญเสียความสามารถในการอ่าน ฉันได้พบซอฟต์แวร์ GPL Brissเพื่อครอบตัดการสแกนเพื่อให้มีอัตราส่วน 1: 1 หน้าแทนที่จะเป็น 2: 1 แต่ฉันไม่มีเครื่องมือใด ๆ ในการเขียนหน้าเว็บ

ฉันสะดุดกระดาษที่ไม่ได้เขียนเครื่องมือโอเพนซอร์ซอีกอันที่เหมาะกับสิ่งที่ฉันต้องการ แต่เครื่องมือนั้นเป็นลินุกซ์เท่านั้นและมันไม่สามารถทำงานกับไฟล์ PDF ได้โดยตรง

คำใบ้ใด ๆ ที่ชื่นชม


1
@ สุ่ม: ทำไมคำถามนี้ถึงถูกปิด ?? ทำไมหัวข้อนี้ควรเรียกร้อง 'อภิปรายโต้แย้งโพลหรือการอภิปรายเพิ่มเติม'?!
Kurt Pfeifle

1
"การมองหาเครื่องมือ" เป็นการโพลที่ค่อนข้างมากสำหรับการบริการที่นำไปสู่เหตุผลที่ไม่สร้างสรรค์ @kur
random

1
@ สุ่ม: คำถามนี้ทำให้ฉันทำวิจัยเกี่ยวกับหัวข้อและฉันพบตัวเลือกที่น่าสนใจเพื่อโน้มน้าวใจ สิ่งที่น่าสนใจที่สุดคือการใช้ ImageMagick สำหรับเรื่องนี้และดูเหมือนง่ายอย่างน่าประหลาดใจ น่าเสียดายที่การปิดบัญชีของคุณไม่อนุญาตให้ฉันโพสต์คำตอบของฉัน
Kurt Pfeifle

@ สุ่ม: ตอนนี้ฉันแก้ไขคำถามแล้ว หวังว่าตอนนี้มันเป็นไปตามความรู้สึกของคุณของ 'ความสร้างสรรค์' มากขึ้น
Kurt Pfeifle

@ สุ่ม: ตกลง 'ปิดเป็นสำเนา' เป็นที่ยอมรับได้ดีสำหรับฉันในกรณีนี้
Kurt Pfeifle

คำตอบ:


9

ดูที่โต๊ะทำงาน มันเป็นเครื่องมือบรรทัดคำสั่ง zip ดาวน์โหลด * ดูเหมือนจะมีไบนารีสำหรับ Windows, MacOSX และ Linux

ใบอนุญาตคือ MPL (Mozilla) หรือ LPGL (GNU) ทุกอย่างที่คุณต้องการ

ข้อเสียเปรียบเพียงอย่างเดียวของคุณคือไม่ใช้ PDF เพียงแค่ภาพ PNG และ TIFF (AFAICS) นั่นหมายความว่าคุณจะต้องตั้งค่าเวิร์กโฟลว์เป็น s.th ชอบ:

 PDF.orig -> PNG.orig -> PNG.deskewed -> PDF.deskewed

ฉันยังไม่ได้ทดสอบด้วยตัวเอง (ยัง) ฉันเพิ่งเจอเว็บไซต์เมื่อเร็ว ๆ นี้และบุ๊กมาร์กไว้


deskewทำการจัดการเพื่อแก้ไขความผิดเพี้ยนที่เกี่ยวข้องกับการหมุนในการทดสอบของฉัน แต่น่าเสียดายที่มันมีเส้นสีเทาบาง ๆ ที่ตำแหน่งของเส้นขอบภาพต้นฉบับ เพื่อกำจัดของเส้นขอบสีเทาผมตัดภาพที่มีตัวเลือกในการ-extent mogrifyฉันทดสอบบน OS X เท่านั้นบางทีความไม่เหมาะสมนี้เป็นเฉพาะแพลตฟอร์ม
Stefan Schmidt

deskewทำงานได้ดีจริงๆ เวิร์กโฟลว์ของฉันเป็นเช่นนี้: pdfimages -all <pdf> my_imagesjbig2 -s -p -v my_images* > outputpdf.py output > deskewed.pdfหากเส้นขอบสีดำ (ผลจากการดำเนินการ deskewing) รบกวนคุณการประมวลผลบางอย่างด้วยimagemagickอาจจำเป็นเช่นแนะนำโดย @StefanSchmidt
Mr. Tao

5

โอ้ให้ฉันเพิ่มคำตอบอื่น ฉันเพียงแค่จำNetpbm ยังไม่ได้ใช้ในปี แต่ฉันคิดว่าฉันควรจะดูสด ...

netpbm เป็นชุดเครื่องมือที่ทรงพลังมากสำหรับ commandline เพื่อจัดการภาพกราฟิก มีเครื่องมือแยกต่างหากเกือบ 300 รายการ มันมีตัวแปลงประมาณ 100 รูปแบบกราฟิก

และมันยังมีเครื่องมือ commandline ที่สามารถหมุนภาพได้:

pnmrotate

และมีเครื่องมืออื่นที่พยายามค้นหามุมของภาพที่หมุน:

pamtilt

pamtiltส่งคืนจำนวนลอยตัวของการเดาการหมุนภาพ ดังนั้นการยกเลิกการบิดเบือนภาพอัตโนมัติจึงควรอยู่ไม่ไกลเกินเอื้อม เชลล์สคริปต์สามารถเขียนให้ทำเช่นนั้นได้ มันจะต้องมีขั้นตอนต่าง ๆ :

  1. แปลงหน้า PDF เป็นรูปแบบภาพที่เหมาะกับ netpbm ด้วยความช่วยเหลือของ Ghostscript
  2. ใช้pamtiltเพื่อค้นหามุมเอียงของภาพโดยอัตโนมัติ
  3. ใช้pnmrotateเพื่อยกเลิกการเอียงภาพ
  4. แปลงรูปภาพเป็น PDF อีกครั้ง

หากคุณให้สิทธิ์ฉันในการเข้าถึงตัวอย่างไฟล์ PDF ขนาดเล็กของคุณฉันสามารถลองใช้ shell script เพื่อทำเพลงให้สำเร็จ


(ฉันสงสัยอย่างมากว่า [netpbm] ไม่ได้มีแท็กใน superuser + stackoverflow ที่นี่)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.