ไม่สามารถคัดลอกข้อความจากไฟล์ pdf


39

ฉันใช้โปรแกรมอ่าน PDF ของ foxit เพื่อดูหนังสือเรียน ฉันต้องการคัดลอกข้อความจากไฟล์ pdf ไปยังเอกสารคำ แต่จะไม่ให้ฉัน ฉันสามารถเลือกข้อความได้ดี แต่ไม่มีตัวเลือกในการคัดลอกข้อความ ฉันสามารถคัดลอกข้อความจากเอกสารอื่น แต่ไม่สามารถทำได้ มีวิธีใดบ้างที่จะได้รับการปกป้องในหน้าต่างนี้?


ฉันเห็นว่าคำตอบของฉันไม่ได้ผลสำหรับคุณดังนั้นคุณได้โพสต์เงินรางวัล หากคุณโพสต์ตัวอย่างของไฟล์ PDF เช่นนี้ฉันจะดูมัน
harrymc

@harrymc: โดยเฉพาะฉันกำลังมองหาเพื่อคัดลอกค่าจากตาราง 6.15 ของacousticslab.org/papers/VassilakisP2001Dissertation.pdf
endolith

@endolith: ดูคำตอบใหม่ของฉัน
harrymc

คำตอบ:


29

ไฟล์ pdf อาจถูกล็อคกับการคัดลอกข้อความ ด้านล่างมีสองวิธีในการปลดล็อค:

  1. หากไฟล์ PDF ไม่ได้ล็อคกับการพิมพ์คุณสามารถพิมพ์ไปยังเครื่องพิมพ์ pdf เสมือนเพื่อสร้างไฟล์ที่ปลดล็อค เห็นนี้:
    "รหัสผ่านถอดและปลดล็อคการป้องกันไฟล์ PDF ซึ่งได้รับอนุญาตที่จะพิมพ์โดยไม่ทราบความลับ"
  2. หากฟังก์ชั่นการพิมพ์ถูกล็อคออกเห็นนี้:
    "ลบข้อ จำกัด และถอดรหัสรหัสผ่านป้องกันไฟล์ PDF ด้วย PDF Unlocker"

คุณสามารถดูว่า PDF ถูกล็อคเพื่อคัดลอกหรือไม่ จากเมนูไฟล์เลือกคุณสมบัติและบนแท็บความปลอดภัยจะแจ้งว่าอนุญาตให้คัดลอกเนื้อหาได้หรือไม่
Rob Sedgwick

พยายามพิมพ์ PDF ไฟล์ที่พิมพ์ไม่อนุญาตให้เลือกข้อความดูเหมือนว่าเป็นการแปลงข้อความเป็นรูปภาพ
queezz

@queezz: PDF จะต้องมีภาพที่จะเริ่มต้นด้วย
harrymc

@harrymc ใช่มีรูปภาพ แต่ข้อความจะถูกแปลงเป็นรูปภาพด้วย ตัวเลือก Google Chrome ทำงานได้ดีบนเอกสารเดียวกัน
queezz

ลิงก์แรกของคุณเชื่อมโยงไปยังprimopdf.com/installers/4.0.1/FreewarePrimo64Setup.exe ซึ่งไม่ดีมันไม่ทำงานและดูเหมือนว่าคุณจะไม่เคยเก็บถาวรไปยัง archive.org ด้วยเช่นกัน ลิงก์ที่สองของคุณนั้นใช้ได้ แต่ลิงก์ไปยังไซต์แชร์ไฟล์dfiles.eu/files/7kiqyvswk ไฟล์นั้นโอเคแม้ว่าตรวจสอบด้วย virustotal แล้ว แต่ไม่ใช่เรื่องง่ายที่จะหาเพราะมีลิงค์ต่าง ๆ ในหน้า mydigitallife เป็นที่ซึ่งมันบอกว่า "PDF Unlocker เป็นเครื่องมือฟรีที่ใช้งานง่ายซึ่งสามารถดาวน์โหลดได้ผ่านลิงค์ที่นี่ (เวอร์ชั่นปัจจุบัน 1.0.4)"
barlop

25
  1. เปิด PDF ใน Google Chrome (ลากและวางไฟล์ PDF ไปยัง Chrome)
  2. พิมพ์หน้าเฉพาะเป็น PDF หรือเพียงแค่เปิดตัวอย่างก่อนพิมพ์
  3. ตอนนี้คุณสามารถคัดลอกข้อความจากตัวอย่างก่อนพิมพ์หรือส่งออก PDF แต่ฉันไม่คิดว่าคุณสามารถคัดลอกตารางโดยตรง

1
docs.google.co.th/open?id=0B0U0hneaP_FcYWprOFpEbTVqdkkดูผลลัพธ์ของฉัน
Khaleel

4
มันก็ใช้ได้กับฉันเช่นกัน นี่เป็นวิธีที่ง่ายที่สุดที่ฉันเห็นที่นี่
endolith

3
ยอดเยี่ยมอย่างแน่นอน โอ้คุณสามารถลากไฟล์ไปที่แถบแท็บของ Chrome เพื่อเปิดไฟล์ได้อย่างรวดเร็ว
iono

วิธีการเหล่านั้นไม่ได้ผลกับฉันใน Chrome 53 อาจมีการปิดช่องโหว่หรือไม่?
Simon East

11

ฉันสามารถสร้างไฟล์ PDF เวอร์ชัน DRM ของคุณได้ฟรีโดยใช้Ghostscript (ซึ่งมีให้สำหรับ Windows)

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf

แฟ้มผลstripped.pdfสามารถโหลดได้ใน Adobe Reader และอ่านอย่างมีความสุขจะช่วยให้คุณสามารถคัดลอกส่วนหนึ่งส่วนใดของมันที่คุณต้องการ มันยังคงการจัดรูปแบบส่วนใหญ่ของตาราง


อันนี้ยอดเยี่ยม นักบัญชีภาษีของฉันปฏิเสธที่จะให้ PDF ที่ไม่ใช่ DRM และรหัสผ่านเพื่อลบ DRM ให้ฉัน นี่เป็นการแก้ปัญหาของฉัน เยี่ยมมาก!
kevinarpe

หาก PDF มีรหัสผ่านตรวจสอบให้แน่ใจว่าได้ใส่-sPDFPasswordสวิตช์ ( -sPDFPassword=password) แล้ว
palswim

2

ฉันสามารถคัดลอกตารางจากไฟล์ PDF ของคุณสำเร็จโดยใช้ Okular (สำหรับ Linux; ส่วนหนึ่งของ KDE) ในการทำเช่นนี้ฉันต้องเข้าไปที่การตั้งค่าของ Okular และยกเลิกการเลือก "Obey DRM ข้อ จำกัด "

ฉันรู้ว่านี่ไม่ได้ช่วยอะไรคุณได้มากนักตั้งแต่คุณใช้ Windows แต่เป็นไปได้ถ้าคุณมีเครื่องลีนุกซ์ที่มีประโยชน์หรือยินดีที่จะติดตั้ง

น่าเสียดายที่มันเป็นข้อความธรรมดาที่ไม่มีการจัดรูปแบบ แต่ดูเหมือนว่าไม่น่าจะยากเกินกว่าจะสร้างตารางขึ้นมาใหม่ คุณสามารถดูผลลัพธ์ของสำเนาของฉันและวางการผจญภัยที่นี่


นั่นคือสิ่งที่ VirtualBox มีไว้สำหรับ : DI ยังสามารถคัดลอกข้อความธรรมดาโดยไม่ต้องจัดรูปแบบ แต่โดยการเลือกทีละหนึ่งคอลัมน์การส่งออกค่อนข้างง่าย
endolith

ดูเหมือนว่านี่จะดีที่สุดสำหรับตารางตัวเลขเนื่องจาก Okular ช่วยให้คุณสามารถเลือกข้อความสี่เหลี่ยมและแยกคอลัมน์เดียวตามลำดับ
endolith

สำหรับคอลัมน์เดียวอาจเป็นเช่นนั้น สำหรับตารางทั้งหมดดูคำตอบอื่น ๆ ของฉัน
Michael Hampton

โปรดทราบว่า Okular สามารถเรียกใช้บน Windows อันที่จริงซอฟต์แวร์ KDE จำนวนมากสามารถทำงานบน windowsได้
Bakuriu

1

คุณสามารถใช้ GT Text เป็นโปรแกรมที่แปลรูปภาพ (เช่น pdf snapshots = image) เป็นข้อความ คุณสามารถเลือกพื้นที่และคัดลอกไปยังคลิปบอร์ดได้ฟรี

หน้าแรกอย่างเป็นทางการคือ http://gttext.googlecode.com


1

หากการคัดลอกเป็นสีเทาเพราะในขณะนี้มันเป็นข้อสงสัยสำหรับคุณดังนั้น PDF นั้น 'ถูกล็อค' ก็สามารถอ่านได้ แต่เป็นการหยุดคุณจากการคัดลอก / วางอะไรจากมัน

เว็บไซต์นี้จะปลดล็อค PDF

https://smallpdf.com/unlock-pdf


0

หากคุณกำลังมองหาตัวอย่างสั้น ๆ คุณมักจะพิมพ์คำสองสามคำลงในเครื่องหมายอัญประกาศ google และค้นหาการอ้างอิงที่ถูกสแกนแล้วในรูปแบบอื่นหรือพิมพ์โดยบุคคลอื่น

ตัวเลือกอื่นคือ "เอกสารจากภาพถ่าย" ในแอป Google Docs Android ซึ่งจะใส่ข้อความผ่าน OCR แน่นอนว่าเป็นข้อผิดพลาดได้ง่าย

ฉันหวังว่าจะไม่มีฟังก์ชั่นการล็อค PDF :(


0

คำตอบสำหรับ endolith:

PDF ของคุณได้รับการคุ้มครองจากการคัดลอก แต่ไม่ได้รับการป้องกันจากการพิมพ์

ดังนั้นฉันจึงพิมพ์หน้าหนึ่งที่มีตาราง 6.15 ลงใน PDF อื่นที่ไม่ได้ป้องกันการคัดลอกเลือกและคัดลอกตารางจากนั้นวางลงใน Word ด้วยความประหลาดใจที่ยิ่งใหญ่ของฉันผลลัพธ์ของการวางเป็นขยะที่สุด

ตอนนี้ฉันดูตารางนี้เพิ่มเติมและพบผลลัพธ์ที่น่าประหลาดใจมาก: นี่ไม่ใช่ตาราง!

จริงๆแล้วมันคือการตัดต่อข้อความชิ้นเล็ก ๆ วางอยู่บนหน้ากระดาษเพื่อให้ดูเหมือนกับตาราง แต่นี่ไม่ใช่ตารางจริง

สิ่งที่ดีที่สุดที่คุณสามารถทำได้คือเขียนสิ่งทั้งหมดเป็นตารางหรือเพียงแค่ใช้ภาพหน้าจอของข้อความประกอบที่มีลักษณะคล้ายโต๊ะนี้

นี่คือภาพหน้าจอของตารางของฉันตามที่นำมาจากเอกสาร PDF แบบหน้าเดียวที่ฉันสร้าง :

ภาพ


ฉันพยายามพิมพ์ด้วย 2 โปรแกรม แต่ทั้งหมดที่ฉันได้รับคือหน้าเปล่า
endolith

ใช้Foxit Readerฉันวางตำแหน่งตัวเองบนหน้ากระดาษแล้วพิมพ์หน้าปัจจุบันไปยังเครื่องพิมพ์ pdf (ฉันใช้Cute Pdf Writer ) ผมจะพยายามที่จะวิเคราะห์ปัญหาด้วยการคัดลอกตารางในเย็นวันนี้
harrymc

ฉันพยายาม PrimoPDF และ qvPDF (ซึ่งใช้ GhostScript)
endolith

ดูการเพิ่มข้างต้นของฉัน
harrymc

... ฉันอัปโหลดไฟล์ PDF แบบหน้าเดียวของฉันไปที่นี่ด้วย (รอเวลา 60 วินาที)
harrymc

0

เป็นไปได้ก็คือEvince

ใน Windowsดูเหมือนว่าจะสนับสนุนการคัดลอกเป็นค่าเริ่มต้น

ในลินุกซ์, การคัดลอกสามารถเปิดใช้งานโดยการตรวจสอบoverride_restrictionsการตั้งค่าถ้ามันไม่ได้อยู่แล้วตามคำแนะนำเหล่านี้ ( dconf-editor→การ/org/gnome/evince→การoverride_restrictions)


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.