แยกข้อความ OCR จาก Evernote


13

OCR ในEvernoteทำภาพที่คุณบันทึกไว้ มีวิธีในการทำให้ข้อความเต็มเทียบเท่ากับภาพใน Evernote หรือเป็น OCR สำหรับการค้นหาเท่านั้นหรือไม่

คำตอบ:


15

Evernote API มีฟังก์ชันเพื่อรับข้อความและสี่เหลี่ยมผืนผ้าที่มีข้อความนี้อยู่ในภาพ ดูhttp://evernote.com/about/developer/api/evernote-api.htmดูที่"รูปแบบ XML ของ Evernote Recognition Index Recognition" และฟังก์ชั่นเพื่อเรียกดู ปัญหาคือพวกเขาไม่ได้ทำ OCR แบบดั้งเดิม ... อัลกอริทึม OCR ของพวกเขาอาจสร้างคำที่แตกต่างกันสำหรับ "คำเดียว" บนภาพ สิ่งที่พวกเขาใช้เพื่อค้นหาคือสิ่งนี้ดีสำหรับพวกเขา แต่ไม่เหมาะที่จะใช้เป็นเครื่องมือจดจำ (แม้ว่าพวกเขาจะให้น้ำหนักคุณสำหรับแต่ละคำทางเลือกดังนั้นบางทีคุณสามารถใช้มันได้)


11

และเห็นได้ชัดว่า Evernote ไม่ได้ตัดสินว่าภาพใดภาพหนึ่งเทียบเท่ากับหนึ่งคำอย่างแน่นอนเช่น Evernote ไม่ได้ตัดสินว่าภาพใดภาพหนึ่งเป็น "เงื่อนงำ" และไม่ใช่ "ครบกำหนด" ค่อนข้างจะติดตามทั้งสองและการค้นหาจะกลับภาพเดียวกัน ดังนั้นจึงไม่มีวิธีที่จะทำให้ข้อความแบบเต็มเทียบเท่ากันได้เนื่องจาก Evernote ไม่ได้ตัดสินว่าข้อความแบบเต็มจริงเพียงใด


5

Evernote จ่ายผลรวมที่ดีให้กับผู้สร้างของ ocr-stuff หรือจ่ายผลรวมที่เหมาะสมเพื่อให้บางสิ่งทำงานร่วมกัน ดังนั้นฉันสงสัยจริงๆว่าพวกเขาจะช่วยให้คุณได้รับข้อความที่แยก (ตำแหน่ง + บนภาพ)

(อาจเป็นรูปแบบธุรกิจในการสแกนภาพคนอื่น ๆ และให้ ocr ดี :))

ดังนั้นคำตอบคือ: ไม่


3
สิ่งนี้ไม่เป็นความจริง มี API สำหรับรับข้อมูลนี้อย่างแน่นอน ดูคำตอบของฉัน
ปีเตอร์ibrtibraný

2

ฉันไม่แน่ใจว่าคุณต้องการความซับซ้อนเพียงใด แต่เนื่องจากฉันยังใช้ Adobe Acrobat ฉันก็เพียงคลิกขวาที่ไฟล์แนบ Evernote ของฉันเพื่อเปิดด้วย Acrobat

จากภายใน Acrobat ฉันเลือก "Document | OCR text recognition" แล้วบันทึกเอกสารเป็นข้อความธรรมดา

สิ่งนี้ใช้ได้ดีสำหรับฉันเนื่องจากฉันต้องการการแปลง OCR เป็นครั้งคราวเท่านั้น


1

หากคุณสามารถนำภาพทั้งหมดออกจาก Evernote คุณสามารถทำ OCR ด้วย Google เอกสาร

คุณสามารถอัปโหลดโฟลเดอร์ภาพไปยัง Google เอกสารและแปลงเป็นเอกสารซึ่งจะมีทั้งรูปภาพและข้อความ OCR

จากนั้นคุณสามารถดาวน์โหลดเอกสารทั้งหมดเป็นชุดข้อความซึ่งจะตัดภาพ

หากคุณตั้งชื่อภาพ Evernote ทั้งหมดด้วยแฮช (เช่น md5 ) ควรลิงก์ไฟล์ข้อความธรรมดาที่ดาวน์โหลดจาก Google เอกสารด้วยภาพต้นฉบับได้ง่าย


0

ฉันใช้ Windows และใช้ Adobe Acrobat Pro และ Word ดังนั้นฉันจะทำสิ่งต่อไปนี้:

  1. หากไฟล์ไม่ถูกบันทึกเป็น JPG ให้คลิกไอคอนลูกตาที่มุมซ้ายบนของรูปภาพใน Evernote เพื่อเปิดใน Photo Viewer และคลิกไฟล์> "สร้างสำเนา" เพื่อบันทึกเป็น JPG
  2. เรียกดูไฟล์ภาพใน Explorer
  3. คลิกขวาที่มันแล้วเลือกแปลงเป็น Adobe PDF (ไฟล์จะเปิดใน Acrobat)
  4. คลิกไฟล์> บันทึกเป็นและเลือกรูปแบบ Rich Text จากรายการแบบเลื่อนลง "บันทึกเป็นประเภท" เพื่อบันทึกเป็นไฟล์ข้อความสมบูรณ์ (ใช้เวลาในการประมวลผลไฟล์หนึ่งนาที)
  5. เรียกดูไฟล์ RTF ใน Explorer และดับเบิลคลิกเพื่อเปิดใน Word
  6. แก้ไขตามความจำเป็น

นี่น่าจะเป็นคำแนะนำเกี่ยวกับวิธีดึงข้อความจากไฟล์ภาพที่ระบุไม่ใช่ภาพใน Evernote คุณสามารถอธิบายได้อย่างชัดเจนว่าวิธีนี้ตอบคำถามเดิมอย่างไรและไม่ตอบคำถามก่อนหน้านี้และคำตอบที่ยอมรับได้อย่างไร
music2myear
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.