ในการแลกเปลี่ยนเท็กซ์ TeX เราได้พูดคุยกันถึงวิธีการตรวจจับ "แม่น้ำ" ในย่อหน้าในคำถามนี้
ในบริบทนี้แม่น้ำเป็นแถบพื้นที่สีขาวซึ่งเป็นผลมาจากการจัดแนวระหว่างคำในช่องว่างโดยไม่ตั้งใจ ตั้งแต่นี้จะค่อนข้างกวนใจกับผู้อ่านแม่น้ำที่ไม่ดีจะถือเป็นอาการของการพิมพ์ที่ไม่ดี ตัวอย่างของข้อความที่มีแม่น้ำคือแม่น้ำสายนี้ที่มีแม่น้ำสองสายไหลตามแนวทแยงมุม
มีความสนใจในการตรวจจับแม่น้ำเหล่านี้โดยอัตโนมัติเพื่อให้สามารถหลีกเลี่ยงได้ (อาจเกิดจากการแก้ไขข้อความด้วยตนเอง) Raphink กำลังก้าวหน้าในระดับ TeX (ซึ่งรู้ตำแหน่งของ glyph และกล่อง bounding เท่านั้น) แต่ฉันรู้สึกมั่นใจว่าวิธีที่ดีที่สุดในการตรวจจับแม่น้ำคือการประมวลผลภาพบางส่วน (เนื่องจากรูปร่าง glyph มีความสำคัญมากและไม่สามารถใช้ได้กับ TeX) . ฉันได้ลองหลายวิธีในการดึงแม่น้ำออกจากภาพด้านบน แต่ความคิดง่ายๆของฉันในการใช้การเบลอของรูปวงรีในปริมาณเล็กน้อยดูเหมือนจะไม่ดีพอ ฉันยังลองเรดอนด้วยการกรองแบบ Hough ที่มีการแปลง แต่ฉันก็ไม่ได้อยู่กับสิ่งเหล่านั้น แม่น้ำนั้นมองเห็นได้ในวงจรตรวจจับคุณสมบัติของดวงตามนุษย์ / เรตินา / สมองและอย่างใดฉันก็คิดว่ามันน่าจะแปลได้ว่าเป็นการดำเนินการกรองบางอย่าง แต่ฉันไม่สามารถทำงานได้ ความคิดใด ๆ
โดยเฉพาะฉันกำลังมองหาการดำเนินการบางอย่างที่จะตรวจจับแม่น้ำสองสายในภาพด้านบน แต่ไม่มีการตรวจจับเชิงบวกที่ผิดพลาดอื่น ๆ จำนวนมากเกินไป
แก้ไข: endolith ถามว่าทำไมฉันกำลังทำตามวิธีการประมวลผลภาพเนื่องจากใน TeX เราสามารถเข้าถึงตำแหน่ง glyph, spacings และอื่น ๆ และมันอาจเร็วและเชื่อถือได้มากขึ้นในการใช้อัลกอริทึมที่ตรวจสอบข้อความจริง เหตุผลของฉันในการทำสิ่งต่าง ๆ ก็คือรูปร่างของร่ายมนตร์สามารถส่งผลกระทบต่อวิธีการที่เห็นได้ชัดเจนแม่น้ำและในระดับข้อความมันเป็นเรื่องยากมากที่จะพิจารณารูปร่างนี้ (ซึ่งขึ้นอยู่กับตัวอักษรในการให้ยืม ฯลฯ ) สำหรับตัวอย่างว่ารูปร่างของร่ายมนตร์มีความสำคัญอย่างไรให้พิจารณาตัวอย่างสองตัวอย่างต่อไปนี้ซึ่งความแตกต่างระหว่างพวกเขาคือฉันได้แทนที่ร่ายมนตร์สองสามตัวกับคนอื่นที่มีความกว้างเกือบเท่ากันดังนั้นการวิเคราะห์แบบข้อความจะพิจารณา พวกเขาเท่าเทียมกันดี / ไม่ดี อย่างไรก็ตามโปรดทราบว่าแม่น้ำในตัวอย่างแรกนั้นเลวร้ายยิ่งกว่าในแม่น้ำสายที่สอง
ImageLines[]
จาก Mathematica โดยมีและไม่มี preprocessing ฉันเดาว่านี่เป็นเทคนิคการใช้ Hough มากกว่าการแปลงเรดอน ฉันจะไม่แปลกใจถ้าการประมวลผลล่วงหน้าที่เหมาะสม (ฉันไม่ได้ลองใช้ตัวกรองการขยายที่แนะนำของ datageist) และ / หรือการตั้งค่าพารามิเตอร์สามารถทำให้การทำงานนี้