วิธีจับคู่อักขระภาษาจีนที่ดึงกับฐานข้อมูลของแอนิเมชั่นสโตรก


14

ฉันมีฐานข้อมูลของแอนิเมชั่นสโตรกตัวอักษรจีน แต่ละรายการนั้นเป็นชุดของจุดที่แสดงว่าควรวาดตัวละครอย่างไรและในลำดับใด

เพื่อให้การค้นหาง่ายขึ้นฉันต้องการอนุญาตให้ผู้ใช้วาดตัวละครด้วยเมาส์ด้วยตนเองจากนั้นซอฟต์แวร์ของฉันจะเสนอการจับคู่ที่เป็นไปได้ (เช่นเดียวกับที่ทำบน iPhone)

ฉันค้นหาใน Google แต่ไม่พบสิ่งที่เกี่ยวข้อง ฉันต้องการที่จะรู้ว่าอัลกอริทึมหรืองานวิจัยที่ฉันต้องดู ฉันเดาว่ามันเกี่ยวข้องกับการจดจำรูปร่างยกเว้นว่าลำดับที่วาด (ตัวอักษรจีน) นั้นเกี่ยวข้องกับรูปร่างใด ข้อเสนอแนะใด ๆ


2
ถึงคะแนนโหวตที่ใกล้ชิด: ข้อเสนอแนะใด ๆ เกี่ยวกับวิธีการปรับปรุงคำถาม ฉันรู้ว่ามันค่อนข้างคลุมเครือ แต่นี่เป็นเพราะฉันไม่รู้ว่าจะดูที่ไหน (ฉันไม่รู้ว่าชื่อของอัลกอริทึมที่ฉันกำลังค้นหาคืออะไร

1
หากคุณยังไม่มี Google สำหรับ 'การรู้จำลายมือ' และ 'การจดจำท่าทาง' ด้วยเช่นกันสิ่งเหล่านี้เกี่ยวข้องกับบางส่วน (ส่วนหนึ่ง) ด้วยกระบวนการวาดตัวอักษรรวมทั้งตัวละครที่สร้างขึ้น

หากจำนวนการสโตรกเท่ากันคุณสามารถจัดกลุ่มอักขระในฐานข้อมูลตาม #strokes และบอกทิศทาง (สมมติว่า 8 ทิศทางจากนั้นกลุ่มจะแสดงลำดับของตัวเลขในช่วง 1..8) แล้วเรียกใช้การจับคู่รูปร่างบางอย่างในกลุ่มที่แคบลง

คำตอบ:


5

คุณกำลังมองหาบทความทางวิชาการฉันประหลาดใจที่คุณไม่พบอะไรเลย นี่คือสิ่งที่การค้นหาอย่างรวดเร็วผ่าน Google Scholar ด้วยคำหลักpath stroke recognitionและhandwriting stroke recognitionให้ฉัน:

อีกสิ่งหนึ่งที่จะเพิ่ม: อ้างอิงล่าสุดในเครือที่กล่าวมาเป็นเช่นเดิมเป็น 2000 นั่นบ่งชี้ว่าสิ่งที่คุณต้องการทำน่าจะเป็นพื้นที่ที่ได้รับการวิจัยเป็นอย่างดีพร้อมด้วยเทคนิคที่ล้ำสมัย ไม่ควรมองหาวัสดุอ้างอิงอย่างหนัก

เพียงชี้แจงฉันไม่ได้อ่านบทความเหล่านี้ ฉันเพิ่งทำตามขั้นตอนการวิจัยเบื้องต้นตามปกติ: ไปที่ฐานข้อมูลบทความ (google scholar, mendeley, ieeexplore ... ) พิมพ์คำค้นหาไม่กี่คำ เปิดสิ่งที่มีชื่อเรื่องที่มีแนวโน้มปิดหนึ่งที่มีบทคัดย่อไม่น่าสนใจอย่างสมบูรณ์ อ่านบทคัดย่อที่เหลือให้ละเอียดยิ่งขึ้นและเลือกรายการที่เกี่ยวข้อง ต้องบอกว่าไม่ใช่บทความทั้งหมดที่ฉันเสนออาจมีความเกี่ยวข้อง แต่ตัดสินจากประสบการณ์พวกเขาอาจเป็น

ฉันหวังว่านี่จะช่วยได้. นอกจากนี้ถ้าคุณได้ทำวิจัยใด ๆ ในระหว่างนี้โปรดแก้ไขมันในคำถามของคุณและแบ่งปันกับชุมชน ดูเหมือนหัวข้อที่น่าสนใจ


0

คุณควรใช้เครือข่ายประสาทนั่นคือสิ่งที่ใช้สำหรับการรู้จำอักขระด้วยแสงฉันแน่ใจว่าคุณสามารถค้นหาข้อมูลเกี่ยวกับมันได้มากมายบน Google หากต้องการคำนึงถึงลำดับของเส้นคุณสามารถใช้ไม่เพียง แต่ภาพสุดท้ายเท่านั้น แต่ยังรวมถึงภาพกลางหลังจากแต่ละจังหวะ


ฉันได้ยินมาบ่อยครั้ง แต่ฉันไม่เคยพบเอ็นจิ้น OCR ที่บอกว่าใช้ NN คุณให้การอ้างอิงได้ไหม
Niki Estner
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.