เมื่อฉันคัดลอกข้อความออกจากไฟล์ PDF และลงในตัวแก้ไขข้อความมันจะจบลงด้วยการจัดการหลายวิธี การจัดรูปแบบเหมือนตัวหนาและตัวเอียงจะหายไป ตัวแบ่งบรรทัดที่อ่อนนุ่มภายในย่อหน้าของข้อความจะถูกแปลงเป็นตัวแบ่งบรรทัดที่ยาก เครื่องหมายขีดคั่นเพื่อแบ่งคำข้ามสองบรรทัดจะถูกเก็บรักษาไว้แม้ว่าจะไม่ควรเป็น และคำพูดเดี่ยวและคู่จะถูกแทนที่ด้วย? สัญญาณ
เป็นการดีที่ฉันต้องการที่จะสามารถคัดลอกข้อความจาก PDF และมีการจัดรูปแบบการแปลงเป็นรหัส HTML, "คำพูดสมาร์ท" แปลงเป็น "และ" และแบ่งบรรทัดอย่างถูกต้องมีวิธีการทำเช่นนี้?