คำถามติดแท็ก diacritics

8
วิธีที่ดีที่สุดในการลบเครื่องหมายเน้นเสียงในสตริง Python unicode คืออะไร
ฉันมีสตริง Unicode ใน Python และฉันต้องการที่จะลบสำเนียงทั้งหมด (กำกับออกเสียง) ฉันพบบนเว็บเป็นวิธีที่ยอดเยี่ยมในการทำเช่นนี้ใน Java: แปลงสตริง Unicode เป็นรูปแบบปกติที่มีความยาว (โดยมีอักขระแยกต่างหากสำหรับตัวอักษรและกำกับเสียง) ลบอักขระทั้งหมดที่มีชนิด Unicode เป็น "diacritic" ฉันจำเป็นต้องติดตั้งไลบรารี่เช่น pyICU หรือเป็นไปได้หรือไม่กับไลบรารี่มาตรฐานของไพ ธ อน และไพ ธ อน 3 เป็นอย่างไร? หมายเหตุสำคัญ: ฉันต้องการหลีกเลี่ยงรหัสที่มีการแมปที่ชัดเจนจากอักขระที่เน้นเสียงไปยังคู่ที่ไม่ได้เน้นเสียง

29
ลบเครื่องหมายเน้นเสียง / การกำกับเสียงในสตริงใน JavaScript
ฉันจะลบอักขระที่เน้นเสียงออกจากสตริงได้อย่างไร โดยเฉพาะอย่างยิ่งใน IE6 ฉันมีสิ่งนี้: accentsTidy = function(s){ var r=s.toLowerCase(); r = r.replace(new RegExp(/\s/g),""); r = r.replace(new RegExp(/[àáâãäå]/g),"a"); r = r.replace(new RegExp(/æ/g),"ae"); r = r.replace(new RegExp(/ç/g),"c"); r = r.replace(new RegExp(/[èéêë]/g),"e"); r = r.replace(new RegExp(/[ìíîï]/g),"i"); r = r.replace(new RegExp(/ñ/g),"n"); r = r.replace(new RegExp(/[òóôõö]/g),"o"); r = r.replace(new RegExp(/œ/g),"oe"); r = r.replace(new RegExp(/[ùúûü]/g),"u"); r …

19
ฉันจะลบเครื่องหมายการออกเสียง (เน้นเสียง) จากสตริงใน. NET ได้อย่างไร
ฉันพยายามที่จะแปลงสตริงที่อยู่ในฝรั่งเศสแคนาดาและโดยทั่วไปฉันต้องการที่จะสามารถใช้เครื่องหมายเน้นเสียงภาษาฝรั่งเศสในตัวอักษรในขณะที่เก็บจดหมาย (เช่นแปลงéเป็นeดังนั้นcrème brûléeจะกลายเป็นcreme brulee) อะไรคือวิธีที่ดีที่สุดในการบรรลุเป้าหมายนี้?
433 .net  string  diacritics 

12
มีวิธีกำจัดสำเนียงและแปลงสตริงทั้งหมดเป็นตัวอักษรปกติหรือไม่?
มีวิธีที่ดีกว่าสำหรับการกำจัดสำเนียงและทำให้ตัวอักษรเหล่านั้นเป็นประจำนอกเหนือจากการใช้String.replaceAll()วิธีการและการเปลี่ยนตัวอักษรทีละตัว ตัวอย่าง: การป้อนข้อมูล: orčpžsíáýd เอาท์พุท: orcpzsiayd ไม่จำเป็นต้องรวมตัวอักษรทั้งหมดด้วยสำเนียงเหมือนตัวอักษรรัสเซียหรือตัวอักษรจีน
263 java  string  diacritics 

22
Microsoft Excel จัดการการออกเสียงในไฟล์. csv หรือไม่
ฉันกำลังส่งออกข้อมูลทางโปรแกรม (โดยใช้ PHP 5.2) ไปยังไฟล์ทดสอบ. csv ข้อมูลตัวอย่าง: Numéro 1(สังเกต e ที่เน้นเสียง) ข้อมูลคือutf-8(ไม่มี BOM ที่จ่ายล่วงหน้า) เมื่อเปิดไฟล์นี้ใน MS Excel Numéro 1เป็นแสดงเป็น ฉันสามารถเปิดสิ่งนี้ในโปรแกรมแก้ไขข้อความ (UltraEdit) ซึ่งแสดงอย่างถูกต้อง UE decimal 233รายงานตัวอักษรเป็น ฉันจะส่งออกข้อมูลตัวอักษรในไฟล์. csv ได้อย่างไรเพื่อให้MS Excel แสดงผลได้อย่างถูกต้องโดยไม่บังคับให้ใช้ตัวช่วยสร้างการนำเข้าหรือการตั้งค่าตัวช่วยที่ไม่ใช่ค่าเริ่มต้น

12
การแปลงสัญลักษณ์ตัวอักษรเน้นเสียงเป็นตัวอักษรภาษาอังกฤษ
ปัญหาคืออย่างที่คุณทราบมีอักขระหลายพันตัวในแผนภูมิ Unicodeและฉันต้องการแปลงอักขระที่คล้ายกันทั้งหมดเป็นตัวอักษรที่เป็นตัวอักษรภาษาอังกฤษ ตัวอย่างเช่นนี่คือการแปลงบางส่วน: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy --> the Family ... และฉันเห็นว่ามีตัวอักษร A / a มากกว่า 20 เวอร์ชัน และฉันไม่รู้ว่าจะจัดประเภทอย่างไร ดูเหมือนเข็มในกองหญ้า รายการที่สมบูรณ์ของตัวอักษร Unicode ที่http://www.ssec.wisc.edu/~tomw/java/unicode.html หรือhttp://unicode.org/charts/charindex.html เพียงแค่ลองเลื่อนลงและดูรูปแบบของตัวอักษร ฉันจะแปลงสิ่งเหล่านี้ด้วย Java ได้อย่างไร โปรดช่วยฉัน :(

12
ลบเครื่องหมายกำกับเสียง (ńǹňñṅņṇṋṉ̈ɲƞᶇɳȵ) จากตัวอักษร Unicode
ฉันกำลังมองหาที่อัลกอริทึมที่สามารถ map ระหว่างตัวอักษรกำกับ ( ตัวหนอน , หมวก , ลูกศร , เครื่องหมาย , รอน ) และ "ง่าย" ของพวกเขาตัวอักษร ตัวอย่างเช่น: ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ --> n á --> a ä --> a ấ --> a ṏ --> o ฯลฯ ฉันต้องการทำสิ่งนี้ใน Java …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.