เครื่องมือหรือวิธีที่เร็วที่สุดและง่ายที่สุดในการแปลงไฟล์ข้อความระหว่างชุดอักขระคืออะไร
โดยเฉพาะฉันต้องแปลงจาก UTF-8 เป็น ISO-8859-15 และในทางกลับกัน
ทุกอย่างเป็นไปได้: หนึ่งใน liners ในภาษาสคริปต์ที่คุณชื่นชอบ, เครื่องมือบรรทัดคำสั่งหรือยูทิลิตี้อื่น ๆ สำหรับ OS, เว็บไซต์, ฯลฯ
ทางออกที่ดีที่สุด:
บน Linux / UNIX / OS X / cygwin:
Gnu iconvแนะนำโดยTroels อาร์วินดีที่สุดคือใช้เป็นตัวกรอง ดูเหมือนว่าจะมีอยู่ทั่วไป ตัวอย่าง:
$ iconv -f UTF-8 -t ISO-8859-15 in.txt > out.txt
ในฐานะที่เป็นแหลมออกโดยเบนมีการแปลงออนไลน์โดยใช้ iconv
Gnu Recode ( คู่มือ ) แนะนำโดยCheekysoftจะแปลงหนึ่งหรือหลายไฟล์ในสถานที่ ตัวอย่าง:
$ recode UTF8..ISO-8859-15 in.txt
อันนี้ใช้นามแฝงที่สั้นกว่า:
$ recode utf8..l9 in.txt
Recode ยังรองรับพื้นผิวที่สามารถใช้ในการแปลงระหว่างประเภทการสิ้นสุดบรรทัดและการเข้ารหัสที่แตกต่างกัน:
แปลงบรรทัดใหม่จาก LF (Unix) เป็น CR-LF (DOS):
$ recode ../CR-LF in.txt
Base64 ไฟล์เข้ารหัส:
$ recode ../Base64 in.txt
คุณสามารถรวมมันเข้าด้วยกัน
แปลงไฟล์ UTF8 Base64 เข้ารหัสด้วยระบบปฏิบัติการยูนิกซ์ปลายสายที่จะเข้ารหัส Base64 ละติน 1 ไฟล์กับดอสตอนจบบรรทัด:
$ recode utf8/Base64..l1/CR-LF/Base64 file.txt
บน Windows ด้วยPowershell ( Jay Bazuzi ):
PS C:\> gc -en utf8 in.txt | Out-File -en ascii out.txt
(ไม่ ISO-8859-15 สนับสนุนแม้ว่า;. มันบอกว่าชุดอักขระที่สนับสนุน Unicode, UTF7, utf8, utf32, ASCII, bigendianunicode เริ่มต้นและ OEM)
แก้ไข
คุณหมายถึง iso-8859-1 การใช้ "String" ทำสิ่งนี้เช่นในทางกลับกัน
gc -en string in.txt | Out-File -en utf8 out.txt
หมายเหตุ: ค่าการแจงนับที่เป็นไปได้คือ "Unknown, String, Unicode, Byte, BigEndianUnicode, UTF8, UTF7, Ascii"
- CsCvt - ตัวแปลงชุดอักขระของ Kalytta เป็นเครื่องมือการแปลงบรรทัดคำสั่งที่ยอดเยี่ยมอีกตัวสำหรับ Windows
recode
จะทำหน้าที่เป็นตัวกรองเช่นกันหากคุณไม่ผ่านชื่อไฟล์ใด ๆ เช่น:recode utf8..l9 < in.txt > out.txt
enca
คุณไม่จำเป็นต้องระบุการเข้ารหัสอินพุต enca -L ru -x utf8 FILE.TXT
มันมักจะพอเพียงที่จะระบุภาษา:
iconv -f UTF-32 -t UTF-8 input.csv > output.csv
บันทึกไว้เพียงประมาณเจ็ดร้อยพันสายเพียงหนึ่งในสาม การใช้เวอร์ชันในสถานที่iconv -f UTF-32 -t UTF-8 file.csv
แปลงเรียบร้อยแล้วบวก 2 ล้านเส้นทั้งหมด
gc -en Ascii readme.html | Out-File -en UTF8 readme.html
แต่มันแปลงไฟล์เป็น utf-8 แต่แล้วมันว่างเปล่า! Notepad ++ บอกว่าไฟล์เป็นรูปแบบ Ansi แต่อ่านเพราะผมเข้าใจว่ามันไม่ใช่ charset ที่ใช้ได้ ?? uk.answers.yahoo.com/question/index?qid=20100927014115AAiRExF