คำถามติดแท็ก encoding

การเข้ารหัสเป็นชุดของกฎที่กำหนดไว้ล่วงหน้าเพื่อเปลี่ยนชิ้นส่วนของข้อมูลย้อนกลับในการนำเสนอบางอย่างให้เป็นการนำเสนอที่แตกต่างกันโดยสิ้นเชิง อีกวิธีหนึ่งเรียกว่าการถอดรหัส แท็กนี้ค่อนข้างทั่วไป แต่ส่วนใหญ่จะใช้สำหรับแผนการเข้ารหัสไบนารีเช่นฐาน 64 และเลขฐานสิบหก

6
“ \ d” ใน regex หมายถึงตัวเลขหรือไม่
ผมพบว่าใน123, \dการแข่งขัน1และแต่ไม่3 2ฉันสงสัยว่า\dตรงกับหลักที่พอใจความต้องการชนิดใด ฉันกำลังพูดถึง regex สไตล์หลาม ปลั๊กอินนิพจน์ปกติใน Gedit ใช้ Python style regex ฉันสร้างไฟล์ข้อความที่มีเนื้อหาอยู่ 123 เฉพาะ1และ3จับคู่โดย regex \d; 2ไม่ใช่. โดยทั่วไปสำหรับลำดับของตัวเลขหลักที่ไม่มีอักขระอื่น ๆ ในระหว่างนั้นจะมีเพียงเลขลำดับคี่เท่านั้นที่ตรงกันและเลขคู่นั้นไม่ตรงกัน ยกตัวอย่างเช่นในการ12345แข่งขันที่มี1, และ35
147 python  regex  encoding  gedit 

6
ฉันจะแปลงสตริงเป็น UTF-8 ใน C # ได้อย่างไร
ฉันมีสตริงที่ฉันได้รับจากแอพของบุคคลที่สามและฉันต้องการแสดงอย่างถูกต้องในภาษาใด ๆ โดยใช้ C # บน Windows Surface ของฉัน เนื่องจากการเข้ารหัสที่ไม่ถูกต้องส่วนหนึ่งของสตริงของฉันมีลักษณะเช่นนี้ในภาษาสเปน: Acción ในขณะที่ควรมีลักษณะเช่นนี้: Acción ตามคำตอบของคำถามนี้: จะรู้ได้อย่างไรว่าการเข้ารหัสสตริงใน C #การเข้ารหัสที่ฉันได้รับควรมาที่ UTF-8 แล้ว แต่มันถูกอ่านใน Encoding.Default (อาจเป็น ANSI) ฉันกำลังพยายามแปลงสตริงนี้เป็น UTF-8 จริง แต่ปัญหาอย่างหนึ่งคือฉันเห็นเฉพาะเซ็ตย่อยของคลาสการเข้ารหัส (คุณสมบัติ UTF8 และ Unicode เท่านั้น) อาจเป็นเพราะฉัน จำกัด Windows window API เท่านั้น ฉันลองใช้ตัวอย่างบางส่วนที่ฉันพบบนอินเทอร์เน็ต แต่ก็ไม่มีสิ่งใดที่พิสูจน์แล้วว่าประสบความสำเร็จสำหรับภาษาตะวันออก (เช่นภาษาเกาหลี) ตัวอย่างหนึ่งมีดังนี้: var utf8 = Encoding.UTF8; byte[] utfBytes = utf8.GetBytes(myString); …

11
เปลี่ยนการเข้ารหัสเริ่มต้นของ Python หรือไม่
ฉันมีปัญหา "ไม่สามารถเข้ารหัส" และ "ถอดรหัสไม่ได้" กับPythonเมื่อฉันเรียกใช้แอปพลิเคชันของฉันจากคอนโซล แต่ในEclipse PyDev IDE การเข้ารหัสอักขระเริ่มต้นถูกตั้งค่าเป็นUTF-8และฉันไม่เป็นไร ฉันค้นหารอบ ๆ เพื่อตั้งค่าการเข้ารหัสเริ่มต้นและผู้คนบอกว่า Python ลบsys.setdefaultencodingฟังก์ชันเมื่อเริ่มต้นและเราไม่สามารถใช้งานได้ ดังนั้นทางออกที่ดีที่สุดสำหรับมันคืออะไร?

4
สิ่งนี้มาจากไหน: - * - coding: utf-8 - * -
Python รับรู้สิ่งต่อไปนี้เป็นคำสั่งซึ่งกำหนดการเข้ารหัสของไฟล์: # -*- coding: utf-8 -*- ฉันเคยเห็นคำแนะนำประเภทนี้มาก่อน ( -*- var: value -*-) มันมาจากไหน? ข้อกำหนดทั้งหมดคืออะไรเช่นค่าสามารถรวมช่องว่างสัญลักษณ์พิเศษขึ้นบรรทัดใหม่หรือแม้แต่-*-ตัวมันเอง โปรแกรมของฉันจะเขียนไฟล์ข้อความธรรมดาและฉันต้องการรวมข้อมูลเมตาบางส่วนไว้ในไฟล์โดยใช้รูปแบบนี้
142 python  file  text  encoding  emacs 

7
C # มีคุณสมบัติเทียบเท่ากับ encodeURIComponent () ของ JavaScript หรือไม่
ใน JavaScript: encodeURIComponent("©√") == "%C2%A9%E2%88%9A" มีแอปพลิเคชัน C # เทียบเท่าหรือไม่? สำหรับการหลีกเลี่ยงอักขระ HTML ที่ฉันใช้: txtOut.Text = Regex.Replace(txtIn.Text, @"[\u0080-\uFFFF]", m => @"&#" + ((int)m.Value[0]).ToString() + ";"); แต่ฉันไม่แน่ใจว่าจะแปลงการจับคู่เป็นรูปแบบเลขฐานสิบหกที่ถูกต้องที่ JS ใช้อย่างไร ตัวอย่างเช่นรหัสนี้: txtOut.Text = Regex.Replace(txtIn.Text, @"[\u0080-\uFFFF]", m => @"%" + String.Format("{0:x}", ((int)m.Value[0]))); ผลตอบแทน " %a9%221a"สำหรับ"©√"แทน"%C2%A9%E2%88%9A". ดูเหมือนว่าฉันจะต้องแยกสตริงขึ้นไปไบต์หรือบางสิ่งบางอย่าง แก้ไข: นี่คือสำหรับ app หน้าต่างรายการเดียวที่มีอยู่ในSystem.WebคือAspNetHostingPermission, และAspNetHostingPermissionAttributeAspNetHostingPermissionLevel

15
Java: วิธีกำหนดการเข้ารหัส charset ที่ถูกต้องของสตรีม
โดยอ้างถึงเธรดต่อไปนี้: Java App: ไม่สามารถอ่านไฟล์ที่เข้ารหัส iso-8859-1 ได้อย่างถูกต้อง วิธีที่ดีที่สุดในการกำหนดการเข้ารหัสชุดอักขระของอินพุตสตรีม / ไฟล์โดยทางโปรแกรมคืออะไร ฉันได้ลองใช้สิ่งต่อไปนี้: File in = new File(args[0]); InputStreamReader r = new InputStreamReader(new FileInputStream(in)); System.out.println(r.getEncoding()); แต่ในไฟล์ที่ฉันรู้ว่าเข้ารหัสด้วย ISO8859_1 โค้ดข้างต้นให้ผลว่า ASCII ซึ่งไม่ถูกต้องและไม่อนุญาตให้ฉันแสดงผลเนื้อหาของไฟล์กลับไปที่คอนโซลอย่างถูกต้อง


6
ทำไมไพ ธ อนพิมพ์อักขระยูนิโค้ดเมื่อการเข้ารหัสเริ่มต้นคือ ASCII
จาก Python 2.6 shell: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> ฉันคาดว่าจะมีความพูดไม่ชัดหรือข้อผิดพลาดหลังจากคำสั่งพิมพ์เนื่องจากตัวอักษร "é" ไม่ได้เป็นส่วนหนึ่งของ ASCII และฉันไม่ได้ระบุการเข้ารหัส ฉันเดาว่าฉันไม่เข้าใจว่า ASCII หมายถึงการเข้ารหัสเริ่มต้นหมายความว่าอย่างไร แก้ไข ฉันย้ายการแก้ไขไปยังส่วนคำตอบและยอมรับตามที่แนะนำ

11
“ ’” แสดงบนหน้าแทนที่จะเป็น“ '”
’'มีการแสดงบนหน้าเว็บของฉันแทน ฉันContent-Typeตั้งค่าเป็นUTF-8ทั้งใน<head>แท็กและส่วนหัว HTTP ของฉัน: <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> นอกจากนี้เบราว์เซอร์ของฉันถูกตั้งค่าเป็นUnicode (UTF-8): ปัญหาคืออะไรและฉันจะแก้ไขได้อย่างไร
133 encoding  utf-8  mojibake 

10
URL ได้รับอนุญาตให้มีช่องว่างหรือไม่
URI (โดยเฉพาะ HTTP URL) ได้รับอนุญาตให้มีอักขระเว้นวรรคอย่างน้อยหนึ่งตัวหรือไม่? หากต้องเข้ารหัสURL เป็น+เพียงรูปแบบที่ปฏิบัติตามกันทั่วไปหรือเป็นทางเลือกอื่นที่ถูกต้อง? โดยเฉพาะอย่างยิ่งใครบางคนสามารถชี้ไปที่ RFC ที่ระบุว่าต้องเข้ารหัสURL ที่มีช่องว่างได้หรือไม่ แรงจูงใจสำหรับคำถาม:ในขณะทดสอบเบต้าเว็บไซต์ฉันสังเกตเห็นว่า URL บางรายการถูกสร้างขึ้นโดยมีช่องว่างอยู่ Firefox ดูเหมือนจะทำในสิ่งที่ถูกต้องซึ่งทำให้ฉันประหลาดใจ! แต่ฉันต้องการให้นักพัฒนาไปที่ RFC เพื่อที่พวกเขาจะรู้สึกว่าจำเป็นต้องแก้ไข URL เหล่านั้น
132 html  http  url  encoding 

6
ปัญหาการเข้ารหัส Java FileReader
ฉันพยายามใช้ java.io.FileReader เพื่ออ่านไฟล์ข้อความและแปลงเป็นสตริง แต่ฉันพบว่าผลลัพธ์นั้นเข้ารหัสผิดและไม่สามารถอ่านได้เลย นี่คือสภาพแวดล้อมของฉัน: Windows 2003, การเข้ารหัสระบบปฏิบัติการ: CP1252 Java 5.0 ไฟล์ของฉันเข้ารหัส UTF-8 หรือเข้ารหัส CP1252 และบางไฟล์ (ไฟล์ที่เข้ารหัส UTF-8) อาจมีอักขระจีน (ไม่ใช่ละติน) ฉันใช้รหัสต่อไปนี้เพื่อทำงานของฉัน: private static String readFileAsString(String filePath) throws java.io.IOException{ StringBuffer fileData = new StringBuffer(1000); FileReader reader = new FileReader(filePath); //System.out.println(reader.getEncoding()); BufferedReader reader = new BufferedReader(reader); char[] buf = new char[1024]; int …
130 java  file  unicode  encoding 

9
กำหนดการเข้ารหัสของสตริงใน C #
มีวิธีใดในการกำหนดการเข้ารหัสของสตริงใน C # หรือไม่? สมมติว่าฉันมีสตริงชื่อไฟล์ แต่ฉันไม่รู้ว่ามีการเข้ารหัสในUnicode UTF-16 หรือการเข้ารหัสเริ่มต้นของระบบฉันจะทราบได้อย่างไร
127 c#  string  encoding 


9
การเข้ารหัส Base64 ใน SQL Server 2005 T-SQL
ฉันต้องการเขียนแบบสอบถาม T-SQL โดยที่ฉันเข้ารหัสสตริงเป็นสตริง Base64 น่าแปลกที่ฉันไม่พบฟังก์ชัน T-SQL ดั้งเดิมสำหรับการเข้ารหัส Base64 มีฟังก์ชันดั้งเดิมหรือไม่? ถ้าไม่วิธีที่ดีที่สุดในการเข้ารหัส Base64 ใน T-SQL คืออะไร?

5
ทำไมประกาศ Unicode ด้วยสตริงใน python
ฉันยังเรียน python อยู่และมีข้อสงสัย: ใน python 2.6.x ฉันมักจะประกาศการเข้ารหัสในส่วนหัวของไฟล์เช่นนี้ (เช่นเดียวกับในPEP 0263 ) # -*- coding: utf-8 -*- หลังจากนั้นสตริงของฉันจะถูกเขียนตามปกติ: a = "A normal string without declared Unicode" แต่ทุกครั้งที่ฉันเห็นรหัสโครงการ python การเข้ารหัสจะไม่ถูกประกาศที่ส่วนหัว แต่จะมีการประกาศทุกสตริงดังนี้: a = u"A string with declared Unicode" อะไรคือความแตกต่าง? จุดประสงค์ของสิ่งนี้คืออะไร? ฉันรู้ว่า Python 2.6.x ตั้งค่าการเข้ารหัส ASCII ตามค่าเริ่มต้น แต่สามารถลบล้างได้ด้วยการประกาศส่วนหัวดังนั้นจุดของการประกาศต่อสตริงคืออะไร? ภาคผนวก:ดูเหมือนว่าฉันผสมการเข้ารหัสไฟล์กับการเข้ารหัสสตริง ขอบคุณที่อธิบาย :)
122 python  encoding  utf-8 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.