คำถามติดแท็ก ascii

รูปแบบการเข้ารหัสอักขระตามลำดับตัวอักษรภาษาอังกฤษ ASCII ย่อมาจาก American Standard Code for Information Interchange

9
(grep) Regex จับคู่อักขระที่ไม่ใช่ ASCII หรือไม่
บน Linux ฉันมีไดเรกทอรีที่มีไฟล์จำนวนมาก บางคนมีอักขระที่ไม่ใช่ ASCII แต่พวกเขาจะถูกต้องทั้งหมดUTF-8 โปรแกรมหนึ่งมีข้อบกพร่องที่ป้องกันไม่ให้ทำงานกับชื่อไฟล์ที่ไม่ใช่ ASCII และฉันต้องค้นหาว่ามีผลกระทบกับจำนวนเท่าใด ฉันจะทำสิ่งนี้ด้วยfindแล้วทำgrepเพื่อพิมพ์อักขระที่ไม่ใช่ ASCII จากนั้นทำ a wc -lเพื่อค้นหาตัวเลข มันไม่จำเป็นต้องเป็น grep ฉันสามารถใช้นิพจน์ทั่วไปของ Unix มาตรฐานเช่นPerl , sed , AWKเป็นต้น อย่างไรก็ตามมีการแสดงออกปกติสำหรับ 'ตัวละครที่ไม่ใช่ตัวอักษร ASCII' หรือไม่?
169 regex  unicode  grep  ascii 



10
ความคิดที่อยู่เบื้องหลัง ^ = 32 คืออะไรที่แปลงตัวอักษรตัวพิมพ์เล็กเป็นตัวพิมพ์ใหญ่และในทางกลับกัน?
ฉันกำลังแก้ไขปัญหาบางอย่างใน codeforces โดยปกติฉันตรวจสอบก่อนว่าอักขระเป็นตัวอักษรภาษาอังกฤษตัวบนหรือล่างจากนั้นลบหรือเพิ่ม32เพื่อแปลงเป็นตัวอักษรที่เกี่ยวข้อง แต่ฉันพบว่ามีคนทำ^= 32เพื่อทำสิ่งเดียวกัน นี่มันคือ: char foo = 'a'; foo ^= 32; char bar = 'A'; bar ^= 32; cout << foo << ' ' << bar << '\n'; // foo is A, and bar is a ฉันค้นหาคำอธิบายสำหรับเรื่องนี้แล้วและไม่พบคำตอบ เหตุใดจึงใช้งานได้

5
แปลง int เป็น ASCII และกลับมาใน Python
ฉันกำลังดำเนินการสร้างตัวย่อ URL สำหรับไซต์ของฉันและแผนปัจจุบันของฉัน (ฉันเปิดรับข้อเสนอแนะ) คือการใช้ ID โหนดเพื่อสร้าง URL แบบย่อ ดังนั้นในทางทฤษฎีโหนด 26 อาจจะมีshort.com/zโหนด 1 อาจจะมีshort.com/aโหนด 52 อาจจะมีshort.com/Zและโหนด 104 short.com/ZZอาจจะมี เมื่อผู้ใช้ไปที่ URL นั้นฉันจำเป็นต้องย้อนกระบวนการ (ชัดเจน) ฉันคิดวิธีที่ไม่ดีในการดำเนินการนี้ได้ แต่ฉันเดาว่ามีวิธีที่ดีกว่านี้ ข้อเสนอแนะใด ๆ ?
145 python  integer  ascii  encode 

10
สตริง Python พิมพ์เป็น [u'String ']
Наэтотвопросестьответына กองมากเกินнарусском : покодировкам UTF-8 выдаетрезультатпо-разномуприпечатистрокпоотдельностиисписка целиком สิ่งนี้จะเป็นสิ่งที่ง่าย แต่ก็เป็นสิ่งที่หลอกลวงฉันจริงๆ ฉันมีสคริปต์ที่อ่านในหน้าเว็บและใช้Beautiful Soupเพื่อแยกวิเคราะห์ จากซุปฉันแยกลิงค์ทั้งหมดเป็นเป้าหมายสุดท้ายของฉันคือพิมพ์ลิงค์เนื้อหา ข้อความทั้งหมดที่ฉันกำลังวิเคราะห์คือ ASCII ฉันรู้ว่า Python ปฏิบัติกับสตริงเป็นยูนิโค้ดและฉันมั่นใจว่านี่เป็นประโยชน์อย่างมากโดยไม่ต้องใช้ในสคริปต์ของฉัน ทุกครั้งที่ฉันไปพิมพ์ตัวแปรที่มี 'String' ฉันจะ[u'String']พิมพ์ไปที่หน้าจอ มีวิธีง่ายๆในการทำให้มันกลับมาเป็นเพียง ascii หรือฉันควรเขียน regex เพื่อดึงมัน?
142 python  unicode  ascii 

6
ทำไมไพ ธ อนพิมพ์อักขระยูนิโค้ดเมื่อการเข้ารหัสเริ่มต้นคือ ASCII
จาก Python 2.6 shell: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> ฉันคาดว่าจะมีความพูดไม่ชัดหรือข้อผิดพลาดหลังจากคำสั่งพิมพ์เนื่องจากตัวอักษร "é" ไม่ได้เป็นส่วนหนึ่งของ ASCII และฉันไม่ได้ระบุการเข้ารหัส ฉันเดาว่าฉันไม่เข้าใจว่า ASCII หมายถึงการเข้ารหัสเริ่มต้นหมายความว่าอย่างไร แก้ไข ฉันย้ายการแก้ไขไปยังส่วนคำตอบและยอมรับตามที่แนะนำ



12
คำเตือน“ อักขระที่ไม่สามารถใช้งานได้สำหรับการเข้ารหัส” ใน Java
ฉันกำลังทำงานกับโปรเจ็กต์ Java ที่ส่งเสียงเตือนต่อไปนี้เมื่อฉันคอมไพล์: /src/com/myco/apps/AppDBCore.java:439: warning: unmappable character for encoding UTF8 [javac] String copyright = "� 2003-2008 My Company. All rights reserved."; ฉันไม่แน่ใจว่า SO จะแสดงอักขระก่อนวันที่อย่างไร แต่ควรเป็นสัญลักษณ์ลิขสิทธิ์และแสดงในคำเตือนเป็นเครื่องหมายคำถามในรูปเพชร เป็นที่น่าสังเกตว่าอักขระปรากฏในสิ่งประดิษฐ์เอาต์พุตอย่างถูกต้อง แต่คำเตือนนั้นสร้างความรำคาญและวันหนึ่งไฟล์ที่มีคลาสนี้อาจถูกสัมผัสโดยโปรแกรมแก้ไขข้อความที่บันทึกการเข้ารหัสอย่างไม่ถูกต้อง ... ฉันจะฉีดอักขระนี้ลงในสตริง "ลิขสิทธิ์" ได้อย่างไรเพื่อให้คอมไพเลอร์พอใจและสัญลักษณ์จะถูกเก็บรักษาไว้ในไฟล์โดยไม่มีปัญหาในการเข้ารหัสซ้ำ
113 java  encoding  utf-8  ascii 

15
วิธีรับค่า ASCII ของสตริงใน C #
ฉันต้องการรับค่า ASCII ของอักขระในสตริงใน C # ถ้าสตริงของฉันมีค่า "9quali52ty3" ฉันต้องการอาร์เรย์ที่มีค่า ASCII ของอักขระ 11 ตัวแต่ละตัว ฉันจะรับค่า ASCII ใน C # ได้อย่างไร
111 c#  encoding  ascii 


9
ข้อผิดพลาดการเข้ารหัส Python Unicode
ฉันกำลังอ่านและแยกวิเคราะห์ไฟล์ Amazon XML และในขณะที่ไฟล์ XML แสดงเครื่องหมาย 'เมื่อฉันพยายามพิมพ์ฉันได้รับข้อผิดพลาดต่อไปนี้: 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) จากสิ่งที่ฉันอ่านทางออนไลน์จนถึงตอนนี้ข้อผิดพลาดเกิดจากข้อเท็จจริงที่ว่าไฟล์ XML อยู่ใน UTF-8 แต่ Python ต้องการจัดการเป็นอักขระที่เข้ารหัส ASCII มีวิธีง่ายๆในการทำให้ข้อผิดพลาดหายไปและให้โปรแกรมของฉันพิมพ์ XML ตามที่อ่านหรือไม่
105 python  unicode  ascii  encode 

10
UTF-8 สามารถเข้ารหัสอักขระได้กี่ตัว?
ถ้า UTF-8 เป็น 8 บิตไม่ได้หมายความว่าจะมีอักขระที่แตกต่างกันได้สูงสุด 256 ตัวหรือไม่? จุดรหัส 128 รายการแรกเหมือนกับใน ASCII แต่มันบอกว่า UTF-8 สามารถรองรับได้ถึงล้านตัวอักษร? วิธีนี้ทำงานอย่างไร?

6
รหัส ASCII เป็น 7 บิตหรือ 8 บิต?
ครูของฉันบอกว่า ASCII เป็นรูปแบบการเข้ารหัสอักขระ 8 บิต แต่กำหนดไว้สำหรับรหัส 0-127 เท่านั้นซึ่งหมายความว่าสามารถใส่เป็น 7 บิตได้ ดังนั้นจึงไม่สามารถโต้แย้งได้ว่า ASCII bit เป็นรหัส 7 บิตจริงหรือ? และเราหมายถึงอะไรเมื่อพูดว่า ASCII เป็นรหัส 8 บิตเลย?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.