คำถามติดแท็ก ascii

รูปแบบการเข้ารหัสอักขระตามลำดับตัวอักษรภาษาอังกฤษ ASCII ย่อมาจาก American Standard Code for Information Interchange

8
การอ่านอักขระจากไฟล์ใน Python
ในไฟล์ข้อความมีสตริง "ฉันไม่ชอบสิ่งนี้" อย่างไรก็ตามเมื่ออ่านเป็นสตริงมันจะกลายเป็น "I don \ xe2 \ x80 \ x98t แบบนี้" ฉันเข้าใจว่า \ u2018 คือการแสดง Unicode ของ "" " ฉันใช้ f1 = open (file1, "r") text = f1.read() คำสั่งในการอ่าน ตอนนี้เป็นไปได้ไหมที่จะอ่านสตริงในลักษณะที่เมื่ออ่านเป็นสตริงแล้วมันคือ "ฉันไม่ชอบ" แทนที่จะเป็น "ฉันไม่ได้ xe2 \ x80 \ x98t แบบนี้" การแก้ไขครั้งที่สอง: ฉันเคยเห็นบางคนใช้การแมปเพื่อแก้ปัญหานี้ แต่จริงๆแล้วไม่มีการแปลงในตัวที่ทำให้การแปลง ANSI เป็น Unicode (และในทางกลับกัน) หรือไม่

7
ฉันจะลบอักขระที่ไม่ใช่ ASCII แต่เว้นช่วงเวลาและช่องว่างโดยใช้ Python ได้อย่างไร
ฉันกำลังทำงานกับไฟล์. txt ฉันต้องการสตริงของข้อความจากไฟล์ที่ไม่มีอักขระที่ไม่ใช่ ASCII อย่างไรก็ตามฉันต้องการเว้นวรรคและจุด ตอนนี้ฉันกำลังลอกมันอยู่เหมือนกัน นี่คือรหัส: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return char def get_my_string(file_path): f=open(file_path,'r') data=f.read() f.close() filtered_data=filter(onlyascii, data) filtered_data = filtered_data.lower() return filtered_data ฉันจะแก้ไข onlyascii () ให้เว้นช่องว่างและจุดได้อย่างไร? ฉันคิดว่ามันไม่ซับซ้อนเกินไป แต่ฉันคิดไม่ออก
100 python  text  unicode  filter  ascii 

10
อะไรคือสิ่งที่ตรงกันข้ามกับ chr () ใน Ruby?
ในหลายภาษามีคู่ของฟังก์ชั่นchr()และord()ซึ่งแปลงระหว่างตัวเลขและตัวอักษรค่า ในบางภาษาที่เรียกว่าord()asc() Ruby มีInteger#chrซึ่งใช้งานได้ดี: >> 65.chr A พอใช้. แต่คุณจะไปทางอื่นได้อย่างไร? "A".each_byte do |byte| puts byte end พิมพ์: 65 และนั่นก็ค่อนข้างใกล้เคียงกับที่ฉันต้องการ แต่ฉันอยากจะหลีกเลี่ยงการวนซ้ำจริงๆ - ฉันกำลังมองหาสิ่งที่สั้นพอที่จะอ่านได้เมื่อประกาศกconst.
100 ruby  ascii 


3
ฐานข้อมูล“ ASCII ที่ดีที่สุดสำหรับ Unicode” ของ Python อยู่ที่ไหน [ปิด]
ปิด. คำถามนี้ไม่เป็นไปตามหลักเกณฑ์กองมากเกิน ขณะนี้ยังไม่ยอมรับคำตอบ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Stack Overflow ปิดทำการเมื่อเดือนที่แล้ว ปรับปรุงคำถามนี้ ฉันมีข้อความบางส่วนที่ใช้เครื่องหมายวรรคตอน Unicode เช่นเครื่องหมายอัญประกาศคู่ด้านซ้ายเครื่องหมายอัญประกาศเดี่ยวด้านขวาสำหรับเครื่องหมายวรรคตอนเป็นต้นและฉันต้องการมันใน ASCII Python มีฐานข้อมูลของอักขระเหล่านี้ที่มีการแทนที่ ASCII หรือไม่ดังนั้นฉันจึงทำได้ดีกว่าการเปลี่ยนทั้งหมดเป็น "?" เหรอ?
86 python  unicode  ascii 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.