คำถามติดแท็ก unicode

Unicode เป็นมาตรฐานสำหรับการเข้ารหัสการแสดงและการจัดการข้อความด้วยความตั้งใจที่จะสนับสนุนอักขระทั้งหมดที่จำเป็นสำหรับข้อความที่เขียนซึ่งประกอบด้วยระบบการเขียนทั้งหมดสัญลักษณ์ทางเทคนิคและเครื่องหมายวรรคตอน

30
วิธีพิมพ์ข้อความสีในเทอร์มินัลใน Python
ฉันจะส่งข้อความสีไปยังเครื่องเทอร์มินัลใน Python ได้อย่างไร? สัญลักษณ์ Unicode ที่ดีที่สุดในการเป็นตัวแทนของบล็อกที่มั่นคงคืออะไร?

7
ทำไมการรันโค้ด Java ในความคิดเห็นที่มีอักขระ Unicode บางตัวอนุญาต
รหัสต่อไปนี้สร้างผลลัพธ์ "Hello World!" (ไม่จริงลองดู) public static void main(String... args) { // The comment below is not a typo. // \u000d System.out.println("Hello World!"); } เหตุผลนี้คือคอมไพเลอร์ Java วิเคราะห์อักขระ Unicode \u000dเป็นบรรทัดใหม่และได้รับการแปลงเป็น: public static void main(String... args) { // The comment below is not a typo. // System.out.println("Hello World!"); } จึงส่งผลให้ความคิดเห็นถูก "ดำเนินการ" ตั้งแต่นี้สามารถใช้เพื่อ "ซ่อน" …
1356 java  unicode  comments 

28
UnicodeEncodeError: ตัวแปลงสัญญาณ 'ascii' ไม่สามารถเข้ารหัสอักขระ u '\ xa0' ในตำแหน่ง 20: ลำดับไม่อยู่ในช่วง (128)
ฉันมีปัญหาในการจัดการกับอักขระ Unicode จากข้อความที่ดึงมาจากหน้าเว็บต่างๆ (ในเว็บไซต์ต่าง ๆ ) ฉันใช้ BeautifulSoup ปัญหาคือข้อผิดพลาดนั้นไม่สามารถทำซ้ำได้เสมอไป บางครั้งมันก็ทำงานร่วมกับบางหน้าและบางครั้งก็ barfs UnicodeEncodeErrorโดยขว้างปา ฉันลองทุกอย่างที่ฉันสามารถคิดได้ แต่ถึงกระนั้นฉันก็ไม่พบสิ่งใดที่ทำงานได้อย่างต่อเนื่องโดยไม่ละทิ้งข้อผิดพลาดที่เกี่ยวข้องกับ Unicode ส่วนหนึ่งของรหัสที่ทำให้เกิดปัญหาแสดงอยู่ด้านล่าง: agent_telno = agent.find('div', 'agent_contact_number') agent_telno = '' if agent_telno is None else agent_telno.contents[0] p.agent_info = str(agent_contact + ' ' + agent_telno).strip() นี่คือการติดตามสแต็กที่สร้างบนสตริง SOME เมื่อรันโค้ดย่อยด้านบน: Traceback (most recent call last): File "foobar.py", line 792, in …

19
อักขระใดบ้างที่สามารถใช้สำหรับรูปสามเหลี่ยมขึ้น / ลง (ลูกศรที่ไม่มีก้าน) เพื่อแสดงใน HTML
ฉันกำลังมองหาอักขระHTMLหรือASCIIซึ่งเป็นรูปสามเหลี่ยมที่ชี้ขึ้นหรือลงเพื่อให้ฉันสามารถใช้เป็นสวิตช์สลับได้ ฉันพบ↑ ( ↑) และ↓ ( ↓) - แต่มีก้านแคบ ฉันกำลังมองหาลูกศร HTML "หัว"
1241 html  unicode  icons  ascii  symbols 


8
อักขระ 'b' ทำอะไรต่อหน้าตัวอักษรสตริง?
เห็นได้ชัดว่าต่อไปนี้เป็นไวยากรณ์ที่ถูกต้อง: my_string = b'The string' ผมอยากจะรู้ว่า: bอักขระนี้ต่อหน้าสตริงหมายถึงอะไร การใช้งานมีผลกระทบอะไรบ้าง? สถานการณ์ที่เหมาะสมที่จะใช้คืออะไร ฉันพบคำถามที่เกี่ยวข้องที่นี่ใน SO แต่คำถามนั้นเกี่ยวกับ PHP และมันระบุว่าbใช้เพื่อระบุสตริงเป็นไบนารีซึ่งตรงข้ามกับ Unicode ซึ่งจำเป็นสำหรับรหัสที่จะเข้ากันได้กับ PHP เวอร์ชัน <6 เมื่อย้ายไปยัง PHP 6 ฉันไม่คิดว่านี่จะใช้กับ Python ฉันพบเอกสารนี้ในเว็บไซต์ Python เกี่ยวกับการใช้uอักขระในไวยากรณ์เดียวกันเพื่อระบุสตริงเป็น Unicode น่าเสียดายที่มันไม่ได้พูดถึงตัวอักษรbทุกที่ในเอกสารนั้น นอกจากนี้จากความอยากรู้มีสัญลักษณ์มากกว่าbและuนั่นเป็นสิ่งอื่นหรือไม่?
831 python  string  unicode  binary 


12
std :: wstring VS std :: string
ผมไม่สามารถที่จะเข้าใจความแตกต่างระหว่างและstd::string std::wstringฉันรู้ว่าwstringรองรับตัวละครกว้างเช่นตัวอักษร Unicode ฉันมีคำถามต่อไปนี้: เมื่อใดที่ฉันควรใช้std::wstringมากกว่าstd::string? สามารถstd::stringเก็บชุดอักขระ ASCII ทั้งหมดรวมถึงอักขระพิเศษได้หรือไม่ มีการstd::wstringสนับสนุนจากทุกที่นิยม C ++ คอมไพเลอร์? " ตัวกว้าง " คืออะไร?
741 c++  string  unicode  c++-faq  wstring 

2
ข้อความของ Zalgo ทำงานอย่างไร
ตั้งค่าไว้ที่Stack Overflow ด้านล่างนี้ : Какработаеттекст«Залго»? ฉันเห็นข้อความที่จัดรูปแบบแปลก ๆ ที่เรียกว่า Zalgo เหมือนด้านล่างที่เขียนไว้ในฟอรัมต่างๆ มันดูน่ารำคาญ แต่มันทำให้ฉันรำคาญเพราะมันทำลายความคิดของฉันในสิ่งที่ตัวละครควรจะเป็น ความเข้าใจของฉันคือว่าตัวละครควรจะย้ายในแนวนอนข้ามเส้นและอยู่ใน "ภาชนะ" ที่แน่นอน เห็นได้ชัดว่าข้อความ Zalgo มีการเคลื่อนไหวในแนวตั้งและดูเหมือนจะไม่ถูก จำกัด พื้นที่ นี่เป็นข้อบกพร่อง / ข้อบกพร่อง / ใช้ประโยชน์ / แฮ็คใน Unicode หรือไม่ ตัวละครเหล่านี้มีคุณสมบัติแปลก ๆ หรือไม่? "เกิดอะไรขึ้น" ที่นี่ H̡̫̤̤̣͉̤ͭ̓̓̇͗̎̀ơ̯̗̱̘̮͒̄̀̈ͤ̀͡w͓̲͙͖̥͉̹͋ͬ̊ͦ̂̀̚ ͎͉͖̌ͯͅͅd̳̘̿̃̔̏ͣ͂̉̕ŏ̖̙͋ͤ̊͗̓͟͜e͈͕̯̮̙̣͓͌ͭ̍̐̃͒s͙͔̺͇̗̱̿̊̇͞ ̸̤͓̞̱̫ͩͩ͑̋̀ͮͥͦ̊Z̆̊͊҉҉̠̱̦̩͕ą̟̹͈̺̹̋̅ͯĺ̡̘̹̻̩̩͋͘g̪͚͗ͬ͒o̢̖͇̬͍͇͓̔͋͊̓ ̢͈͙͂ͣ̏̿͐͂ͯ͠t̛͓̖̻̲ͤ̈ͣ͝e͋̄ͬ̽͜҉͚̭͇ͅx͎̬̠͇̌ͤ̓̂̓͐͐́͋͡ț̗̹̝̄̌̀ͧͩ̕͢ ̮̗̩̳̱̾w͎̭̤͍͇̰̄͗ͭ̃͗ͮ̐o̢̯̻̰̼͕̾ͣͬ̽̔̍͟ͅr̢̪͙͍̠̀ͅǩ̵̶̗̮̮ͪ́? ̙͉̥̬͙̟̮͕ͤ̌͗ͩ̕͡
694 html  unicode  zalgo 


7
แฟล็กสตริง“ u” และ“ r” ทำอะไรกันแน่และสตริงตัวอักษรดิบคืออะไร
ในขณะที่ถามคำถามนี้ฉันรู้ว่าฉันไม่รู้จักเกี่ยวกับสตริงดิบมากนัก สำหรับใครบางคนที่อ้างว่าเป็นเทรนเนอร์ของ Django นี่มันแย่มาก ฉันรู้ว่าการเข้ารหัสคืออะไรและฉันรู้ว่าตัวu''เองทำอะไรคนเดียวตั้งแต่ฉันได้รับ Unicode แต่จะr''ทำอะไรกันแน่? มันส่งผลสตริงชนิดใด และเหนือสิ่งอื่นใดสิ่งที่ห่าur''ทำอะไร? ในที่สุดมีวิธีที่เชื่อถือได้เพื่อกลับไปจากสาย Unicode เพื่อสตริงดิบง่าย ๆ ? อ่าและถ้าระบบของคุณและชุดตัวแก้ไขข้อความถูกตั้งค่าเป็น UTF-8 จะu''ทำอะไรได้จริงหรือ

15
ความท้าทายการเข้ารหัสภาพ Twitter [ปิด]
ตามที่เป็นอยู่ในปัจจุบันคำถามนี้ไม่เหมาะสำหรับรูปแบบคำถาม & คำตอบของเรา เราคาดหวังว่าคำตอบจะได้รับการสนับสนุนจากข้อเท็จจริงการอ้างอิงหรือความเชี่ยวชาญ แต่คำถามนี้อาจเรียกร้องให้มีการอภิปรายโต้แย้งโต้แย้งหรือการอภิปรายเพิ่มเติม หากคุณรู้สึกว่าคำถามนี้สามารถปรับปรุงและเปิดใหม่ได้โปรดไปที่ศูนย์ช่วยเหลือเพื่อขอคำแนะนำ ปิดให้บริการใน8 ปีที่ผ่านมา ล็อคแล้ว คำถามและคำตอบนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ หากรูปภาพมีค่า 1,000 คำคุณสามารถบรรจุรูปภาพได้เท่าใดใน 140 ตัวอักษร? หมายเหตุ : นั่นคือคน! Bounty เส้นตายอยู่ที่นี่และหลังจากใคร่ครวญยากผมได้ตัดสินใจว่ารายการ Boojum ของเพียงแค่ขยับตัวแทบไม่ออกแซม Hocevar ฉันจะโพสต์บันทึกรายละเอียดเพิ่มเติมเมื่อฉันมีโอกาสเขียนขึ้น แน่นอนว่าทุกคนควรรู้สึกยินดีที่จะส่งโซลูชั่นต่อไปและปรับปรุงวิธีแก้ปัญหาเพื่อให้ผู้คนโหวต ขอบคุณทุกคนที่ส่งและเข้าร่วม; ฉันสนุกกับมันทั้งหมด มันสนุกมากสำหรับฉันที่จะวิ่งและฉันหวังว่ามันจะสนุกสำหรับทั้งผู้เข้าแข่งขันและผู้ชม ฉันเจอโพสต์ที่น่าสนใจเกี่ยวกับการพยายามบีบอัดรูปภาพเป็นความคิดเห็น Twitter และผู้คนจำนวนมากในชุดข้อความนั้น (และกระทู้ใน Reddit ) มีคำแนะนำเกี่ยวกับวิธีการต่าง ๆ ที่คุณสามารถทำได้ ดังนั้นฉันคิดว่ามันจะเป็นการเขียนโค้ดที่ท้าทาย ให้คนเอาเงินใส่ปากและแสดงให้เห็นว่าความคิดของพวกเขาเกี่ยวกับการเข้ารหัสสามารถนำไปสู่รายละเอียดมากขึ้นในพื้นที่ จำกัด ที่คุณมี ฉันขอให้คุณสร้างระบบจุดประสงค์ทั่วไปสำหรับการเข้ารหัสภาพเป็นข้อความ Twitter จำนวน 140 ตัวและถอดรหัสให้เป็นภาพอีกครั้ง คุณสามารถใช้อักขระ Unicode …

7
ทำไม Perl สมัยใหม่หลีกเลี่ยง UTF-8 โดยค่าเริ่มต้น
ฉันสงสัยว่าทำไมโซลูชั่นที่ทันสมัยที่สุดที่สร้างโดยใช้ Perl ไม่เปิดใช้งานUTF-8โดยค่าเริ่มต้น ฉันเข้าใจว่ามีปัญหาแบบดั้งเดิมสำหรับสคริปต์ Perl หลักซึ่งอาจทำให้เกิดปัญหา แต่จากมุมมองของฉันใน 21 เซนต์ศตวรรษโครงการขนาดใหญ่ใหม่ (หรือโครงการที่มีมุมมองขนาดใหญ่) ควรทำให้ซอฟต์แวร์ UTF-8 ของพวกเขาพิสูจน์จากรอยขีดข่วน ยังฉันไม่เห็นมันเกิดขึ้น ยกตัวอย่างเช่นMooseช่วยให้เข้มงวดและคำเตือน แต่ไม่Unicode โมเดิร์น :: Perlช่วยลดสำเร็จรูปสำเร็จรูป แต่ไม่มี UTF-8 จัดการ ทำไม? มีเหตุผลบางอย่างที่จะหลีกเลี่ยง UTF-8 ในโครงการ Perl ที่ทันสมัยในปี 2011 หรือไม่? ความคิดเห็น @tchrist ยาวเกินไปดังนั้นฉันจึงเพิ่มที่นี่ ดูเหมือนว่าฉันไม่ได้ทำให้ตัวเองชัดเจน ให้ฉันลองเพิ่มบางสิ่ง tchristและฉันเห็นว่าสถานการณ์ค่อนข้างคล้ายคลึงกัน แต่ข้อสรุปของเรานั้นสมบูรณ์ในทางตรงกันข้าม ฉันเห็นด้วยสถานการณ์ของ Unicode นั้นซับซ้อน แต่นี่เป็นเหตุผลว่าทำไมเรา (ผู้ใช้ Perl และ coders) ต้องการเลเยอร์ (หรือ pragma) ซึ่งทำให้การจัดการ UTF-8 …
557 perl  unicode  utf-8 

8
UnicodeDecodeError: ตัวแปลงสัญญาณ 'charmap' ไม่สามารถถอดรหัสไบต์ X ในตำแหน่ง Y: อักขระแผนที่ไปยัง <undefined>
ฉันพยายามรับโปรแกรม Python 3 เพื่อทำกิจวัตรกับไฟล์ข้อความที่เต็มไปด้วยข้อมูล อย่างไรก็ตามเมื่อพยายามอ่านไฟล์ฉันได้รับข้อผิดพลาดดังต่อไปนี้: Traceback (most recent call last): File "SCRIPT LOCATION", line NUMBER, in &lt;module&gt; `text = file.read()` File "C:\Python31\lib\encodings\cp1252.py", line 23, in decode `return codecs.charmap_decode(input,self.errors,decoding_table)[0]` UnicodeDecodeError: 'charmap' codec can't decode byte 0x90 in position 2907500: character maps to `&lt;undefined&gt;`

6
เหตุใดอักขระอิโมจิเช่น 👩‍👩‍👧‍👦 จึงมีความแปลกประหลาดในสายของสวิฟท์
อักขระ 👩‍👩‍👧‍👦 (ครอบครัวที่มีผู้หญิงสองคนผู้หญิงหนึ่งคนและเด็กชายหนึ่งคน) ถูกเข้ารหัสเช่นนี้: U+1F469 WOMAN, ‍U+200D ZWJ, U+1F469 WOMAN, U+200D ZWJ, U+1F467 GIRL, U+200D ZWJ, U+1F466 BOY ดังนั้นจึงมีการเข้ารหัสที่น่าสนใจมาก เป้าหมายที่สมบูรณ์แบบสำหรับการทดสอบหน่วย อย่างไรก็ตาม Swift ดูเหมือนจะไม่รู้วิธีจัดการกับมัน นี่คือสิ่งที่ฉันหมายถึง: "👩‍👩‍👧‍👦".contains("👩‍👩‍👧‍👦") // true "👩‍👩‍👧‍👦".contains("👩") // false "👩‍👩‍👧‍👦".contains("\u{200D}") // false "👩‍👩‍👧‍👦".contains("👧") // false "👩‍👩‍👧‍👦".contains("👦") // true ดังนั้นสวิฟท์บอกว่ามันมีตัวเอง (ดี) และเด็กผู้ชาย (ดี!) แต่มันก็บอกว่ามันไม่ได้มีผู้เข้าร่วมหญิงสาวหรือศูนย์กว้าง เกิดอะไรขึ้นที่นี่ เหตุใด Swift จึงรู้ว่ามีเด็กผู้ชาย แต่ไม่ใช่ผู้หญิงหรือผู้หญิง ฉันสามารถเข้าใจได้ว่ามันปฏิบัติตัวมันเป็นตัวละครตัวเดียวและรู้ตัวว่ามันบรรจุตัวมันเอง …
540 swift  string  unicode  emoji 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.