คำถามติดแท็ก unicode

5
จะทำให้คำสั่ง 'less' จัดการกับ UTF-8 ได้อย่างไร
บนเครื่อง Mac การพิมพ์ UTF-8 ใช้งานได้ทั่วไป แต่เครื่องlessไม่ทำงานอย่างถูกต้อง ดังนั้นวิธีนี้ทำงานอย่างถูกต้อง: $ echo -e '\xe2\x82\xac' € แต่การวางให้น้อยลงจะให้สิ่งนี้: $ echo -e '\xe2\x82\xac' | less <E2><82><AC> จะแก้ไขได้อย่างไร? สำหรับการวินิจฉัย: ฉันใช้ Mac OS 10.6.8 เวอร์ชันน้อยกว่า 418, เทอร์มินัล 2.1.2 (273.1) ผลลัพธ์ของสถานที่ของฉันคือ: $ locale LANG="en_US.UTF-8" LC_COLLATE="C" LC_CTYPE="C" LC_MESSAGES="C" LC_MONETARY="C" LC_NUMERIC="C" LC_TIME="C" LC_ALL="C"

2
มีเกณฑ์เปรียบเทียบสมรรถนะ MySQL เพื่อวัดผลกระทบของ utf8_unicode_ci เทียบกับ utf8_general_ci หรือไม่?
ผมอ่านที่นี่และมีว่าการใช้utf8_unicode_ciการเปรียบเทียบเพื่อให้แน่ใจว่าการรักษาที่ดีขึ้นของข้อความ Unicode (ตัวอย่างเช่นมัน knowns วิธีการขยายตัวอักษรเช่น 'œ' เป็น 'OE' สำหรับการค้นหาและการสั่งซื้อ) เมื่อเทียบกับการเริ่มต้นutf8_general_ciซึ่งโดยทั่วไปเพียงแถบกำกับ แต่น่าเสียดายที่ทั้งสองแหล่งข่าวระบุว่าจะช้ากว่าเล็กน้อยutf8_unicode_ciutf8_general_ci ดังนั้นคำถามของฉันคืออะไร "ช้าลงเล็กน้อย" หมายความว่าอย่างไร มีใครบ้างที่ใช้มาตรฐาน? เรากำลังพูดถึงผลกระทบของประสิทธิภาพการทำงาน -0.01% หรือมากกว่า -25% ขอบคุณสำหรับความช่วยเหลือของคุณ.

4
ฉันจะตรวจสอบได้อย่างไรว่า PHP ถูกคอมไพล์ด้วย Win32 API เวอร์ชัน UNICODE หรือไม่
สิ่งนี้เกี่ยวข้องกับการโพสต์ Stack Overflow: glob () ไม่สามารถค้นหาชื่อไฟล์ที่มีอักขระหลายไบต์บน Windows ได้หรือไม่ ฉันมีปัญหากับ PHP และไฟล์ที่มีอักขระหลายไบต์บน Windows นี่คือกรณีทดสอบของฉัน: print_r(scandir('./uploads/')); print_r(glob('./uploads/*')); แก้ไขเอาต์พุตบนเซิร์ฟเวอร์ UNIX รีโมต: Array ( [0] => . [1] => .. [2] => filename-äöü.jpg [3] => filename.jpg [4] => test이test.jpg [5] => имя файла.jpg [6] => פילענאַמע.jpg [7] => 文件名.jpg ) Array ( [0] => …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.