ubuntu å vs osx å?


10

ไม่แน่ใจว่านี่เป็นคำถามของ ubuntu หรือ osx หรือไม่ แต่ฉันจะเริ่มที่นี่ ฉันจะทิ้งมันไว้กับ mods เพื่อย้ายคำถามไปยัง AskDifferent ถ้ามีปัญหาเพิ่มเติม

ฉันย้ายไฟล์จาก ubuntu ไปยัง osx โดยใช้ scp บนเครื่อง apple ฉันแก้ไขไฟล์ในเครื่อง apple จากนั้นฉันก็ย้ายไฟล์กลับมาอีกครั้งโดยใช้ scp บนเครื่อง apple

ชื่อไฟล์ของไฟล์ที่มาเป็นเอกสาร / trettiårsfirarätare

  • รหัสแหล่งที่มา: Documents/trettiårsfirarätare

ชื่อไฟล์ที่ผมได้กลับมีชื่อเอกสาร / trettiårsfirarätare

  • รหัสแหล่งที่มา: Documents/trettia˚rsfirara¨tare

ในขณะที่สิ่งเหล่านี้อาจมีลักษณะคล้ายกันตัวอักษรåและäนั้นแตกต่างกันระหว่างตัวอักษร ฉันไม่มีการเปลี่ยนแปลงชื่อของไฟล์

นี่ทำให้ความแตกต่างทางเทคนิคเล็กน้อยสำหรับฉันฉันเพิ่งเปลี่ยนชื่อไฟล์กลับไปเป็นสิ่งที่อูบุนตูคิดว่าåและä แต่มันก็กระตุ้นความอยากรู้ของฉัน

คุณช่วยอธิบายให้ฉันฟังได้ไหมว่าทำไมสิ่งนี้ถึงเกิดขึ้น


1
ปัญหานี้น่าจะเกี่ยวข้องกับ Unicode จะเกิดอะไรขึ้นถ้าคุณscp (หรือ equiv.) คัดลอกจากOS Xเพื่ออูบุนตู (หรืออูบุนตู OS X) แต่บนเครื่องอูบุนตู?
david6

ฉันดูคำถามนี้ในรูปแบบ mac และไม่เห็นความแตกต่างระหว่างบรรทัดตอนนี้เมื่อฉันกลับมาที่แล็ปท็อป Ubuntu ของฉันฉันเห็นสแควร์สทันทีแม้กระทั่งก่อนการแก้ไขของ Takkat
อัลวาร์

ฉันจะไม่ลอง scp-ing จาก ubuntu ถึง osx บน ubuntu เนื่องจากเครื่อง apple ไม่มี sshd แต่ scp-ing บน osx นั้นเพียงพอที่จะเปลี่ยนชื่อไฟล์ได้ ฉันคัดลอกไปมาเพียงครั้งเดียวและเปลี่ยนชื่อแล้วดูเหมือนว่า scp คือแอปพลิเคชันที่เปลี่ยนชื่อ
azzid

คำตอบ:


8

ในชื่อเดิม“ Documents / trettiårsfirarätare” ตัวอักษร“ å” จะแสดงภายในเป็น U + 00E5 LATIN เล็กตัวอักษรพร้อมกับแหวนข้างต้น นี่คือตัวแทนทั่วไปของตัวละครนี้ ในชื่อไฟล์ที่คุณได้รับกลับมามันถูกเปลี่ยนเป็นคู่ตัวละคร U + 0061 LATIN เล็กตัวอักษร L ตัว A U + 030A แหวนรวมกันข้างต้น สิ่งนี้อนุญาต แต่ไม่ธรรมดา มันหมายถึงการย่อยสลาย“ å” ลงในอักขระฐาน“ a” และเครื่องหมายกำกับรวม การรับรองเหล่านี้ได้รับการประกาศว่ามีความเท่าเทียมกันในมาตรฐานของ Unicode นี่หมายความว่าการนำเสนอแบบภาพโดยปกติคาดว่าจะเหมือนกัน แต่ไม่จำเป็นต้อง (ที่นี่ตามที่ดูใน Firefox ไม่ใช่ - ขึ้นอยู่กับแบบอักษรและซอฟต์แวร์การแสดงผล) โปรแกรมอาจถือว่าพวกเขาเทียบเท่า แต่พวกเขาไม่ต้องการ ในระบบไฟล์เช่นพวกเขาอาจได้รับการปฏิบัติแตกต่างกัน

ในทำนองเดียวกันตัวอักษร“ ä” ได้รับการแยกย่อยเป็น U + 0061 LATIN เล็กตัวอักษร A U + 0308 การรวมกันของโรค DIAERESIS

เหตุผลนี้ไม่ชัดเจน เป็นไปได้ว่าซอฟต์แวร์บางตัว“ คิดว่า” ควรแปลงสตริงเป็นรูปแบบการทำให้เป็นมาตรฐานซึ่งจะย่อยสลายตัวอักขระที่แยกออกทั้งหมดอาจเป็นUnicode Normalization Form D (NFD)

ที่เหลือก็เป็นปริศนาอีกเล็กน้อย สิ่งที่คุณระบุว่าเป็น“ Sourcecode” สำหรับชื่อไฟล์ที่คุณได้รับกลับมา“ Documents / trettiafrsfiraraaretare” แบบฟอร์มที่ย่อยสลายได้ถูก munged แล้ว: เครื่องหมายกำกับออกเสียงถูกแทนที่ด้วยการเว้นช่องว่างอักขระ“ ˚” และ“ ¨ ” นี่ไม่ใช่เรื่องปกติและจะเปลี่ยนทั้งข้อมูลประจำตัวและการแสดงผล


ฉันไม่ได้เพิ่มส่วน SourceCode ฉันสามารถเห็นว่ามีความแตกต่างระหว่างตัวอักษรในการแสดงภาพของพวกเขาแรกåมีแหวนขนาดเล็กกว่าที่สอง แต่นอกเหนือจากนั้นสตริงมีลักษณะเหมือนกัน พวกเขาจะไม่ eqvivalent เมื่อใช้เสร็จสิ้นแท็บทุบตี
azzid

ที่จริงเป็นตัวอักษรบนตัวของมันเองก็ไม่ได้เป็นเพียงมีเครื่องหมายการออกเสียงเช่นเดียวกับเอชเป็นตัวอักษรและไม่เพียง แต่และnมีเครื่องหมายการออกเสียง
kasperd
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.