<html lang =“ en”> กับ <html lang =“ en-US”> ต่างกันอย่างไร


106

อะไรคือความแตกต่างระหว่าง<html lang="en">และ<html lang="en-US">? ค่าอื่น ๆ ที่สามารถติดตามได้คืออะไร?

อ้างอิงจากw3.org "เข้าใจว่ารหัสย่อยสองตัวอักษรเป็นรหัสประเทศ [ISO3166]" นั่นหมายความว่าค่าใด ๆ ที่แสดงอยู่ภายใต้รหัส alpha-2เป็นค่าที่ยอมรับหรือไม่?


คุณสามารถค้นหารายละเอียดเพิ่มเติมในRFC เชื่อมโยงกับในข้อมูลจำเพาะ
James Allardice

1
คุณสนใจในความแตกต่างระหว่างเบราว์เซอร์หรือทฤษฎี (ข้อกำหนด) หรือไม่?
เม.ย. ล้าน

@death เมษายนทั้งคู่ ฉันหมายความว่าสิ่งนี้ช่วยให้เบราว์เซอร์แสดงหน้านี้ต่อไปหรือไม่?
Celeritas

คำตอบ:


130

<html lang="en">
<html lang="en-US">

langแท็กแรกระบุรหัสภาษาเท่านั้น ประการที่สองระบุรหัสภาษาตามด้วยรหัสประเทศ

ค่าอื่น ๆ ที่สามารถติดตามได้คืออะไร? อ้างอิงจาก w3.org "เข้าใจว่ารหัสย่อยสองตัวอักษรเป็นรหัสประเทศ [ISO3166]" นั่นหมายความว่าค่าใด ๆ ที่แสดงอยู่ภายใต้รหัส alpha-2 เป็นค่าที่ยอมรับหรือไม่?

ใช่อย่างไรก็ตามค่านี้อาจมีหรือไม่มีความหมายที่แท้จริงก็ได้

<html lang="en-US">โดยพื้นฐานแล้วหมายถึง "หน้านี้เป็นภาษาอังกฤษแบบสหรัฐอเมริกา" ในทำนองเดียวกัน<html lang="en-GB">หมายความว่า "หน้านี้เป็นรูปแบบภาษาอังกฤษของสหราชอาณาจักร"

หากคุณต้องการระบุชุดค่าผสมที่ไม่ถูกต้องจริงๆคุณสามารถทำได้ มันคงไม่ได้มีความหมายมากนัก แต่<html lang="en-ES">ใช้ได้ตามสเปคอย่างที่ฉันเข้าใจ อย่างไรก็ตามการผสมภาษา / ประเทศนั้นจะไม่ได้ผลมากนักเนื่องจากภาษาอังกฤษไม่ได้ใช้กันทั่วไปในสเปน

ฉันหมายความว่าสิ่งนี้ช่วยให้เบราว์เซอร์แสดงหน้านี้ต่อไปหรือไม่?

ไม่ได้ช่วยให้เบราว์เซอร์แสดงหน้าเว็บ แต่มีประโยชน์สำหรับเครื่องมือค้นหาโปรแกรมอ่านหน้าจอและสิ่งอื่น ๆ ที่อาจอ่านและพยายามตีความหน้าเว็บนอกเหนือจากมนุษย์


31
FWIW ภาษาราชการของยูกันดาจริงๆแล้วคือภาษาอังกฤษและภาษาสวาฮิลี
Muhammad Alkarouri

34
ฮ่าจุดที่ดี อเมริกันของฉัน :( ฉันอัปเดตตัวอย่างเป็นสเปนและคราวนี้ได้ลองทำขาเล็กน้อยเพื่อให้แน่ใจว่าภาษาอังกฤษไม่ใช่ภาษาราชการที่นั่นด้วยขอบคุณสำหรับเคล็ดลับ
Jeremy Wiggins

@JeremyWiggins เกี่ยวกับ 2 บรรทัดสุดท้ายของคุณในคำตอบเริ่มต้นด้วย "มันไม่ได้ช่วยเบราว์เซอร์ .... " จะเกิดอะไรขึ้นหากเว็บไซต์เป็นสากล (สากล) การตั้งค่าแท็กภาษาจะยังคงจำเป็นอยู่หรือไม่?
Yustme

4
เกี่ยวกับสองบรรทัดสุดท้าย - หากเพจใช้ยัติภังค์จาก CSS ( hyphens: auto) langจำเป็นต้องมีแอตทริบิวต์เพื่อให้เบราว์เซอร์เลือกชุดกฎที่เหมาะสม
RobertT

1
ไม่เพียง แต่การตั้งค่าภาษาสำหรับเครื่องมือค้นหาหรือโปรแกรมอ่านหน้าจอเท่านั้นที่ช่วยในการตั้งค่าภาษาที่เหมาะสมแล้วยังมีเอฟเฟกต์การพิมพ์อีกด้วย ตัวอย่างเช่นอัญประกาศ <q> </q> จะได้รับการตีความอย่างถูกต้องด้วยการตั้งค่าภาษาที่ถูกต้องซึ่งแตกต่างกันระหว่าง de-DE, de-CH, fr และ fr-CH เช่น
theking2

8

คุณสามารถใช้รหัสประเทศใดก็ได้ใช่ แต่นั่นไม่ได้หมายความว่าเบราว์เซอร์หรือซอฟต์แวร์อื่น ๆ จะจดจำหรือทำอะไรที่แตกต่างไปจากนี้ ตัวอย่างเช่นโปรแกรมอ่านหน้าจออาจใช้ "en-US" และ "en-GB" เหมือนกันหากรองรับเฉพาะสำเนียงอเมริกันในภาษาอังกฤษ ซอฟต์แวร์อีกชิ้นหนึ่งที่มีเสียงที่แตกต่างกันสองเสียงสามารถปรับเปลี่ยนได้ตามรหัสประเทศ


ลิงก์ตายแล้วหากคุณพบการเปลี่ยนโปรดตั้งค่าสถานะสำหรับการยกเลิกการลบ
Taryn

5

สิ่งนี้น่าจะช่วยได้: http://www.w3.org/International/articles/language-tags/

กฎทองในการสร้างแท็กภาษาคือการทำให้แท็กสั้นที่สุด หลีกเลี่ยงภูมิภาคสคริปต์หรือแท็กย่อยอื่น ๆ ยกเว้นในกรณีที่เพิ่มข้อมูลแยกแยะที่เป็นประโยชน์ ตัวอย่างเช่นใช้ ja สำหรับภาษาญี่ปุ่นไม่ใช่ ja-JP เว้นแต่จะมีเหตุผลเฉพาะที่คุณต้องบอกว่านี่เป็นภาษาญี่ปุ่นเหมือนที่พูดในญี่ปุ่นแทนที่จะเป็นที่อื่น

รายการด้านล่างแสดงแท็กย่อยประเภทต่างๆที่พร้อมใช้งาน เราจะดำเนินการผ่านสิ่งเหล่านี้และวิธีใช้ในส่วนต่อไปนี้

ภาษา extlang-script-region-variant-extension-privateuse


1
แอปพลิเคชั่นซอฟต์แวร์บางตัวมีค่าเริ่มต้นเป็นการสะกดแบบสหรัฐอเมริกาและการแปลเป็นภาษาท้องถิ่นเมื่อมีการเลือกตัวเลือกภาษาอังกฤษทั่วไปเช่น Windows ทำสิ่งนี้สำหรับชุดภาษาอังกฤษ technet.microsoft.com/en-us/library/cc766191(v=ws.10).aspx Windows (ไม่มีประโยชน์) มีชุดภาษาเดียวสำหรับบางประเทศที่พูดได้หลายภาษาเช่นเนเธอร์แลนด์ (ดัตช์ไม่ใช่ฝรั่งเศส) แต่สี่ สำหรับสเปน (คาตาลัน, กาลิเซีย, บาสก์, สเปน) เบลเยียมเป็นศูนย์อาจเป็นเพราะภาษาประจำชาติหลายภาษาเป็นภาษาส่วนใหญ่ในประเทศอื่น ๆ
Mousey

2

RFC 3066ให้รายละเอียดของค่าที่อนุญาต (เน้นและเพิ่มลิงก์):

แท็กย่อย 2 ตัวอักษรทั้งหมดถูกตีความว่าเป็นรหัสประเทศ ISO 3166 alpha-2 จาก[ISO 3166]หรือได้รับมอบหมายจากหน่วยงานบำรุงรักษา ISO 3166 หรือหน่วยงานกำกับดูแลมาตรฐานในเวลาต่อมาแสดงถึงพื้นที่ที่ตัวแปรภาษานี้เกี่ยวข้อง

ฉันตีความว่าเป็นความหมายใด ๆ ที่ถูกต้อง (ตาม ISO 3166) รหัส 2 ตัวอักษรที่ถูกต้องเป็นแท็กย่อย RFC เข้าสู่สถานะ:

แท็กที่มีแท็กย่อยที่สอง 3 ถึง 8 ตัวอักษรอาจได้รับการลงทะเบียนกับ IANA ตามกฎในบทที่ 5 ของเอกสารนี้

อย่างไรก็ตามดูเหมือนว่าเป็นการพิมพ์ผิดเนื่องจากบทที่ 3 ดูเหมือนจะเกี่ยวข้องกับขั้นตอนการลงทะเบียนไม่ใช่บทที่ 5

ค้นหาอย่างรวดเร็วสำหรับสตรี IANA เผยมากรายการยาวของแท็กย่อยทุกภาษาสามารถใช้ได้ นี่คือตัวอย่างหนึ่งจากรายการ (ซึ่งจะใช้เป็นen-scouse):

ประเภท: ตัวแปร

แท็กย่อย: scouse

คำอธิบาย: Scouse

เพิ่มเมื่อ: 2006-09-18

คำนำหน้า: en

ความคิดเห็น: ภาษาอังกฤษ Liverpudlian เรียกว่า 'Scouse'

มีแท็กย่อยทุกประเภท หนังสือม้วนฉบับย่อได้เปิดเผยแล้วfr-1694acad(ภาษาฝรั่งเศสในศตวรรษที่ 17)


ประโยชน์ของแท็กเหล่านี้บางส่วน (ฉันจะบอกว่าส่วนใหญ่ของแท็กเหล่านี้) เมื่อพูดถึงเอกสารที่ออกแบบมาเพื่อแสดงในเบราว์เซอร์นั้นมี จำกัด ข้อกำหนดW3C Internationalization ระบุเพียง:

เบราว์เซอร์และแอปพลิเคชันอื่น ๆ สามารถใช้ข้อมูลเกี่ยวกับภาษาของเนื้อหาเพื่อส่งมอบข้อมูลที่เหมาะสมที่สุดแก่ผู้ใช้หรือเพื่อนำเสนอข้อมูลแก่ผู้ใช้ด้วยวิธีที่เหมาะสมที่สุด ยิ่งมีการติดแท็กและแท็กเนื้อหาอย่างถูกต้องมากเท่าไหร่แอปพลิเคชันดังกล่าวก็จะมีประโยชน์และแพร่หลายมากขึ้นเท่านั้น

ฉันกำลังดิ้นรนเพื่อค้นหาข้อมูลโดยละเอียดเกี่ยวกับการทำงานของเบราว์เซอร์เมื่อพบแท็กภาษาที่แตกต่างกัน แต่ส่วนใหญ่มักจะให้ประโยชน์กับผู้ใช้ที่ใช้โปรแกรมอ่านหน้าจอซึ่งสามารถใช้แท็กเพื่อกำหนดภาษา / ภาษาถิ่น / สำเนียง ในการนำเสนอเนื้อหา


0

XML Schema ต้องการให้มีการประกาศและนำเข้าเนมสเปซ xml ก่อนใช้ xml: lang (และค่าเนมสเปซ xml อื่น ๆ ) RELAX NG กำหนดเนมสเปซ xml ไว้ล่วงหน้าเช่นเดียวกับใน XML ดังนั้นจึงไม่จำเป็นต้องมีการประกาศเพิ่มเติม


-1

คำถามแรกเป็นเรื่องง่าย มีหลายens (ภาษาอังกฤษ) แต่ (ส่วนใหญ่) มีเพียงภาษาอังกฤษแบบสหรัฐอเมริกาเดียว ใครจะคิดว่ามีen-CN, ,en-GB en-AUเดาว่าอาจจะเป็นภาษาอังกฤษแบบออสเตรีย แต่ก็ใช่มากกว่าที่คุณจะทำได้


6
EN-UK คือ en-gb ... ดูที่นี่สำหรับรายชื่อ 10 ภาษาอังกฤษที่ดี andiamo.co.uk/language-resources/iso-language-codes.aspx
Codemwnci

1
แต่มีซูลูเพียงคนเดียว! : o)
Codemwnci
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.