คำถามติดแท็ก string

สตริงเป็นลำดับที่ จำกัด ของสัญลักษณ์ที่ใช้กันทั่วไปสำหรับข้อความแม้ว่าบางครั้งสำหรับข้อมูลโดยพลการ


4
Regex วิธีจับคู่อักขระที่ไม่จำเป็น
ฉันมี regex ที่ฉันคิดว่าทำงานได้อย่างถูกต้องจนถึงตอนนี้ ฉันต้องการจับคู่กับอักขระที่ไม่จำเป็น มันอาจจะมีหรือไม่ นี่คือสองสาย สตริงด้านบนจะจับคู่ในขณะที่ด้านล่างไม่ได้ การไม่มีตัวอักษรตัวเดียวในสตริงล่างคือสิ่งที่ทำให้มันล้มเหลว ฉันต้องการรับตัวอักษรตัวเดียวหลังจากตัวเลข 5 ตัวเริ่มต้นถ้ามันอยู่ที่นั่นและหากไม่ได้รับสายอื่น จดหมายนี้สามารถA-Zจดหมายฉบับนี้สามารถ ถ้าฉันลบออก([A-Z]{1}) +.*? +จาก regex มันจะตรงกับทุกสิ่งที่ฉันต้องการยกเว้นตัวอักษร แต่มันสำคัญมาก 20000 K Q511195DREWBT E00078748521 30000 K601220PLOPOH Z00054878524 นี่คือ regex ที่ฉันใช้ /^([0-9]{5})+.*? ([A-Z]{1}) +.*? +([A-Z]{1})([0-9]{3})([0-9]{3})([A-Z]{3})([A-Z]{3}) +([A-Z])[0-9]{3}([0-9]{4})([0-9]{2})([0-9]{2})/
147 regex  string  operators 

11
วิธี unescape หน่วยงานตัวอักษร HTML ใน Java?
โดยทั่วไปฉันต้องการที่จะถอดรหัสเอกสาร HTML ที่กำหนดและแทนที่ตัวอักษรพิเศษทั้งหมดเช่น" "-> " ", ->">"">" ใน. NET เราสามารถใช้ประโยชน์HttpUtility.HtmlDecodeได้ ฟังก์ชั่นที่เทียบเท่าใน Java คืออะไร?
147 java  html  string  eclipse  decode 

2
ความแตกต่างระหว่างตัวละคร, จุดโค้ด, glyph และกราฟคืออะไร?
การพยายามทำความเข้าใจรายละเอียดปลีกย่อยของ Unicode ที่ทันสมัยทำให้ฉันปวดหัว โดยเฉพาะอย่างยิ่งความแตกต่างระหว่างจุดรหัสอักขระร่ายมนตร์และกราฟิค - แนวคิดซึ่งในกรณีที่ง่ายที่สุดเมื่อจัดการกับข้อความภาษาอังกฤษโดยใช้อักขระ ASCII ทั้งหมดมีความสัมพันธ์แบบหนึ่งต่อหนึ่งซึ่งกันและกันทำให้ฉันเดือดร้อน เมื่อเห็นว่าคำศัพท์เหล่านี้ถูกนำไปใช้ในเอกสารอย่าง Matthias Bynens ' JavaScript มีปัญหา unicodeหรือ Wikipedia เกี่ยวกับการรวมกันของ Hanฉันได้รวบรวมว่าแนวคิดเหล่านี้ไม่เหมือนกันและเป็นอันตรายที่จะทำให้พวกเขาสับสน แต่ฉัน ดิ้นรนที่จะเข้าใจสิ่งที่แต่ละระยะหมายถึง Unicode Consortium มีคำศัพท์เพื่ออธิบายสิ่งนี้ แต่มันเต็มไปด้วย "คำจำกัดความ" ดังนี้: ตัวละครที่เป็นนามธรรม หน่วยของข้อมูลที่ใช้สำหรับองค์กรการควบคุมหรือการแสดงข้อมูลที่เป็นข้อความ ... ... ตัวละคร ... (2) คำพ้องสำหรับอักขระนามธรรม (3) หน่วยพื้นฐานของการเข้ารหัสสำหรับการเข้ารหัสอักขระ Unicode ... ... สัญลักษณ์ (1) รูปแบบนามธรรมที่แสดงภาพสัญลักษณ์หนึ่งภาพขึ้นไป (2) คำพ้องสำหรับรูปภาพสัญลักษณ์ ในการแสดงข้อมูลอักขระ Unicode อาจมีหนึ่งหรือมากกว่าหนึ่งสัญลักษณ์อาจถูกเลือกเพื่อแสดงอักขระเฉพาะ ... อักษร (1) …


4
ทำไม "ถ้าไม่มี. __ eq __ (" a ")" ดูเหมือนจะประเมินเป็น True (แต่ไม่มาก)
หากคุณดำเนินการคำสั่งต่อไปนี้ใน Python 3.7 จะพิมพ์ (จากการทดสอบของฉัน) b: if None.__eq__("a"): print("b") อย่างไรก็ตามประเมินNone.__eq__("a")NotImplemented ธรรมชาติ"a".__eq__("a")ประเมินTrueและประเมิน"b".__eq__("a")False ผมเริ่มค้นพบนี้เมื่อการทดสอบค่าตอบแทนของฟังก์ชั่น แต่ไม่ได้กลับอะไรในกรณีที่สอง - Noneเพื่อฟังก์ชั่นที่ส่งกลับ เกิดอะไรขึ้นที่นี่?

6
ฉันจะแปลงสตริงเป็น UTF-8 ใน C # ได้อย่างไร
ฉันมีสตริงที่ฉันได้รับจากแอพของบุคคลที่สามและฉันต้องการแสดงอย่างถูกต้องในภาษาใด ๆ โดยใช้ C # บน Windows Surface ของฉัน เนื่องจากการเข้ารหัสที่ไม่ถูกต้องส่วนหนึ่งของสตริงของฉันมีลักษณะเช่นนี้ในภาษาสเปน: Acción ในขณะที่ควรมีลักษณะเช่นนี้: Acción ตามคำตอบของคำถามนี้: จะรู้ได้อย่างไรว่าการเข้ารหัสสตริงใน C #การเข้ารหัสที่ฉันได้รับควรมาที่ UTF-8 แล้ว แต่มันถูกอ่านใน Encoding.Default (อาจเป็น ANSI) ฉันกำลังพยายามแปลงสตริงนี้เป็น UTF-8 จริง แต่ปัญหาอย่างหนึ่งคือฉันเห็นเฉพาะเซ็ตย่อยของคลาสการเข้ารหัส (คุณสมบัติ UTF8 และ Unicode เท่านั้น) อาจเป็นเพราะฉัน จำกัด Windows window API เท่านั้น ฉันลองใช้ตัวอย่างบางส่วนที่ฉันพบบนอินเทอร์เน็ต แต่ก็ไม่มีสิ่งใดที่พิสูจน์แล้วว่าประสบความสำเร็จสำหรับภาษาตะวันออก (เช่นภาษาเกาหลี) ตัวอย่างหนึ่งมีดังนี้: var utf8 = Encoding.UTF8; byte[] utfBytes = utf8.GetBytes(myString); …

10
Python ลบ 3 ตัวอักษรสุดท้ายของสตริง
ฉันกำลังพยายามลบอักขระ 3 ตัวสุดท้ายจากสตริงในหลามฉันไม่ทราบว่าอักขระเหล่านี้คืออะไรฉันจึงไม่สามารถใช้งานได้rstripฉันต้องลบพื้นที่สีขาวและแปลงเป็นตัวพิมพ์ใหญ่ ตัวอย่างจะเป็น: foo = "Bs12 3ab" foo.replace(" ", "").rstrip(foo[-3:]).upper() มันใช้งานได้และให้ BS12 แก่ฉันซึ่งเป็นสิ่งที่ฉันต้องการ แต่ถ้าตัวอักษรตัวที่ 4 และ 3 ตัวสุดท้ายเหมือนกันฉันก็หลวมทั้งคู่เช่นถ้าfoo = "BS11 1AA"ฉันเพิ่งได้รับ'BS' ตัวอย่างของfooอาจเป็น: BS1 1AB bs11ab BS111ab สตริงอาจเป็นอักขระ 6 หรือ 7 ตัวและฉันต้องเลื่อน 3 ตัวสุดท้าย (สมมติว่าไม่มีช่องว่าง) เคล็ดลับใด ๆ
146 python  string 

11
ลบสตริงออกจากจุดเริ่มต้นของสตริง
ฉันมีสตริงที่มีลักษณะเช่นนี้: $str = "bla_string_bla_bla_bla"; ฉันจะลบอันแรกออกได้bla_อย่างไร; แต่ถ้าพบที่จุดเริ่มต้นของสตริงหรือไม่ ด้วยstr_replace()ก็เอาทั้งหมด bla_ของ
146 php  string 

7
ค้นหาคอลัมน์ที่มีชื่อประกอบด้วยสตริงเฉพาะ
ฉันมีดาต้าเฟรมที่มีชื่อคอลัมน์และฉันต้องการค้นหาอันที่มีสตริงที่แน่นอน แต่ไม่ตรงกันทุกประการ ฉันค้นหา'spike'ในชื่อคอลัมน์ที่ชอบ'spike-2', 'hey spike', 'spiked-in'(คน'spike'ส่วนหนึ่งอยู่เสมอต่อเนื่อง) ฉันต้องการให้ชื่อคอลัมน์ถูกส่งคืนเป็นสตริงหรือตัวแปรดังนั้นฉันจึงเข้าถึงคอลัมน์ในภายหลังโดยมีdf['name']หรือdf[name]ตามปกติ ฉันพยายามหาวิธีการแล้ว แต่ก็ไม่มีประโยชน์ เคล็ดลับใด ๆ

8
เหตุใดความยาวของสตริงนี้จึงยาวเกินจำนวนอักขระในนั้น
รหัสนี้: string a = "abc"; string b = "A𠈓C"; Console.WriteLine("Length a = {0}", a.Length); Console.WriteLine("Length b = {0}", b.Length); เอาท์พุท: Length a = 3 Length b = 4 ทำไม? สิ่งเดียวที่ฉันจินตนาการได้คือตัวอักษรจีนมีความยาว 2 ไบต์และ.Lengthวิธีคืนค่าจำนวนไบต์

20
สร้างสตริงตัวอักษรผสมตัวเลขแบบสุ่มในโกโก้
ฉันต้องการที่จะเรียกวิธีการผ่านความยาวและมีมันสร้างสตริงตัวอักษรและตัวเลขแบบสุ่ม มียูทิลิตี้ไลบรารีใดบ้างที่อาจมีฟังก์ชั่นประเภทนี้มากมาย

7
วิธีรับจำนวนอักขระในสตริง
ฉันจะรับจำนวนอักขระของสตริงใน Go ได้อย่างไร? ตัวอย่างเช่นถ้าฉันมีสตริงวิธีการที่ควรจะกลับ"hello" 5ฉันเห็นว่าlen(str)คืนค่าจำนวนไบต์ไม่ใช่จำนวนตัวอักษรดังนั้นlen("£")ส่งคืน 2 แทน 1 เนื่องจาก£ถูกเข้ารหัสด้วยสองไบต์ใน UTF-8



โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.