คุณจะแปลงสตริงเป็นอาร์เรย์อักขระใน JavaScript ได้อย่างไร
ฉันคิดว่าจะได้สตริงเหมือน"Hello world!"
อาร์เรย์
['H','e','l','l','o',' ','w','o','r','l','d','!']
คุณจะแปลงสตริงเป็นอาร์เรย์อักขระใน JavaScript ได้อย่างไร
ฉันคิดว่าจะได้สตริงเหมือน"Hello world!"
อาร์เรย์
['H','e','l','l','o',' ','w','o','r','l','d','!']
คำตอบ:
หมายเหตุ: นี่ไม่ใช่การทำตาม unicode
"I💖U".split('')
ส่งผลให้มีอาร์เรย์อักขระ 4 ตัว["I", "�", "�", "u"]
ซึ่งสามารถนำไปสู่ข้อบกพร่องที่เป็นอันตราย ดูคำตอบด้านล่างสำหรับทางเลือกที่ปลอดภัย
เพียงแค่แยกมันด้วยสตริงว่าง
var output = "Hello world!".split('');
console.log(output);
ดูเอกสารString.prototype.split()
MDN
"randomstring".length;
//12
"randomstring"[2];
//"n"
str.length
ไม่ได้บอกจำนวนอักขระในสตริงเนื่องจากอักขระบางตัวใช้พื้นที่มากกว่าอักขระอื่น str.length
บอกจำนวนตัวเลข 16 บิตให้คุณทราบ
ในฐานะที่เป็นhippietrail แสดงให้เห็น , คำตอบของ Mederสามารถทำลายคู่ตัวแทนและตีความผิด“ตัวอักษร”. ตัวอย่างเช่น:
// DO NOT USE THIS!
> '𝟘𝟙𝟚𝟛'.split('')
[ '�', '�', '�', '�', '�', '�', '�', '�' ]
ฉันขอแนะนำให้ใช้หนึ่งในฟีเจอร์ ES2015 ต่อไปนี้เพื่อจัดการลำดับอักขระอย่างถูกต้อง
> [...'𝟘𝟙𝟚𝟛']
[ '𝟘', '𝟙', '𝟚', '𝟛' ]
> Array.from('𝟘𝟙𝟚𝟛')
[ '𝟘', '𝟙', '𝟚', '𝟛' ]
u
ตั้งค่าสถานะRegExp> '𝟘𝟙𝟚𝟛'.split(/(?=[\s\S])/u)
[ '𝟘', '𝟙', '𝟚', '𝟛' ]
ใช้/(?=[\s\S])/u
แทน/(?=.)/u
เพราะไม่ตรงกับการขึ้นบรรทัดใหม่.
หากคุณยังอยู่ในยุค ES5.1 (หรือถ้าเบราว์เซอร์ของคุณไม่จัดการ regex นี้อย่างถูกต้อง - เช่น Edge) คุณสามารถใช้ทางเลือกนี้ (transpiled โดยBabel ):
> '𝟘𝟙𝟚𝟛'.split(/(?=(?:[\0-\uD7FF\uE000-\uFFFF]|[\uD800-\uDBFF][\uDC00-\uDFFF]|[\uD800-\uDBFF](?![\uDC00-\uDFFF])|(?:[^\uD800-\uDBFF]|^)[\uDC00-\uDFFF]))/);
[ '𝟘', '𝟙', '𝟚', '𝟛' ]
โปรดทราบว่า Babel พยายามจัดการตัวแทนเสมือนที่ไม่ตรงกันอย่างถูกต้อง อย่างไรก็ตามสิ่งนี้ดูเหมือนจะไม่ได้ผลสำหรับตัวแทนเสมือนต่ำ
🏳️🌈
และแยกการรวมเครื่องหมายกำกับจากอักขระ หากคุณต้องการที่จะแยกออกเป็นกระจุกตัวอักษรแทนของตัวละครดูstackoverflow.com/a/45238376
spread
ไวยากรณ์
คุณสามารถใช้ไวยากรณ์การแพร่กระจายซึ่งเป็น Array Initializer ที่นำมาใช้ในมาตรฐานECMAScript 2015 (ES6) :
var arr = [...str];
ตัวอย่าง
function a() {
return arguments;
}
var str = 'Hello World';
var arr1 = [...str],
arr2 = [...'Hello World'],
arr3 = new Array(...str),
arr4 = a(...str);
console.log(arr1, arr2, arr3, arr4);
ผลลัพธ์สามรายการแรกใน:
["H", "e", "l", "l", "o", " ", "W", "o", "r", "l", "d"]
ผลลัพธ์สุดท้ายเข้ามา
{0: "H", 1: "e", 2: "l", 3: "l", 4: "o", 5: " ", 6: "W", 7: "o", 8: "r", 9: "l", 10: "d"}
สนับสนุนเบราว์เซอร์
ตรวจสอบตารางการทำงานร่วมกัน ECMAScript ES6
อ่านเพิ่มเติม
spread
ถูกอ้างถึงเป็น " splat
" (เช่นในPHPหรือRubyหรือเป็น " scatter
" (เช่นในPython )
การสาธิต
Array.from
นอกจากนี้คุณยังสามารถใช้
var m = "Hello world!";
console.log(Array.from(m))
วิธีนี้ได้รับการแนะนำใน ES6
นี่เป็นคำถามเก่า แต่ฉันเจอวิธีแก้ไขปัญหาอื่นที่ยังไม่ได้ระบุไว้
คุณสามารถใช้ฟังก์ชัน Object.assign เพื่อรับเอาต์พุตที่ต้องการ:
var output = Object.assign([], "Hello, world!");
console.log(output);
// [ 'H', 'e', 'l', 'l', 'o', ',', ' ', 'w', 'o', 'r', 'l', 'd', '!' ]
ไม่จำเป็นว่าถูกหรือผิดเพียงแค่ตัวเลือกอื่น
Array.from("Hello, world")
ไกล
[..."Hello, world"]
มันคือ:
var mystring = 'foobar';
console.log(mystring[0]); // Outputs 'f'
console.log(mystring[3]); // Outputs 'b'
หรือสำหรับเวอร์ชันที่เป็นมิตรกับเบราว์เซอร์รุ่นเก่าให้ใช้:
var mystring = 'foobar';
console.log(mystring.charAt(3)); // Outputs 'b'
alert("Hello world!" == ['H','e','l','l','o',' ','w','o','r','l','d'])
mystring.charAt(index)
รุ่นข้ามเบราว์เซอร์
charAt()
แม้ว่าฉันต้องการใช้ชุดตัวเลือก array-ish ยี้ IE
มี (อย่างน้อย) สามสิ่งที่แตกต่างที่คุณอาจคิดว่าเป็น "ตัวละคร" และดังนั้นจึงมีวิธีการที่แตกต่างกันสามประเภทที่คุณอาจต้องการใช้
เดิมสตริง JavaScript ถูกประดิษฐ์ขึ้นเป็นลำดับของหน่วยรหัส UTF-16 กลับมาที่จุดในประวัติศาสตร์เมื่อมีความสัมพันธ์แบบหนึ่งต่อหนึ่งระหว่างหน่วยรหัส UTF-16 และจุดโค้ด Unicode .length
ทรัพย์สินของสตริงที่มีขนาดความยาวของมันในหน่วย UTF-16 รหัสและเมื่อคุณทำsomeString[i]
คุณจะได้รับฉัน TH UTF-16 someString
รหัสหน่วยของ
ดังนั้นคุณสามารถรับอาร์เรย์ของรหัสหน่วย UTF-16 จากสตริงโดยใช้รูปแบบ C-for-loop พร้อมกับตัวแปร index ...
const yourString = 'Hello, World!';
const charArray = [];
for (let i=0; i<=yourString.length; i++) {
charArray.push(yourString[i]);
}
console.log(charArray);
นอกจากนี้ยังมีวิธีสั้น ๆ เพื่อให้ได้สิ่งเดียวกันเช่นใช้.split()
กับสตริงว่างเป็นตัวคั่น:
const charArray = 'Hello, World!'.split('');
console.log(charArray);
อย่างไรก็ตามหากสตริงของคุณมีจุดรหัสที่ประกอบด้วยหลายหน่วยรหัส UTF-16 สิ่งนี้จะแบ่งออกเป็นหน่วยรหัสแต่ละหน่วยซึ่งอาจไม่ใช่สิ่งที่คุณต้องการ ตัวอย่างเช่นสตริง'𝟘𝟙𝟚𝟛'
ประกอบด้วยจุดโค้ดยูนิโคดสี่จุด (รหัสจุด 0x1D7D8 ถึง 0x1D7DB) ซึ่งใน UTF-16 แต่ละหน่วยประกอบด้วยหน่วยรหัส UTF-16 สองชุด หากเราแยกสตริงนั้นโดยใช้วิธีการด้านบนเราจะได้รับชุดโค้ดแปดชุด:
const yourString = '𝟘𝟙𝟚𝟛';
console.log('First code unit:', yourString[0]);
const charArray = yourString.split('');
console.log('charArray:', charArray);
ดังนั้นบางทีเราต้องการแบ่งสตริงของเราเป็น Unicode Code Points แทน! มันเป็นไปได้ตั้งแต่ ECMAScript 2015 ได้เพิ่มแนวคิดของการทำซ้ำให้กับภาษา ตอนนี้สตริงเป็น iterables และเมื่อคุณวนซ้ำ (เช่นfor...of
วนซ้ำ) คุณจะได้รับคะแนนโค้ด Unicode ไม่ใช่หน่วยรหัส UTF-16:
const yourString = '𝟘𝟙𝟚𝟛';
const charArray = [];
for (const char of yourString) {
charArray.push(char);
}
console.log(charArray);
เราสามารถย่นการใช้นี้ให้สั้นลงArray.from
ซึ่งจะวนซ้ำไปเรื่อย ๆ ผ่านการ iterable:
const yourString = '𝟘𝟙𝟚𝟛';
const charArray = Array.from(yourString);
console.log(charArray);
อย่างไรก็ตามจุดรหัส Unicode ไม่ได้ในสิ่งที่เป็นไปได้ที่ใหญ่ที่สุดที่อาจจะถือว่าเป็น "ตัวละคร" อย่างใดอย่างหนึ่ง ตัวอย่างของสิ่งต่าง ๆ ที่อาจถือได้ว่าเป็น "ตัวละคร" อย่างเดียว แต่ควรประกอบด้วยรหัสจุดหลายจุดรวมถึง
เราสามารถเห็นด้านล่างว่าถ้าเราพยายามแปลงสตริงที่มีตัวอักษรดังกล่าวเป็นอาเรย์ผ่านกลไกการทำซ้ำด้านบนตัวละครจะแตกตัวในอาร์เรย์ผลลัพธ์ (ในกรณีที่อักขระใด ๆ ไม่แสดงผลในระบบของคุณyourString
ด้านล่างประกอบด้วยตัวอักษรAพร้อมสำเนียงเฉียบพลันตามด้วยธงสหราชอาณาจักรตามด้วยหญิงผิวดำ)
const yourString = 'Á🇬🇧👩🏿';
const charArray = Array.from(yourString);
console.log(charArray);
หากเราต้องการให้แต่ละรายการเหล่านี้เป็นรายการเดียวในอาเรย์สุดท้ายของเราจากนั้นเราต้องการอาเรย์ของแบบกราฟิกไม่ใช่รหัสจุด
JavaScript ไม่มีการสนับสนุนในตัวสำหรับสิ่งนี้ - อย่างน้อยยังไม่ ดังนั้นเราจำเป็นต้องมีห้องสมุดที่เข้าใจและนำกฎ Unicode มาใช้สำหรับการรวมจุดรหัสใด ๆ เข้าด้วยกันเป็นกราฟ โชคดีที่มีอยู่: orling ของอักษร-แยก คุณจะต้องการติดตั้งด้วย npm หรือหากคุณไม่ได้ใช้ npm ให้ดาวน์โหลดไฟล์ index.js และแสดงด้วย<script>
แท็ก สำหรับตัวอย่างนี้ฉันจะโหลดจาก jsDelivr
อักษร-แยกจะช่วยให้เราGraphemeSplitter
เรียนกับสามวิธี: splitGraphemes
, และiterateGraphemes
countGraphemes
ตามธรรมชาติเราต้องการsplitGraphemes
:
const splitter = new GraphemeSplitter();
const yourString = 'Á🇬🇧👩🏿';
const charArray = splitter.splitGraphemes(yourString);
console.log(charArray);
<script src="https://cdn.jsdelivr.net/npm/grapheme-splitter@1.0.4/index.js"></script>
และเรามี - อาร์เรย์ของสามกราฟซึ่งอาจเป็นสิ่งที่คุณต้องการ
คุณสามารถวนซ้ำตามความยาวของสตริงและกดอักขระแต่ละตำแหน่ง :
const str = 'Hello World';
const stringToArray = (text) => {
var chars = [];
for (var i = 0; i < text.length; i++) {
chars.push(text[i]);
}
return chars
}
console.log(stringToArray(str))
"😃".charAt(0)
จะส่งคืนอักขระที่ใช้ไม่ได้
.split("")
ตัวเลือกที่เร็วที่สุดอีกครั้ง
.split("")
ดูเหมือนว่าจะได้รับการปรับอย่างหนักใน Firefox ในขณะที่ลูปมีประสิทธิภาพคล้ายกันในการแยกโครเมี่ยมและ Firefox ได้เร็วขึ้นอย่างมีนัยสำคัญใน Firefox สำหรับอินพุตขนาดเล็กและขนาดใหญ่
คำตอบง่ายๆ:
let str = 'this is string, length is >26';
console.log([...str]);
ความเป็นไปได้อย่างหนึ่งคือถัดไป:
console.log([1, 2, 3].map(e => Math.random().toString(36).slice(2)).join('').split('').map(e => Math.random() > 0.5 ? e.toUpperCase() : e).join(''));
แล้วเรื่องนี้ล่ะ
function stringToArray(string) {
let length = string.length;
let array = new Array(length);
while (length--) {
array[length] = string[length];
}
return array;
}
Array.prototype.sliceจะทำงานเช่นกัน
const result = Array.prototype.slice.call("Hello world!");
console.log(result);
"𨭎".split('')
["�", "�"]