มีใครบางคนมีความคิดที่ฉันสามารถหารหัสจาวาสคริปต์เพื่อแยกวิเคราะห์ข้อมูล CSV หรือไม่
มีใครบางคนมีความคิดที่ฉันสามารถหารหัสจาวาสคริปต์เพื่อแยกวิเคราะห์ข้อมูล CSV หรือไม่
คำตอบ:
คุณสามารถใช้ฟังก์ชัน CSVToArray () ที่กล่าวถึงในรายการบล็อกนี้
<script type="text/javascript">
// ref: http://stackoverflow.com/a/1293163/2343
// This will parse a delimited string into an array of
// arrays. The default delimiter is the comma, but this
// can be overriden in the second argument.
function CSVToArray( strData, strDelimiter ){
// Check to see if the delimiter is defined. If not,
// then default to comma.
strDelimiter = (strDelimiter || ",");
// Create a regular expression to parse the CSV values.
var objPattern = new RegExp(
(
// Delimiters.
"(\\" + strDelimiter + "|\\r?\\n|\\r|^)" +
// Quoted fields.
"(?:\"([^\"]*(?:\"\"[^\"]*)*)\"|" +
// Standard fields.
"([^\"\\" + strDelimiter + "\\r\\n]*))"
),
"gi"
);
// Create an array to hold our data. Give the array
// a default empty first row.
var arrData = [[]];
// Create an array to hold our individual pattern
// matching groups.
var arrMatches = null;
// Keep looping over the regular expression matches
// until we can no longer find a match.
while (arrMatches = objPattern.exec( strData )){
// Get the delimiter that was found.
var strMatchedDelimiter = arrMatches[ 1 ];
// Check to see if the given delimiter has a length
// (is not the start of string) and if it matches
// field delimiter. If id does not, then we know
// that this delimiter is a row delimiter.
if (
strMatchedDelimiter.length &&
strMatchedDelimiter !== strDelimiter
){
// Since we have reached a new row of data,
// add an empty row to our data array.
arrData.push( [] );
}
var strMatchedValue;
// Now that we have our delimiter out of the way,
// let's check to see which kind of value we
// captured (quoted or unquoted).
if (arrMatches[ 2 ]){
// We found a quoted value. When we capture
// this value, unescape any double quotes.
strMatchedValue = arrMatches[ 2 ].replace(
new RegExp( "\"\"", "g" ),
"\""
);
} else {
// We found a non-quoted value.
strMatchedValue = arrMatches[ 3 ];
}
// Now that we have our value string, let's add
// it to the data array.
arrData[ arrData.length - 1 ].push( strMatchedValue );
}
// Return the parsed data.
return( arrData );
}
</script>
undefined
สำหรับเขตที่ว่างเปล่าที่ยกมา ตัวอย่าง: CSVToArray("4,,6")
ให้ฉัน[["4","","6"]]
แต่ให้ฉันCSVToArray("4,\"\",6")
[["4",undefined,"6"]]
"([^\"\\"
"([^\\"
มิฉะนั้นการเสนอราคาซ้ำที่ใดก็ได้ในค่าที่ไม่ได้อ้างอิงจะเป็นการสิ้นสุดก่อนกำหนด พบวิธีที่ยากลำบากนี้ ...
มันเป็นปลั๊กอิน jquery ที่ออกแบบมาเพื่อทำงานเป็นโซลูชันแบบครบวงจรสำหรับการแยกวิเคราะห์ CSV ลงในข้อมูล Javascript มันจัดการกับทุกกรณีขอบเดียวที่นำเสนอในRFC 4180เช่นเดียวกับที่ปรากฏขึ้นสำหรับการส่งออก Excel / Google Spreadsheed (เช่นส่วนใหญ่เกี่ยวข้องกับค่า null) ที่ spec หายไป
ตัวอย่าง:
ติดตามศิลปิน, อัลบั้ม, ปี
อันตราย 'Busta Rhymes', 'Disaster Strikes', 1997
// calling this
music = $.csv.toArrays(csv)
// outputs...
[
["track","artist","album","year"],
["Dangerous","Busta Rhymes","When Disaster Strikes","1997"]
]
console.log(music[1][2]) // outputs: 'When Disaster Strikes'
ปรับปรุง:
โอ้ใช่ฉันควรจะพูดถึงว่ามันสามารถกำหนดค่าได้อย่างสมบูรณ์
music = $.csv.toArrays(csv, {
delimiter:"'", // sets a custom value delimiter character
separator:';', // sets a custom field separator character
});
อัปเดต 2:
ตอนนี้ใช้ได้กับ jQuery บน Node.js ด้วย ดังนั้นคุณมีตัวเลือกในการแยกวิเคราะห์ฝั่งไคลเอ็นต์หรือฝั่งเซิร์ฟเวอร์ด้วย lib เดียวกัน
อัปเดต 3:
ตั้งแต่ปิด Google Code, jQuery-CSV ได้รับการอพยพไป GitHub
คำเตือน: ฉันยังเป็นผู้เขียน jQuery-CSV
csv
ในโค้ดโซลูชันอ้างถึง.csv filename
? ฉันสนใจเครื่องมือ JS / JQuery ที่ดีในการแยกไฟล์ csv
ฉันมีการใช้งานเป็นส่วนหนึ่งของโครงการสเปรดชีต
รหัสนี้ยังไม่ได้ทดสอบอย่างละเอียด แต่ทุกคนสามารถใช้งานได้
ดังที่คำตอบบางส่วนระบุไว้การใช้งานของคุณอาจง่ายกว่ามากหากคุณมีไฟล์DSVหรือTSVเนื่องจากไม่อนุญาตให้ใช้ตัวแยกเรคคอร์ดและฟิลด์ในค่า ในทางกลับกัน CSV สามารถมีเครื่องหมายจุลภาคและบรรทัดใหม่ภายในเขตข้อมูลซึ่งแบ่งวิธีการ regex และการแยกส่วนใหญ่
var CSV = {
parse: function(csv, reviver) {
reviver = reviver || function(r, c, v) { return v; };
var chars = csv.split(''), c = 0, cc = chars.length, start, end, table = [], row;
while (c < cc) {
table.push(row = []);
while (c < cc && '\r' !== chars[c] && '\n' !== chars[c]) {
start = end = c;
if ('"' === chars[c]){
start = end = ++c;
while (c < cc) {
if ('"' === chars[c]) {
if ('"' !== chars[c+1]) { break; }
else { chars[++c] = ''; } // unescape ""
}
end = ++c;
}
if ('"' === chars[c]) { ++c; }
while (c < cc && '\r' !== chars[c] && '\n' !== chars[c] && ',' !== chars[c]) { ++c; }
} else {
while (c < cc && '\r' !== chars[c] && '\n' !== chars[c] && ',' !== chars[c]) { end = ++c; }
}
row.push(reviver(table.length-1, row.length, chars.slice(start, end).join('')));
if (',' === chars[c]) { ++c; }
}
if ('\r' === chars[c]) { ++c; }
if ('\n' === chars[c]) { ++c; }
}
return table;
},
stringify: function(table, replacer) {
replacer = replacer || function(r, c, v) { return v; };
var csv = '', c, cc, r, rr = table.length, cell;
for (r = 0; r < rr; ++r) {
if (r) { csv += '\r\n'; }
for (c = 0, cc = table[r].length; c < cc; ++c) {
if (c) { csv += ','; }
cell = replacer(r, c, table[r][c]);
if (/[,\r\n"]/.test(cell)) { cell = '"' + cell.replace(/"/g, '""') + '"'; }
csv += (cell || 0 === cell) ? cell : '';
}
}
return csv;
}
};
undefined
เซลล์ ตัวอย่างเช่นconsole.log(CSV.parse("first,last,age\r\njohn,doe,"));
console.log(CSV.parse("0,,2,3"));
if ('\r' === chars[c]) { ... }
:if (end === c-1) { row.push(reviver(table.length-1, row.length, '')); }
ต่อไปนี้เป็นตัวแยกวิเคราะห์ CSV ที่ง่ายมากที่จัดการฟิลด์ที่มีเครื่องหมายจุลภาคบรรทัดใหม่และเครื่องหมายคำพูดคู่ ไม่มีการแยกหรือ RegEx มันจะสแกนสตริงอินพุต 1-2 ตัวอักษรในแต่ละครั้งและสร้างอาร์เรย์
ทดสอบที่http://jsfiddle.net/vHKYH/
function parseCSV(str) {
var arr = [];
var quote = false; // true means we're inside a quoted field
// iterate over each character, keep track of current row and column (of the returned array)
for (var row = 0, col = 0, c = 0; c < str.length; c++) {
var cc = str[c], nc = str[c+1]; // current character, next character
arr[row] = arr[row] || []; // create a new row if necessary
arr[row][col] = arr[row][col] || ''; // create a new column (start with empty string) if necessary
// If the current character is a quotation mark, and we're inside a
// quoted field, and the next character is also a quotation mark,
// add a quotation mark to the current column and skip the next character
if (cc == '"' && quote && nc == '"') { arr[row][col] += cc; ++c; continue; }
// If it's just one quotation mark, begin/end quoted field
if (cc == '"') { quote = !quote; continue; }
// If it's a comma and we're not in a quoted field, move on to the next column
if (cc == ',' && !quote) { ++col; continue; }
// If it's a newline (CRLF) and we're not in a quoted field, skip the next character
// and move on to the next row and move to column 0 of that new row
if (cc == '\r' && nc == '\n' && !quote) { ++row; col = 0; ++c; continue; }
// If it's a newline (LF or CR) and we're not in a quoted field,
// move on to the next row and move to column 0 of that new row
if (cc == '\n' && !quote) { ++row; col = 0; continue; }
if (cc == '\r' && !quote) { ++row; col = 0; continue; }
// Otherwise, append the current character to the current column
arr[row][col] += cc;
}
return arr;
}
if (cc == '\r' && nc == '\n' && !quote) { ++row; col = 0; ++c; continue; } if (cc == '\n' && !quote) { ++row; col = 0; continue; }
นี่คือไวยากรณ์ PEG (.js) ของฉันที่ดูเหมือนว่าตกลงที่ RFC 4180 (นั่นคือจัดการตัวอย่างที่http://en.wikipedia.org/wiki/Comma-separated_values ):
start
= [\n\r]* first:line rest:([\n\r]+ data:line { return data; })* [\n\r]* { rest.unshift(first); return rest; }
line
= first:field rest:("," text:field { return text; })*
& { return !!first || rest.length; } // ignore blank lines
{ rest.unshift(first); return rest; }
field
= '"' text:char* '"' { return text.join(''); }
/ text:[^\n\r,]* { return text.join(''); }
char
= '"' '"' { return '"'; }
/ [^"]
ลองที่http://jsfiddle.net/knvzk/10หรือhttp://pegjs.majda.cz/online ดาวน์โหลด parser ที่สร้างขึ้นที่https://gist.github.com/3362830
csvToArray v1.3
ขนาดกะทัดรัด (645 ไบต์) แต่มีฟังก์ชั่นที่ใช้งานร่วมกันได้เพื่อแปลงสตริง CSV เป็นอาร์เรย์ 2D ซึ่งเป็นไปตามมาตรฐาน RFC4180
https://code.google.com/archive/p/csv-to-array/downloads
การใช้งานทั่วไป: jQuery
$.ajax({
url: "test.csv",
dataType: 'text',
cache: false
}).done(function(csvAsString){
csvAsArray=csvAsString.csvToArray();
});
การใช้งานทั่วไป: Javascript
csvAsArray = csvAsString.csvToArray();
แทนที่ตัวคั่นฟิลด์
csvAsArray = csvAsString.csvToArray("|");
แทนที่ตัวคั่นเรกคอร์ด
csvAsArray = csvAsString.csvToArray("", "#");
แทนที่หัวข้าม
csvAsArray = csvAsString.csvToArray("", "", 1);
แทนที่ทั้งหมด
csvAsArray = csvAsString.csvToArray("|", "#", 1);
ฉันไม่แน่ใจว่าทำไมฉันไม่สามารถออกจากอดีต ทำงานให้ฉัน ดูเหมือนว่าจะล้มเหลวในช่องว่างหรือช่องที่มีเครื่องหมายจุลภาคต่อท้าย ...
อันนี้ดูเหมือนว่าจะจัดการทั้ง
ฉันไม่ได้เขียนรหัส parser เพียงแค่ wrapper รอบ ๆ ฟังก์ชั่น parser เพื่อให้มันใช้งานได้กับไฟล์ ดูแหล่งที่มา
var Strings = {
/**
* Wrapped csv line parser
* @param s string delimited csv string
* @param sep separator override
* @attribution : http://www.greywyvern.com/?post=258 (comments closed on blog :( )
*/
parseCSV : function(s,sep) {
// http://stackoverflow.com/questions/1155678/javascript-string-newline-character
var universalNewline = /\r\n|\r|\n/g;
var a = s.split(universalNewline);
for(var i in a){
for (var f = a[i].split(sep = sep || ","), x = f.length - 1, tl; x >= 0; x--) {
if (f[x].replace(/"\s+$/, '"').charAt(f[x].length - 1) == '"') {
if ((tl = f[x].replace(/^\s+"/, '"')).length > 1 && tl.charAt(0) == '"') {
f[x] = f[x].replace(/^\s*"|"\s*$/g, '').replace(/""/g, '"');
} else if (x) {
f.splice(x - 1, 2, [f[x - 1], f[x]].join(sep));
} else f = f.shift().split(sep).concat(f);
} else f[x].replace(/""/g, '"');
} a[i] = f;
}
return a;
}
}
การแสดงออกปกติเพื่อช่วยเหลือ! โค้ดสองสามบรรทัดเหล่านี้จัดการฟิลด์ที่ยกมาอย่างเหมาะสมด้วยเครื่องหมายจุลภาค, เครื่องหมายคำพูด, และการขึ้นบรรทัดใหม่ตามมาตรฐาน RFC 4180
function parseCsv(data, fieldSep, newLine) {
fieldSep = fieldSep || ',';
newLine = newLine || '\n';
var nSep = '\x1D';
var qSep = '\x1E';
var cSep = '\x1F';
var nSepRe = new RegExp(nSep, 'g');
var qSepRe = new RegExp(qSep, 'g');
var cSepRe = new RegExp(cSep, 'g');
var fieldRe = new RegExp('(?<=(^|[' + fieldSep + '\\n]))"(|[\\s\\S]+?(?<![^"]"))"(?=($|[' + fieldSep + '\\n]))', 'g');
var grid = [];
data.replace(/\r/g, '').replace(/\n+$/, '').replace(fieldRe, function(match, p1, p2) {
return p2.replace(/\n/g, nSep).replace(/""/g, qSep).replace(/,/g, cSep);
}).split(/\n/).forEach(function(line) {
var row = line.split(fieldSep).map(function(cell) {
return cell.replace(nSepRe, newLine).replace(qSepRe, '"').replace(cSepRe, ',');
});
grid.push(row);
});
return grid;
}
const csv = 'A1,B1,C1\n"A ""2""","B, 2","C\n2"';
const separator = ','; // field separator, default: ','
const newline = ' <br /> '; // newline representation in case a field contains newlines, default: '\n'
var grid = parseCsv(csv, separator, newline);
// expected: [ [ 'A1', 'B1', 'C1' ], [ 'A "2"', 'B, 2', 'C <br /> 2' ] ]
คุณไม่จำเป็นต้องใช้ parser-generator เช่น lex / yacc การแสดงออกปกติจัดการ RFC 4180 ได้อย่างถูกต้องขอบคุณ lookbehind เชิงบวก lookbehind เชิงลบและ lookahead เชิงบวก
โคลน / รหัสดาวน์โหลดที่https://github.com/peterthoeny/parse-csv-js
ฉันได้สร้างสคริปต์จาวาสคริปต์นี้เพื่อแยก CSV ในสตริงเพื่อวัตถุอาร์เรย์ ฉันคิดว่ามันจะดีกว่าที่จะแยก CSV ทั้งหมดออกเป็นบรรทัดฟิลด์และประมวลผลตามนั้น ฉันคิดว่ามันจะทำให้ง่ายสำหรับคุณที่จะเปลี่ยนรหัสเพื่อให้เหมาะกับความต้องการของคุณ
ฉันหวังว่ามันจะช่วยคุณ ขอบคุณ
//
//
// CSV to object
//
//
const new_line_char = '\n';
const field_separator_char = ',';
function parse_csv(csv_str) {
var result = [];
let line_end_index_moved = false;
let line_start_index = 0;
let line_end_index = 0;
let csr_index = 0;
let cursor_val = csv_str[csr_index];
let found_new_line_char = get_new_line_char(csv_str);
let in_quote = false;
// handle \r\n
if (found_new_line_char == '\r\n') {
csv_str = csv_str.split(found_new_line_char).join(new_line_char);
}
// handle last char is not \n
if (csv_str[csv_str.length - 1] !== new_line_char) {
csv_str += new_line_char;
}
while (csr_index < csv_str.length) {
if (cursor_val === '"') {
in_quote = !in_quote;
} else if (cursor_val === new_line_char) {
if (in_quote === false) {
if (line_end_index_moved && (line_start_index <= line_end_index)) {
result.push(parse_csv_line(csv_str.substring(line_start_index, line_end_index)));
line_start_index = csr_index + 1;
} // else: just ignore line_end_index has not moved or line has not been sliced for parsing the line
} // else: just ignore because we are in quote
}
csr_index++;
cursor_val = csv_str[csr_index];
line_end_index = csr_index;
line_end_index_moved = true;
}
// handle \r\n
if (found_new_line_char == '\r\n') {
let new_result = [];
let curr_row;
for (var i = 0; i < result.length; i++) {
curr_row = [];
for (var j = 0; j < result[i].length; j++) {
curr_row.push(result[i][j].split(new_line_char).join('\r\n'));
}
new_result.push(curr_row);
}
result = new_result;
}
return result;
}
function parse_csv_line(csv_line_str) {
var result = [];
// let field_end_index_moved = false;
let field_start_index = 0;
let field_end_index = 0;
let csr_index = 0;
let cursor_val = csv_line_str[csr_index];
let in_quote = false;
// Pretend that the last char is the separator_char to complete the loop
csv_line_str += field_separator_char;
while (csr_index < csv_line_str.length) {
if (cursor_val === '"') {
in_quote = !in_quote;
} else if (cursor_val === field_separator_char) {
if (in_quote === false) {
if (field_start_index <= field_end_index) {
result.push(parse_csv_field(csv_line_str.substring(field_start_index, field_end_index)));
field_start_index = csr_index + 1;
} // else: just ignore field_end_index has not moved or field has not been sliced for parsing the field
} // else: just ignore because we are in quote
}
csr_index++;
cursor_val = csv_line_str[csr_index];
field_end_index = csr_index;
field_end_index_moved = true;
}
return result;
}
function parse_csv_field(csv_field_str) {
with_quote = (csv_field_str[0] === '"');
if (with_quote) {
csv_field_str = csv_field_str.substring(1, csv_field_str.length - 1); // remove the start and end quotes
csv_field_str = csv_field_str.split('""').join('"'); // handle double quotes
}
return csv_field_str;
}
// initial method: check the first newline character only
function get_new_line_char(csv_str) {
if (csv_str.indexOf('\r\n') > -1) {
return '\r\n';
} else {
return '\n'
}
}
ทำไมไม่ใช้เพียงแค่. split (',')
http://www.w3schools.com/jsref/jsref_split.asp
var str="How are you doing today?";
var n=str.split(" ");