ฉันจะจัดการกับบรรทัดใหม่ใน JSON ได้อย่างไร


289

ฉันสร้าง JSON แล้วและฉันพยายามดึงมันเข้าไปในวัตถุใน JavaScript ฉันได้รับข้อผิดพลาด นี่คือสิ่งที่ฉันมี:

var data = '{"count" : 1, "stack" : "sometext\n\n"}';
var dataObj = eval('('+data+')');

สิ่งนี้ทำให้ฉันมีข้อผิดพลาด:

unterminated string literal

เมื่อJSON.parse(data)ฉันเห็นข้อความแสดงข้อผิดพลาดที่คล้ายกัน: " Unexpected token ↵" ใน Chrome และ " unterminated string literal" ใน Firefox และ IE

เมื่อฉันจะออก\nหลังจากsometextข้อผิดพลาดหายไปในทั้งสองกรณี ฉันไม่สามารถเข้าใจสาเหตุที่\nทำให้evalและJSON.parseล้มเหลวได้


19
ลองใช้ json parser จริงแทน eval
Eric

คำตอบ:


368

ฉันเดาว่านี่คือสิ่งที่คุณต้องการ:

var data = '{"count" : 1, "stack" : "sometext\\n\\n"}';

(คุณต้องหลีกเลี่ยง "\" ในสตริงของคุณ (เปลี่ยนเป็น double - "\") มิฉะนั้นจะกลายเป็นบรรทัดใหม่ในแหล่ง JSON ไม่ใช่ข้อมูล JSON)


101
ถูกต้องแน่นอน แต่ฉันต้องการเพิ่มเหตุผลในการทำเช่นนี้: ข้อมูลจำเพาะ JSON ที่ietf.org/rfc/rfc4627.txtมีประโยคนี้ในส่วน 2.5: "อักขระ Unicode ทั้งหมดอาจอยู่ใน เครื่องหมายคำพูดยกเว้นอักขระที่ต้องหลีกเลี่ยง: เครื่องหมายคำพูด, โซลิดย้อนกลับและอักขระควบคุม (U + 0000 ถึง U + 001F) เนื่องจากการขึ้นบรรทัดใหม่เป็นอักขระควบคุมจึงต้องมีการหลบหนี
daniel kullmann

1
ตาม www.json.org JSON ยอมรับลำดับการควบคุม "\ n" ในสตริง - และหากคุณลอง JSON.parse (['"a \\ na"']) [1] .charCodeAt (); ที่จะแสดง 10 - ซึ่งเป็น "Linefeed" ครั้งสุดท้ายที่ฉันตรวจสอบ --- BTW: หยุดกรีดร้อง!
BlaM

+ 1. ฉันมีปัญหาในการทำความเข้าใจการเข้ารหัส JSON แต่ "จะกลายเป็นบรรทัดใหม่ในแหล่ง JSON ไม่ใช่ข้อมูล JSON" ทำให้ชัดเจนสำหรับฉัน
amucunguzi

44

คุณจะต้องมีฟังก์ชั่นที่ใช้แทน\nการ\\nในกรณีที่dataไม่ได้เป็นตัวอักษรสตริง

function jsonEscape(str)  {
    return str.replace(/\n/g, "\\\\n").replace(/\r/g, "\\\\r").replace(/\t/g, "\\\\t");
}

var data = '{"count" : 1, "stack" : "sometext\n\n"}';
var dataObj = JSON.parse(jsonEscape(data));

ผลลัพธ์dataObjจะเป็น

Object {count: 1, stack: "sometext\n\n"}

3
คุณต้องหลบหนีตัวละครหลบหนีของคุณ (เช่น.replace("\\n", "\\\\n")) และฉันขอแนะนำให้ใช้ regex เพื่อให้สามารถแทนที่ได้หลายอินสแตนซ์ (เช่น.replace(/\n/g, "\\\\n"))
musefan

2
ทำไมคุณต้องหลบหนีตัวละครหนี? ฉันหมายถึงบางอย่างที่.replace("\n", "\\n")ควรจะทำงานได้ดี !! ตัวอย่างเช่นvar test = [{"description":"Some description about the product. This can be multi-line text."}]; console.log(JSON.parse(test.replace(/\n/g, "\\n")));จะส่งออกวัตถุได้อย่างสมบูรณ์แบบกับคอนโซลของเบราว์เซอร์[{"description":"Some description about the product.\nThis can be multi-line text."}]
Fr0zenFyr

BTW ในความคิดเห็นข้างต้นสตริง JSON ดั้งเดิมมีบรรทัดใหม่ซึ่งถูกลบออกโดย formatter ความคิดเห็นของ stackoverflow .. คุณจะเห็นว่าผลลัพธ์สุดท้ายหลังจากแทนที่ควรแทรกอักขระขึ้นบรรทัดใหม่\nในค่า
Fr0zenFyr

1
-1 คำตอบนี้สร้างสตริง JSON ที่ไม่ถูกต้องก่อน (เนื่องจาก newline เป็นอักขระควบคุม) จากนั้นพยายามแก้ไขด้วยชุดการแทนที่ที่ไม่สมบูรณ์ (มีอักขระควบคุมมากกว่า 3 ตัว) จากนั้นไปด้านบนปิดมันยังจัดการเพื่อใช้evalฟังก์ชั่น 17 upvotes ???
ฟิล

1
แล้วเครื่องหมายคำพูดที่ต้องหลบหนีด้วยล่ะ
ยืนอยู่คนเดียว

8

ตามข้อกำหนดhttp://www.ecma-international.org/publications/files/ECMA-ST/ECMA-404.pdf :

สตริงเป็นลำดับของจุดโค้ด Unicode ที่ห่อด้วยเครื่องหมายคำพูด ( U+0022) ทุกตัวอักษรอาจจะอยู่ในเครื่องหมายคำพูดยกเว้นสำหรับตัวละครที่จะต้องหนี: เครื่องหมายคำพูด ( U+0022), โซลิดัส (Reverse U+005C) และตัวละครที่ควบคุมการU+0000 U+001Fมีการแทนลำดับการหลีกเลี่ยงสองตัวละครของตัวละคร

ดังนั้นคุณไม่สามารถผ่าน0x0Aหรือ0x0Cรหัสโดยตรง เป็นสิ่งต้องห้าม! สเปคแนะนำให้ใช้ลำดับหนีรหัสที่ดีที่กำหนดจากU+0000การU+001F:

  • \fแสดงถึงอักขระฟีดฟอร์ม ( U+000C)
  • \nแสดงถึงอักขระตัวดึงข้อมูลบรรทัด ( U+000A)

เนื่องจากภาษาการเขียนโปรแกรมส่วนใหญ่ใช้\สำหรับการอ้างอิงคุณควรหลีกเลี่ยงไวยากรณ์การหลบหนี (double-escape - หนึ่งครั้งสำหรับภาษา / แพลตฟอร์มหนึ่งครั้งสำหรับ JSON เอง):

jsonStr = "{ \"name\": \"Multi\\nline.\" }";

3

คุณสามารถหนีออกจากสายอักขระของคุณบนเซิร์ฟเวอร์เมื่อเขียนค่าของฟิลด์ JSON และ unescape เมื่อดึงค่าในเบราว์เซอร์ไคลเอ็นต์เช่น

การติดตั้ง JavaScript ของเบราว์เซอร์หลักทั้งหมดมีคำสั่ง unescape

ตัวอย่าง:

บนเซิร์ฟเวอร์:

response.write "{""field1"":""" & escape(RS_Temp("textField")) & """}"

ในเบราว์เซอร์:

document.getElementById("text1").value = unescape(jsonObject.field1)

2

คุณอาจต้องการดูในฟังก์ชัน C # นี้เพื่อหลีกเลี่ยงสตริง:

http://www.aspcode.net/C-encode-a-string-for-JSON-JavaScript.aspx

public static string Enquote(string s)  
{ 
    if (s == null || s.Length == 0)  
    { 
        return "\"\""; 
    } 
    char         c; 
    int          i; 
    int          len = s.Length; 
    StringBuilder sb = new StringBuilder(len + 4); 
    string       t; 

    sb.Append('"'); 
    for (i = 0; i < len; i += 1)  
    { 
        c = s[i]; 
        if ((c == '\\') || (c == '"') || (c == '>')) 
        { 
            sb.Append('\\'); 
            sb.Append(c); 
        } 
        else if (c == '\b') 
            sb.Append("\\b"); 
        else if (c == '\t') 
            sb.Append("\\t"); 
        else if (c == '\n') 
            sb.Append("\\n"); 
        else if (c == '\f') 
            sb.Append("\\f"); 
        else if (c == '\r') 
            sb.Append("\\r"); 
        else 
        { 
            if (c < ' ')  
            { 
                //t = "000" + Integer.toHexString(c); 
                string t = new string(c,1); 
                t = "000" + int.Parse(tmp,System.Globalization.NumberStyles.HexNumber); 
                sb.Append("\\u" + t.Substring(t.Length - 4)); 
            }  
            else  
            { 
                sb.Append(c); 
            } 
        } 
    } 
    sb.Append('"'); 
    return sb.ToString(); 
} 

3
ทำไมนี้หลบหนี>?
nothingisnecessary

0

ฉันใช้ฟังก์ชันนี้เพื่อตัดอักขระขึ้นบรรทัดใหม่หรืออักขระอื่น ๆ ในข้อมูลเพื่อวิเคราะห์ข้อมูล JSON:

function normalize_str($str) {

    $invalid = array(
        'Š'=>'S', 'š'=>'s',  'Đ'=>'Dj', 'đ'=>'dj', 'Ž'=>'Z', 'ž'=>'z',
        'Č'=>'C', 'č'=>'c',  'Ć'=>'C',  'ć'=>'c',  'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A',
        'Ä'=>'A', 'Å'=>'A',  'Æ'=>'A',  'Ç'=>'C',  'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E',
        'Ì'=>'I', 'Í'=>'I',  'Î'=>'I',  'Ï'=>'I',  'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O',
        'Õ'=>'O', 'Ö'=>'O',  'Ø'=>'O',  'Ù'=>'U',  'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y',
        'Þ'=>'B', 'ß'=>'Ss', 'à'=>'a',  'á'=>'a',  'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a',
        'æ'=>'a', 'ç'=>'c',  'è'=>'e',  'é'=>'e',  'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i',
        'î'=>'i', 'ï'=>'i',  'ð'=>'o',  'ñ'=>'n',  'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o',
        'ö'=>'o', 'ø'=>'o',  'ù'=>'u',  'ú'=>'u',  'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b',
        'ÿ'=>'y', 'Ŕ'=>'R',  'ŕ'=>'r',
        "`" => "'", "´" => "'",  '"' => ',',  '`' => "'",
        '´' => "'", '"' => '\"', '"' => "\"", '´' => "'",
        "&acirc;€™" => "'",
        "{" => "",
        "~" => "",  "–" => "-",  "'" => "'",  "     " => " ");

    $str = str_replace(array_keys($invalid), array_values($invalid), $str);

    $remove = array("\n", "\r\n", "\r");
    $str = str_replace($remove, "\\n", trim($str));

    //$str = htmlentities($str, ENT_QUOTES);

    return htmlspecialchars($str);
}

echo normalize_str($lst['address']);

9
ในภาษาส่วนใหญ่คุณมีวิธีที่ดีกว่าในการตัดสำเนียงจากสตริง Unicode กว่าการเขียนฟังก์ชันการแมปของคุณเอง ดูคำถามนี้สำหรับตัวอย่างในไพ ธ อน: stackoverflow.com/questions/517923/…
MiniQuark

ยาเรามีหลายวิธีในการควบคุมตัวอักษรพิเศษในภาษาต่าง ๆ
ShivarajRH

2
นั่นเป็นเรื่องเลวร้ายที่จะดึงพวกมันออกไป เข้ารหัสให้ดีขึ้นเป็นการอ้างอิงอักขระตัวเลข XML แล้วถอดรหัสเมื่อได้รับจุดสิ้นสุด
Annarfych

0

JSON.stringify

JSON.stringify(`{ 
  a:"a"
}`)

จะแปลงสตริงข้างต้นเป็น

"{ \n      a:\"a\"\n    }"

ดังกล่าวที่นี่

json stringify

ฟังก์ชั่นนี้จะเพิ่มเครื่องหมายคำพูดคู่ที่จุดเริ่มต้นและจุดสิ้นสุดของสตริงการป้อนข้อมูลและหนีอักขระ JSON พิเศษ โดยเฉพาะอย่างยิ่งบรรทัดใหม่จะถูกแทนที่ด้วยอักขระ \ n แท็บจะถูกแทนที่ด้วยอักขระ \ t เครื่องหมายแบ็กสแลชจะถูกแทนที่ด้วยแบ็กสแลชสองตัว \ และแบ็กสแลชถูกวางไว้หน้าเครื่องหมายอัญประกาศแต่ละตัว


4
นี่เป็นรหัสเพียงคำตอบสำหรับคำถามอายุสิบเอ็ดปีที่มีคำตอบอื่น ๆ อีกแปดข้อ มันจะมีประโยชน์ในการอธิบายรหัสและอธิบายมุมมองใหม่ของคำถามที่อยู่คำตอบของคุณและหากเวลาผ่านไปและการออกรุ่นใหม่ส่งผลกระทบต่อคำตอบของคุณ
Jason Aller

-1

ฉันพบปัญหานั้นในขณะที่สร้างคลาสใน PHP 4 เพื่อเลียนแบบ json_encode (มีให้ใน PHP 5) นี่คือสิ่งที่ฉันมาด้วย:

class jsonResponse {
    var $response;

    function jsonResponse() {
        $this->response = array('isOK'=>'KO', 'msg'=>'Undefined');
    }

    function set($isOK, $msg) {
        $this->response['isOK'] = ($isOK) ? 'OK' : 'KO';
        $this->response['msg'] = htmlentities($msg);
    }

    function setData($data=null) {
        if(!is_null($data))
            $this->response['data'] = $data;
        elseif(isset($this->response['data']))
            unset($this->response['data']);
    }

    function send() {
        header('Content-type: application/json');
        echo '{"isOK":"' . $this->response['isOK'] . '","msg":' . $this->parseString($this->response['msg']);
        if(isset($this->response['data']))
            echo ',"data":' . $this->parseData($this->response['data']);
        echo '}';
    }

    function parseData($data) {
        if(is_array($data)) {
            $parsed = array();
            foreach ($data as $key=>$value)
                array_push($parsed, $this->parseString($key) . ':' . $this->parseData($value));
            return '{' . implode(',', $parsed) . '}';
        }
        else
            return $this->parseString($data);
    }

    function parseString($string) {
            $string = str_replace("\\", "\\\\", $string);
            $string = str_replace('/', "\\/", $string);
            $string = str_replace('"', "\\".'"', $string);
            $string = str_replace("\b", "\\b", $string);
            $string = str_replace("\t", "\\t", $string);
            $string = str_replace("\n", "\\n", $string);
            $string = str_replace("\f", "\\f", $string);
            $string = str_replace("\r", "\\r", $string);
            $string = str_replace("\u", "\\u", $string);
            return '"'.$string.'"';
    }
}

ผมทำตามกฎที่กล่าวถึงที่นี่ ฉันใช้สิ่งที่ฉันต้องการเท่านั้น แต่ฉันคิดว่าคุณสามารถปรับให้เข้ากับความต้องการของคุณในภาษาที่คุณใช้ ปัญหาในกรณีของฉันไม่เกี่ยวกับการขึ้นบรรทัดใหม่ตามที่ฉันคิดไว้ แต่เกี่ยวกับ / ไม่ถูกหลบหนี ฉันหวังว่าสิ่งนี้จะป้องกันไม่ให้คนอื่นจากอาการปวดหัวเล็กน้อยที่ฉันได้พบสิ่งที่ฉันทำผิด


2
6 ชวเลขสำหรับอักขระควบคุมที่ระบุใน json.org ไม่ใช่รายการที่ครบถ้วนสมบูรณ์ของอักขระควบคุมทั้งหมด ดังนั้นฟังก์ชันนี้สามารถสร้าง JSON ที่ไม่ถูกต้อง
Phil

-5

ตามที่ผมเข้าใจคำถามคุณมันไม่ได้เกี่ยวกับการแยก JSON เพราะคุณสามารถคัดลอกวาง JSON ของคุณเป็นรหัสของคุณโดยตรง - ดังนั้นถ้าเป็นกรณีนี้แล้วเพียงแค่คัดลอก JSON ของคุณโดยตรงไปยังdataObjตัวแปรโดยไม่ต้องห่อด้วยคำพูดเดียว (เคล็ดลับ: eval==evil)

var dataObj = {"count" : 1, "stack" : "sometext\n\n"};

console.log(dataObj);

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.