ฉันมีไฟล์. CSV ซึ่งมีรูปแบบด้านล่าง:
"column 1","column 2","column 3","column 4","column 5","column 6","column 7","column 8","column 9","column 10
"12310","42324564756","a simple string with a , comma","string with or, without commas","string 1","USD","12","70%","08/01/2013",""
"23455","12312255564","string, with, multiple, commas","string with or, without commas","string 2","USD","433","70%","07/15/2013",""
"23525","74535243123","string , with commas, and - hypens and: semicolans","string with or, without commas","string 1","CAND","744","70%","05/06/2013",""
"46476","15467534544","lengthy string, with commas, multiple: colans","string with or, without commas","string 2","CAND","388","70%","09/21/2013",""
คอลัมน์ที่ 5 ของไฟล์มีสตริงที่แตกต่างกัน ฉันต้องการกรองไฟล์ตามค่าคอลัมน์ที่ 5 ให้บอกว่าฉันต้องการไฟล์ใหม่จากไฟล์ปัจจุบันที่มีการบันทึกเฉพาะกับค่า "สตริง 1" ในเขตข้อมูลที่ห้า
สำหรับสิ่งนี้ฉันลองคำสั่งด้านล่าง
awk -F"," ' { if toupper($5) == "STRING 1") PRINT }' file1.csv > file2.csv
แต่มันทำให้ฉันมีข้อผิดพลาดดังต่อไปนี้:
awk: { if toupper($5) == "STRING 1") PRINT }
awk: ^ syntax error
awk: { if toupper($5) == "STRING 1") PRINT }
awk: ^ syntax error
จากนั้นฉันก็ใช้สิ่งต่อไปนี้ซึ่งให้ผลลัพธ์ที่แปลกแก่ฉัน
awk -F"," '$5="string 1" {print}' file1.csv > file2.csv
เอาท์พุท:
"column 1" "column 2" "column 3" "column 4" string 1 "column 6" "column 7" "column 8" "column 9" "column 10
"12310" "42324564756" "a simple string with a comma" string 1 without commas" "string 1" "USD" "12" "70%" "08/01/2013" ""
"23455" "12312255564" "string with string 1 commas" "string with or without commas" "string 2" "USD" "433" "70%" "07/15/2013" ""
"23525" "74535243123" "string with commas string 1 "string with or without commas" "string 1" "CAND" "744" "70%" "05/06/2013" ""
"46476" "15467534544" "lengthy string with commas string 1 "string with or without commas" "string 2" "CAND" "388" "70%" "09/21/2013" ""
PS: ฉันใช้คำสั่ง toupper เป็นด้านปลอดภัยเพราะฉันไม่แน่ใจว่าสตริงจะเป็นตัวพิมพ์เล็กหรือสูงกว่า ฉันต้องรู้ว่ามีอะไรผิดปกติกับรหัสของฉันและถ้าช่องว่างในสตริงมีความสำคัญในขณะที่ค้นหารูปแบบโดยใช้ AWK
'","'
หน้าที่เป็นตัวคั่นมิฉะนั้นมันจะแก้ปัญหาของฉันได้ ... ทางออกที่ดี ...