บน Linux orig-file.txt
ฉันมีไฟล์ ไฟล์นี้มี 4 ฟิลด์ในขณะนี้ แต่อาจน้อยกว่านี้ (ไฟล์นี้สร้างโดยแอปพลิเคชันอื่น)
ตัวเลือกที่ดีที่สุดในการแปลorig-file.txt
ไฟล์เป็นไฟล์เช่นอะไรoutput-file.txt
(อาจเป็นได้ด้วยเชลล์สคริปต์หรือ awk เป็นต้น)
orig-file.txt
CREATE_TIMESTAMP TELEPHONE_NUMBER ID TYPE
------------------- -------------------- ---------- -----------------
24-09-2009 16:17:45 33633333333 20 other_mmm_phone
24-09-2009 17:45:07 33644444444 20 other_mmm_phone
07-10-2009 10:45:49 12312312312 20 legacyphone
07-10-2009 11:46:38 59320000043 20 other_mmm_phone
ผลผลิต file.txt
CREATE_TIMESTAMP -> 24-09-2009 16:17:45
TELEPHONE_NUMBER -> 33633333333
ID -> 20
TYPE -> other_mmm_phone
---
CREATE_TIMESTAMP -> 24-09-2009 16:17:45
TELEPHONE_NUMBER -> 33633333333
ID -> 20
TYPE -> other_mmm_phone
---
ตัวอย่างจาก awk lang - (แต่มันไม่ทำงาน - :(
# awk 'NR>2 {
> printf "\
> %-16s -> %s\n\
> %-16s -> %s\n\
> %-16s -> %s\n\
> %-16s -> %s\
> \n\n\n---\n\n\n",\
> "CREATE_TIMESTAMP", $1" "$2,\
> "TELEPHONE_NUMBER", $3,\
> "ID", $4,\
> "TYPE", $5}\
> ' orig-file.txt
awk: newline in string near line 2
awk: syntax error near line 3
awk: illegal statement near line 3
awk: newline in string near line 7
ไม่ว่าไฟล์ดั้งเดิมหรือไฟล์เอาต์พุตของคุณจะเป็น CSV ที่นี่
—
slhck
ตกลงดูการอัปเดตของฉัน (ฉันลบคำ CSV) คุณไม่ใช่ CSV แต่ไฟล์อื่น ๆ ที่มีโครงสร้างเฉพาะ
—
yael
ฮึ่ม ฉันขอโทษที่เลือกคำเหล่านี้ แต่นี่เป็นโครงสร้างไฟล์ที่โง่ที่จะจัดการ ถ้ามันเป็นไฟล์ CSV มันจะง่ายสุด ๆ แต่นี่มันเป็นไปไม่ได้ที่จะแยกวิเคราะห์ คุณไม่สามารถรับข้อมูลในรูปแบบอื่นได้หรือไม่
—
slhck
ใครคือไฟล์ที่โง่ - orig-file.txt หรือ output-file.txt - ความแออัดของคุณคืออะไร? โปรดยกตัวอย่างอื่น ๆ ให้ฉันในรูปแบบที่ดีที่สุดที่ฉันสามารถรับได้จากไฟล์ orig-file.txt
—
yael
output-file.txt
เป็นรูปแบบที่ไม่ดีในสายตาของฉัน มีความชัดเจนน้อยกว่าในการอ่านด้วยตนเองมากกว่าorig-file.txt
imho