มีไฟล์ * .sgm มันเป็นชุดข้อมูลของฉันฉันต้องการแปลงเป็นชุดข้อมูลประเภทอื่นซึ่งทำให้ฉันสามารถเข้าถึงได้ด้วยโปรแกรมอย่าง WEKA Weka สนับสนุนไฟล์ * .arff เป็นหลัก
มีไฟล์ * .sgm มันเป็นชุดข้อมูลของฉันฉันต้องการแปลงเป็นชุดข้อมูลประเภทอื่นซึ่งทำให้ฉันสามารถเข้าถึงได้ด้วยโปรแกรมอย่าง WEKA Weka สนับสนุนไฟล์ * .arff เป็นหลัก
คำตอบ:
.sgm
เป็นมาตรฐาน เป็นประเภทของไฟล์ XML คุณสามารถลองเปลี่ยนชื่อนามสกุลไฟล์เป็น .xml
หรือ .arff
(ถ้าคุณยินดีเสีย XML)!
SGML เป็นมาตรฐานตั้งต้นสำหรับ XML ซึ่งมักจะคิดว่าเป็น SGML เวอร์ชันที่ง่ายกว่า คุณสามารถทำได้ อาจ เปลี่ยนชื่อเป็น. xml และทำการแก้ไขเล็กน้อยเพื่อให้เป็น XML ที่ถูกต้อง
SGML มีคุณสมบัติหลายอย่างเช่นการย่อขนาดแท็กที่ไม่ได้อยู่ใน XML ตัวอย่างเช่น (IIRC) สิ่งเหล่านี้จะเทียบเท่ากับตัวแยกวิเคราะห์ SGML:
<para/This is a paragraph./>
<para>This is a paragraph.</para>
(ฉันอาจจะมีไวยากรณ์ผิดเล็กน้อยสำหรับคนแรกมันค่อนข้างจะอยู่พักหนึ่งแล้ว)
SGML ยังสามารถบ่งบอกถึงการมีอยู่ขององค์ประกอบที่จำเป็นบางอย่างที่ XML ไม่ทำ (คุณต้องรวมไว้อย่างชัดเจน)
ขั้นตอนแรกคือการคว้าตัวแก้ไขข้อความ (หรือเครื่องมือบรรทัดคำสั่งเช่น xmlwf) เปลี่ยนชื่อเป็น. xml แล้วลองทำความสะอาดจนกว่าคุณจะหมดข้อผิดพลาดทางไวยากรณ์ เครื่องมือประมวลผลข้อความเช่น perl อาจทำให้ชีวิตของคุณง่ายขึ้นหากเกิดข้อผิดพลาดประเภทเดียวกันหลายครั้ง (คุณไม่ได้พูดถึงไฟล์ SGML ที่มีขนาดใหญ่)