ประการแรกคำเตือนบางอย่าง
ฉันไม่แน่ใจว่าทำไมคุณไม่สามารถใช้การเขียนโปรแกรม (sub-) กระบวนทัศน์ *, Inductive Logic Programming (ILP)หรือสิ่งที่คุณพยายามจัดประเภท การให้รายละเอียดมากขึ้นอาจนำไปสู่คำตอบที่ดีกว่ามาก โดยเฉพาะอย่างยิ่งมันเป็นเรื่องแปลกที่จะเลือกวิธีการจำแนกอัลกอริธึมบนพื้นฐานของกระบวนทัศน์การเขียนโปรแกรมที่เกี่ยวข้อง หากตัวอย่างโลกแห่งความเป็นจริงของคุณเป็นความลับให้สร้างตัวอย่างที่สมมติขึ้น แต่คล้ายคลึงกัน
การจำแนกข้อมูลขนาดใหญ่ที่ไม่มี ILP
ต้องบอกว่าหลังจากพิจารณา ILP เรามีกระบวนทัศน์การเขียนโปรแกรมเชิงตรรกะอื่น ๆ อีก 4 ชุดในชุดการพิจารณาของเรา:
- abductive
- ชุดคำตอบ
- การ จำกัด
- การทำงาน
นอกเหนือจากกระบวนทัศน์และกระบวนทัศน์ย่อยหลายสิบนอกการเขียนโปรแกรมเชิงตรรกะ
ภายในฟังก์ชั่นการเขียนโปรแกรมลอจิกตรรกะมีส่วนขยายของ ILP เรียกว่าการเขียนโปรแกรมฟังก์ชั่นลอจิกซึ่งจะขึ้นอยู่กับการ จำกัด การผกผันของการผกผัน (เช่นการผกผันของกลไกการ จำกัด ) วิธีนี้เอาชนะข้อ จำกัด หลายประการของ ILP และ ( ตามที่นักวิชาการบางคนอย่างน้อย ) เหมาะสำหรับการประยุกต์ใช้ในแง่ของการเป็นตัวแทนและมีประโยชน์ในการอนุญาตให้ปัญหาที่จะแสดงออกอย่างเป็นธรรมชาติมากขึ้น
หากไม่ทราบข้อมูลเฉพาะเกี่ยวกับฐานข้อมูลของคุณและอุปสรรคที่คุณต้องเผชิญในการใช้ ILP ฉันไม่รู้ว่าจะช่วยแก้ปัญหาของคุณหรือไม่ก็ประสบปัญหาเดียวกัน ดังนั้นฉันจะทิ้งแนวทางที่แตกต่างอย่างสิ้นเชิงเช่นกัน
ILP เทียบกับ "คลาสสิก" หรือ "ประพจน์" วิธีการทำเหมืองข้อมูล วิธีการเหล่านั้นรวมถึงเนื้อและกระดูกของ Machine Learning เช่นต้นไม้ตัดสินใจเครือข่ายประสาทการถดถอยการบรรจุถุงและวิธีการทางสถิติอื่น ๆ แทนที่จะยอมแพ้กับวิธีการเหล่านี้เนื่องจากขนาดของข้อมูลของคุณคุณสามารถเข้าร่วมอันดับของนักวิทยาศาสตร์ข้อมูลวิศวกรบิ๊กดาต้าและนักสถิติที่ใช้คอมพิวเตอร์ประสิทธิภาพสูง (HPC) เพื่อใช้วิธีการเหล่านี้กับชุดข้อมูลขนาดใหญ่ (มี นอกจากนี้ยังมีการสุ่มตัวอย่างและเทคนิคทางสถิติอื่น ๆ ที่คุณอาจเลือกใช้เพื่อลดทรัพยากรการคำนวณและเวลาที่ต้องใช้ในการวิเคราะห์ข้อมูลขนาดใหญ่ในฐานข้อมูลเชิงสัมพันธ์ของคุณ)
HPC รวมถึงสิ่งต่าง ๆ เช่นการใช้ประโยชน์จากคอร์ซีพียูหลายคอลขยายการวิเคราะห์ของคุณด้วยการใช้เซิร์ฟเวอร์ที่มีหน่วยความจำสูงและคอร์ CPU ความเร็วสูงจำนวนมากโดยใช้อุปกรณ์คลังข้อมูลประสิทธิภาพสูงใช้กลุ่มหรือรูปแบบการคำนวณแบบขนานอื่น ๆ m ไม่แน่ใจว่าภาษาหรือชุดทางสถิติใดที่คุณกำลังวิเคราะห์ข้อมูลของคุณด้วย แต่เป็นตัวอย่างมุมมองงาน CRANนี้แสดงรายการทรัพยากร HPC จำนวนมากสำหรับภาษา R ซึ่งจะช่วยให้คุณสามารถขยายอัลกอริทึมข้อเสนอ