อัลกอริทึมการเรียนรู้ของเครื่องสำหรับข้อมูลพาเนล


12

ในคำถามนี้ - มีวิธีการสร้างต้นไม้การตัดสินใจที่คำนึงถึงตัวทำนายที่มีโครงสร้าง / ลำดับชั้น / หลายระดับหรือไม่? - พวกเขาพูดถึงวิธีการข้อมูลแผงสำหรับต้นไม้

มีวิธีข้อมูลพาเนลเฉพาะสำหรับการสนับสนุน Vector Machines และ Neural Networks หรือไม่? ถ้าเป็นเช่นนั้นคุณสามารถอ้างอิงเอกสารสำหรับอัลกอริทึมและ (ถ้ามี) แพ็คเกจ R ที่ใช้งานได้หรือไม่


1
ฉันสงสัยว่าคุณตัดสินใจใช้สิ่งนี้อย่างไร พยายามแก้ไขปัญหาที่คล้ายกัน
0

คำตอบ:


1

LSTM (หน่วยความจำระยะสั้นระยะยาว) อาจเกี่ยวข้องกับคุณ รุ่นประเภทนี้สามารถจัดการคุณสมบัติหลายอย่างในหลาย ๆ จุดในเวลาซึ่งควรพอดีกับข้อมูลแผง นี่คือคำอธิบายที่ดีมากเกี่ยวกับแนวคิดของ LSTM และนี่คือแพ็คเกจที่ใช้ LSTM เวอร์ชัน R


1

เมื่อคุณมีข้อมูลพาเนลมีงานต่าง ๆ ที่คุณสามารถลองแก้ปัญหาได้เช่นการจำแนก / การถดถอยอนุกรมเวลาหรือการพยากรณ์พาเนล และสำหรับแต่ละภารกิจมีวิธีการมากมายในการแก้ปัญหา

เมื่อคุณต้องการใช้วิธีการเรียนรู้ของเครื่องเพื่อแก้ปัญหาการพยากรณ์แผงมีหลายวิธี:

เกี่ยวกับข้อมูลอินพุตของคุณ (X), การรักษาหน่วย (เช่นประเทศ, บุคคล, ฯลฯ ) เป็นตัวอย่าง iid คุณสามารถ

  • bin อนุกรมเวลาและถือว่าแต่ละ bin เป็นคอลัมน์แยกโดยไม่สนใจลำดับเวลาใด ๆ ด้วยช่องเก็บที่เท่ากันสำหรับทุกหน่วยขนาดของ bin แน่นอนว่าเป็นการวัดอนุกรมเวลาที่สังเกตได้หรือคุณสามารถเพิ่มและรวมเป็นถังขยะขนาดใหญ่ได้ ใช้อัลกอริธึมการเรียนรู้ของเครื่องมาตรฐานสำหรับข้อมูลตาราง
  • หรือแยกคุณสมบัติจากอนุกรมเวลาสำหรับแต่ละหน่วยและใช้แต่ละคุณสมบัติที่แยกเป็นคอลัมน์แยกอีกครั้งรวมกับอัลกอริทึมแบบตารางมาตรฐาน
  • หรือใช้อัลกอริทึมการถดถอยอนุกรมเวลา / การจำแนกประเภทโดยเฉพาะขึ้นอยู่กับว่าคุณสังเกตข้อมูลอนุกรมเวลาต่อเนื่องหรือเด็ดขาดซึ่งรวมถึงการสนับสนุนเครื่องเวกเตอร์ที่มีเมล็ดพิเศษที่เปรียบเทียบอนุกรมเวลากับอนุกรมเวลา

เกี่ยวกับข้อมูลส่งออกของคุณ (y) หากคุณต้องการคาดการณ์จุดเวลาหลายจุดในอนาคตคุณสามารถทำได้

  • ปรับตัวประมาณค่าสำหรับแต่ละขั้นตอนที่คุณต้องการคาดการณ์ใช้ข้อมูลอินพุตเดียวกันเสมอ
  • หรือพอดีกับตัวประมาณค่าเดียวสำหรับขั้นตอนแรกไปข้างหน้าและในการทำนายให้หมุนข้อมูลอินพุตในเวลาโดยใช้การคาดการณ์ขั้นตอนแรกเพื่อผนวกเข้ากับข้อมูลอินพุตที่สังเกตได้เพื่อทำการคาดการณ์ขั้นตอนที่สองเป็นต้น

วิธีการข้างต้นทั้งหมดช่วยลดปัญหาการพยากรณ์แบบพาเนลให้กับการถดถอยอนุกรมเวลาหรือปัญหาการถดถอยแบบตาราง เมื่อข้อมูลของคุณอยู่ในอนุกรมเวลาหรือรูปแบบการถดถอยแบบตารางคุณสามารถผนวกคุณสมบัติที่ไม่แปรเปลี่ยนเวลาใด ๆ สำหรับผู้ใช้

แน่นอนว่ามีตัวเลือกอื่น ๆ ในการแก้ปัญหาการพยากรณ์แบบพาเนลเช่นการใช้วิธีการพยากรณ์แบบคลาสสิกเช่น ARIMA ที่ปรับให้เข้ากับข้อมูลแบบพาเนลหรือวิธีการเรียนรู้เชิงลึกที่ช่วยให้คุณสามารถเรียงลำดับการพยากรณ์ตามลำดับได้โดยตรง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.