เทคนิคการเรียนรู้ของเครื่องสำหรับข้อมูลระยะยาว


11

ฉันสงสัยว่ามีเทคนิคการเรียนรู้ด้วยเครื่อง (ไม่ได้รับอนุญาต) สำหรับการสร้างแบบจำลองข้อมูลระยะยาวหรือไม่? ฉันเคยใช้โมเดลเอฟเฟ็กต์แบบผสม (ส่วนใหญ่ไม่ใช่แบบเส้นตรง) แต่ฉันสงสัยว่ามีวิธีอื่นในการทำเช่นนี้ (โดยใช้การเรียนรู้ของเครื่อง)

โดยการเรียนรู้ของเครื่องผมหมายถึงป่าสุ่มการจำแนก / การจัดกลุ่มต้นไม้การตัดสินใจและแม้แต่การเรียนรู้ลึก ฯลฯ


คุณช่วยอธิบายความหมายของคำว่า "machine learning" ได้ไหม? คุณสามารถเพิ่ม LME หลังจากการแบ่งชั้นที่เหมาะสม นั่นจะเป็นนิยายที่สวยจริง ๆ !
usεr11852

@ usεr11852ฉันได้เพิ่มคำอธิบายให้กับคำถามอีกเล็กน้อยหวังว่านี่จะทำให้ชัดเจนขึ้นอีกเล็กน้อย
John_dydx

อ้า ... ดังนั้นการส่งเสริมไม่ใช่ ML ตามคำจำกัดความของคุณ ขอบคุณมากสำหรับการชี้แจงหวังว่ามันจะได้รับความสนใจในไม่ช้า
usεr11852

... และส่งเสริมด้วย
John_dydx

3
คำถามนี้ค่อนข้างคลุมเครือ "การเรียนรู้ของเครื่อง" เป็นคำศัพท์ที่กว้างและแม้แต่หมวดหมู่ของ "ป่าสุ่มการจำแนก / การจัดกลุ่มต้นไม้การตัดสินใจและแม้แต่การเรียนรู้ลึก" ค่อนข้างกว้าง มีแอปพลิเคชันที่ชัดเจนที่คุณสนใจหรือไม่ ตัวอย่างเช่นถ้าคุณต้องการจัดหมวดหมู่ผลลัพธ์แบบแบ่งขั้วคู่คุณสามารถใช้โมเดลเอฟเฟกต์โลจิสติกหรือโลจิสติก GEE การเรียนรู้ด้วยเครื่องและแบบจำลองทางสถิตินั้นไม่จำเป็นต้องแตกต่างกัน
Jon

คำตอบ:


7

ในกรณีที่มีการสังเกตหลายครั้งจากเรื่องหนึ่ง (เช่นการเข้าชมหลายครั้งจากผู้ป่วยรายเดียวกัน) จากนั้น 'id ผู้ป่วย' เป็นตัวแปร 'การจัดกลุ่ม' การดูแลจะต้องดำเนินการในช่วงการประเมินผลรูปแบบเพื่อให้ผู้เข้าชมจากผู้ป่วยรายเดิมไม่ปรากฏทั้งในการฝึกอบรมและการทดสอบข้อมูลเพราะสิ่งเหล่านี้มีความสัมพันธ์และจะนำไปสู่อัตราเงินเฟ้อของความถูกต้องลักษณนาม

เอกสารการตรวจสอบข้าม sklearnมีการตรวจสอบ iterators ข้ามข้อมูลการจัดกลุ่ม ดูGroupKFoldออกจากOneGroupOutและออกจากGroupOutออก

ยิ่งไปกว่านั้นลองกำเริบโครงข่ายประสาทหรือซ่อนมาร์คอฟรุ่น


4

คุณสามารถสร้างแบบจำลองตามยาวของคุณด้วยวิธีการเรียนรู้ด้วยเครื่องมาตรฐานโดยเพียงแค่เพิ่มคุณสมบัติที่แสดงถึงความยาวเช่นโดยการเพิ่มคุณสมบัติที่แสดงเวลา หรือคุณสมบัติที่บ่งบอกถึงความเป็นสมาชิกของกลุ่มบุคคล ฯลฯ (ในกรณีข้อมูลแผง)

หากคุณมีความคิดสร้างสรรค์ด้วยการสร้าง / แยกคุณสมบัติคุณสามารถสร้างโมเดลด้วยอัลกอริธึม ML


1
@PhlippePro ฉันสับสนเล็กน้อยเกี่ยวกับคำตอบนี้ (1) จะเป็นอย่างไรถ้าคุณต้องการทำนายสำหรับบุคคลที่ไม่ได้อยู่ในชุดฝึกอบรมของคุณ คุณมีค่าสัมประสิทธิ์สำหรับผู้ที่อยู่ในชุดการฝึกอบรมของคุณใช่ไหม? (2) การเพิ่มคุณสมบัติที่สอดคล้องกับบุคคลอาจส่งผลให้มีตัวแปรดัมมี่ใหม่ถึง 100,000 ตัวแปรโดยสมมติว่าคุณมี 100,000 คนในชุดข้อมูลของคุณ คุณสมบัติใหม่เหล่านี้จะพอดีกับคุณสมบัติดั้งเดิมใช่ไหม
0

(1) หากคุณไม่มีบุคคลที่คุณต้องการทำนายในชุดข้อมูลการฝึกอบรมของคุณคุณจะไม่สามารถใช้ "คุณสมบัติบุคคล" ที่ถูกต้อง (2) แทนที่จะใช้คุณสมบัติแบบจำลองคุณสามารถสร้างคุณสมบัติ "เด็ดขาด" หนึ่งรายการ (เช่นคุณระบุว่าเป็นหมวดหมู่ด้วย as.factor ใน R) อัลกอริธึมบางอย่างไม่สามารถจัดการหมวดหมู่ได้มากมาย (เช่นสุ่มเท่านั้นป่าสามารถรองรับได้ประมาณ 50) จากนั้นคุณต้องระบุว่ามันเป็นตัวแปรจำลองและคุณจะได้รับคุณสมบัติมากมายตามที่คุณชี้ไป
PhilippPro

ML ไม่สามารถแปลเป็นข้อมูลระยะยาวได้ง่ายนัก
อักษะกัล
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.