โมเดลเรียงซ้อน / ตระการตาพร้อมคาเร็ต


21

ฉันมักจะพบว่าตัวเองกำลังฝึกอบรมตัวพยากรณ์ที่แตกต่างกันหลายตัวที่ใช้caretในอาร์ฉันจะฝึกพวกมันทั้งหมดในการตรวจสอบความถูกต้องไขว้แบบเดียวกันโดยใช้caret::: createFoldsแล้วเลือกโมเดลที่ดีที่สุดโดยอิงจากข้อผิดพลาดการตรวจสอบข้าม

อย่างไรก็ตามการทำนายค่ามัธยฐานจากหลายรุ่นมักจะดีกว่าแบบจำลองเดี่ยวที่ดีที่สุดในชุดทดสอบอิสระ ฉันกำลังคิดว่าจะเขียนฟังก์ชั่นบางอย่างสำหรับการวางซ้อน / การวางแบบ caret ที่ได้รับการฝึกอบรมโดยใช้ cross-validation folds เช่นโดยการคาดคะเนค่ามัธยฐานจากแต่ละแบบจำลองในแต่ละครั้งหรือโดยการฝึก "meta-model"

แน่นอนว่าอาจต้องใช้ลูปการตรวจสอบความถูกต้องภายนอก ไม่มีใครรู้แพคเกจที่มีอยู่ / รหัสโอเพนซอร์สที่มีอยู่สำหรับรุ่น caret ตระการตา

คำตอบ:


19

ดูเหมือนว่า Max Kuhn จะเริ่มทำงานกับแพคเกจสำหรับโมเดลคาเร็ตที่ตระการตาแต่ยังไม่มีเวลาทำมันเลย นี่คือสิ่งที่ฉันกำลังมองหา ฉันหวังว่าโครงการจะเสร็จในวันเดียว!

แก้ไข: ฉันเขียนแพ็คเกจของตัวเองเพื่อทำสิ่งนี้: caretEnsemble


1
ใช้งานได้ดีกับแพ็คเกจนี้!
mikeycgto

8

สิ่งที่คุณกำลังมองหาเรียกว่า "model ensembling" บทแนะนำเบื้องต้นอย่างง่ายพร้อมรหัส R สามารถพบได้ที่นี่: http://viksalgorithms.blogspot.jp/2012/01/intro-to-ensemble-learning-in-r.html


3
ไม่ใช่เพื่อจู้จี้จุกจิก แต่ "ตระการตา" อยู่ในชื่อโพสต์ของฉัน ฉันกำลังมองหาแพ็กเกจ R โดยเฉพาะสำหรับการสร้างแบบจำลองตามอำเภอใจซึ่งดูเหมือนจะไม่มีอยู่จริง ขอบคุณที่โพสต์โค้ด บางทีฉันอาจจะเขียนแพ็คเกจของตัวเอง!
Zach

1

ฉันไม่แน่ใจว่าสิ่งที่คุณกำลังมองหา แต่สิ่งนี้อาจช่วยได้: http://www.jstatsoft.org/v28/i05/paper

มันเป็นวิธีการใช้หลายรุ่นในคาเร็ต ส่วนที่คุณอาจสนใจคือส่วนที่ 5 ในหน้า pg 13


สิ่งที่ฉันกำลังมองหาคือแพ็คเกจที่ใช้เป็นรายการของวัตถุคาเร็ตและป้อนข้อมูลค่าเฉลี่ยมัธยฐานค่าเฉลี่ยหรือค่าเฉลี่ยถ่วงน้ำหนักของการคาดการณ์ของพวกเขา ฟังก์ชั่นขั้นสูงเพิ่มเติมอาจรวมถึงการปรับน้ำหนักด้วยการตรวจสอบแบบซ้อนข้าม
ซัค
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.