การจำแนกประเภทด้วยตัวทำนายที่โดดเด่นหนึ่งตัว


9

ฉันมีปัญหาการจำแนกประเภท( -class) โดยมีคำสั่งจาก 100 ตัวทำนายมูลค่าจริงซึ่งหนึ่งในนั้นดูเหมือนว่าจะมีพลังในการอธิบายมากกว่าคนอื่น ๆ ฉันอยากจะให้ลึกซึ้งยิ่งขึ้นถึงผลกระทบของตัวแปรอื่น ๆ อย่างไรก็ตามเทคนิคการเรียนรู้ของเครื่องมาตรฐาน (ป่าสุ่ม, SVM, ฯลฯ ) ดูเหมือนจะล้นมือโดยผู้ทำนายที่แข็งแกร่งคนหนึ่งและไม่ให้ข้อมูลที่น่าสนใจเกี่ยวกับคนอื่นk

หากนี่เป็นปัญหาการถดถอยฉันก็แค่ถอยหลังตัวพยากรณ์ที่แข็งแกร่งแล้วใช้ส่วนที่เหลือเป็นอินพุตสำหรับอัลกอริทึมอื่น ๆ ฉันไม่เห็นว่าวิธีนี้สามารถแปลเป็นบริบทการจำแนกได้อย่างไร

สัญชาตญาณของฉันคือปัญหานี้จะต้องเป็นเรื่องธรรมดาพอสมควร: มีเทคนิคมาตรฐานสำหรับจัดการกับมันหรือไม่?

คำตอบ:


2

สำหรับปัญหา 2 ระดับคุณสามารถใช้แพคเกจGBMในRซึ่งจะทำให้แผนผังการจัดหมวดหมู่ซ้ำกับส่วนที่เหลือจากฟังก์ชั่นการสูญเสีย น่าเสียดายที่มันยังไม่รองรับปัญหาหลายระดับ

ดูเหมือนว่าเป็นปัญหาที่เหมาะสำหรับการเพิ่มประสิทธิภาพ แต่ฉันไม่รู้เกี่ยวกับแพคเกจส่งเสริมที่สนับสนุนปัญหาระดับ k ฉันคิดว่าปัญหาคือการเขียนฟังก์ชั่นการสูญเสียที่เหมาะสมสำหรับหลายชั้นเรียน glmnetแพคเกจที่มีฟังก์ชั่นการสูญเสียพหุนามบางทีคุณสามารถมองผ่านมันรหัสแหล่งสำหรับคำแนะนำบางส่วน

คุณสามารถลองเขียนอัลกอริธึมการส่งเสริมของคุณเองหรือเปลี่ยนปัญหาของคุณให้เป็นปัญหาการจำแนกเลขฐานสอง k (หนึ่งคลาสเทียบกับคลาสอื่น ๆ ทั้งหมด) ปรับโมเดล gbm ให้เหมาะกับแต่ละปัญหาและเฉลี่ยความน่าจะเป็นของคลาสจากแต่ละรุ่น


2
Zach ไม่แน่ใจว่าอยู่ที่ใดในความเสถียรของการพัฒนา แต่ GBM บน R Forge มีฟังก์ชันลอจิสติกแบบมัลติโนเมียลเป็นฟังก์ชันการสูญเสียทำให้สามารถจัดประเภทได้หลายหมวดหมู่
B_Miner

ขอบคุณ! ฉันยอมรับว่าการส่งเสริมนั้นน่าจะเป็นวิธีที่ดีในการเข้าถึงสิ่งนี้และฉันจะตรวจสอบสิ่งที่คุณแนะนำ ฉันยังสนใจที่จะทราบว่ามีวิธีที่ดีในการแก้ไขปัญหานี้โดยการเปลี่ยนปัญหาหรือไม่
Martin O'Leary

@Zach กรุณาแจ้งให้เราทราบว่ามันทำงานอย่างไร
B_Miner
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.