ป่าสุ่มสามารถถูกฝึกให้ทำนายข้อมูลนับได้อย่างเหมาะสมหรือไม่? สิ่งนี้จะดำเนินการอย่างไร ฉันมีค่าค่อนข้างหลากหลายดังนั้นการจัดหมวดหมู่จึงไม่สมเหตุสมผล ถ้าฉันจะใช้การถดถอยฉันจะตัดทอนผลลัพธ์หรือไม่? ฉันหลงทางไปแล้ว ความคิดใด ๆ
ป่าสุ่มสามารถถูกฝึกให้ทำนายข้อมูลนับได้อย่างเหมาะสมหรือไม่? สิ่งนี้จะดำเนินการอย่างไร ฉันมีค่าค่อนข้างหลากหลายดังนั้นการจัดหมวดหมู่จึงไม่สมเหตุสมผล ถ้าฉันจะใช้การถดถอยฉันจะตัดทอนผลลัพธ์หรือไม่? ฉันหลงทางไปแล้ว ความคิดใด ๆ
คำตอบ:
มีแพ็คเกจ R ที่เรียกว่าmobForest
สามารถปรับฟอเรสต์แบบสุ่มเพื่อนับข้อมูลได้ มันขึ้นอยู่กับmod()
(แบ่งพาร์ทิชันแบบจำลองซ้ำ) ในparty
แพคเกจ จะดำเนินการ Poisson ถดถอยถ้าอาร์กิวเมนต์ถูกระบุเป็นfamily
poisson()
แพ็กเกจไม่ได้อยู่ในที่เก็บ CRAN อีกต่อไป แต่ก่อนหน้านี้เวอร์ชันที่มีอยู่สามารถขอรับได้จากไฟล์เก็บถาวร
หากคุณไม่ จำกัด เพียงการสุ่มฟอเรสต์ / การบรรจุถุงเวอร์ชั่นการเร่งจะมีให้สำหรับข้อมูลการนับ นั่นคือgbm
(โมเดลการถดถอยที่เพิ่มทั่วไป) นอกจากนี้ยังสามารถใส่แบบปัวซองได้
ฉันเห็นความเป็นไปได้เล็กน้อย
มันไม่ใช่ฟอเรสต์แบบสุ่ม แต่CatBoostรองรับฟังก์ชั่นการสูญเสียปัวซองที่สามารถใช้สำหรับการนับถอยหลังด้วยต้นไม้ที่เพิ่มขึ้น:
https://tech.yandex.com/catboost/doc/dg/concepts/loss-functions-docpage/