การทำนายข้อมูลนับด้วยฟอเรสต์แบบสุ่ม


12

ป่าสุ่มสามารถถูกฝึกให้ทำนายข้อมูลนับได้อย่างเหมาะสมหรือไม่? สิ่งนี้จะดำเนินการอย่างไร ฉันมีค่าค่อนข้างหลากหลายดังนั้นการจัดหมวดหมู่จึงไม่สมเหตุสมผล ถ้าฉันจะใช้การถดถอยฉันจะตัดทอนผลลัพธ์หรือไม่? ฉันหลงทางไปแล้ว ความคิดใด ๆ


1
คุณไม่สามารถใช้การถดถอยปัวซอง?
RJ-

ฉันต้องการใช้สิ่งที่ไม่ใช่พารามิเตอร์ อย่าจำสมมติฐานการถดถอยแบบปัวซอง แต่ฉันค่อนข้างแน่ใจว่าหนึ่งในนั้นคือการสังเกตนั้นเป็นอิสระ สิ่งนี้มีผลกับฉันมากแค่ไหน?
JEquihua

2
คุณลองสร้างการถดถอย RF แล้วหรือยัง มันอาจทำงานได้ดีพอ

1
ยังไม่ได้ แต่นั่นเป็นครั้งแรกของฉัน บันทึกหรือการแปลงรากที่สอง แต่ฉันต้องการดูว่าใครมีประสบการณ์เกี่ยวกับเรื่องนี้หรือไม่
JEquihua

ฉันพยายามเพียงแค่ทำการถดถอยในการตอบสนองบันทึก (การตอบสนอง) และ sqrt (การตอบสนอง) และไม่มีอะไรดี ฉันคิดว่าปัญหายิ่งกว่านั้นตัวแปรอิสระของฉันได้อธิบายการตอบสนองแล้ว โอ้ดี
JEquihua

คำตอบ:


8

มีแพ็คเกจ R ที่เรียกว่าmobForestสามารถปรับฟอเรสต์แบบสุ่มเพื่อนับข้อมูลได้ มันขึ้นอยู่กับmod()(แบ่งพาร์ทิชันแบบจำลองซ้ำ) ในpartyแพคเกจ จะดำเนินการ Poisson ถดถอยถ้าอาร์กิวเมนต์ถูกระบุเป็นfamily poisson()แพ็กเกจไม่ได้อยู่ในที่เก็บ CRAN อีกต่อไป แต่ก่อนหน้านี้เวอร์ชันที่มีอยู่สามารถขอรับได้จากไฟล์เก็บถาวร

หากคุณไม่ จำกัด เพียงการสุ่มฟอเรสต์ / การบรรจุถุงเวอร์ชั่นการเร่งจะมีให้สำหรับข้อมูลการนับ นั่นคือgbm(โมเดลการถดถอยที่เพิ่มทั่วไป) นอกจากนี้ยังสามารถใส่แบบปัวซองได้


5

ฉันเห็นความเป็นไปได้เล็กน้อย

  • คุณสามารถทิ้งคำตอบไว้เป็นหมวดหมู่โดยพลการและใช้แผนผังหมวดหมู่
  • ถ้าโดยทั่วไปการนับมีค่าต่ำมาก, 0, 0, 0, 1, 0, 3, 0, 2 คุณสามารถถือว่าจำนวนเต็มแต่ละจำนวนเป็นคลาสและใช้โครงสร้างการจำแนกอีกครั้ง (อาจไม่ใช่กรณีของคุณ) ในกรณีเหล่านี้มันจะยากที่จะได้รับความแปรปรวนสูงที่อธิบายตัวชี้วัดประเภทเมื่อเทียบกับการถดถอยอย่างต่อเนื่อง
  • หากการนับไม่ปกติและมีความแปรปรวนจำนวนมากฉันจะไปหามันด้วยทรีถดถอย ยกตัวอย่างเช่นการใช้ปัวซองการถดถอยสำหรับการถดถอยเชิงเส้นนั้นเป็นเพียงน้ำเกรวี่เมื่อได้รับการทำนายเชิงเส้นที่ดีเท่านั้น หากคุณไม่เห็นพลังการทำนายที่ดีกับป่าสุ่มฉันสงสัยว่าแบบจำลองนักเล่นที่รองรับข้อมูลการนับโดยเฉพาะจะทำให้คุณมากขึ้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.