ฉันจะบอกว่าตัวเลือกขึ้นอยู่กับว่าคุณมีข้อมูลมากแค่ไหนและอะไรคือจุดประสงค์ของคุณ "กฎแห่งหัวแม่มือ" สองสามข้อ
ฟอเรสต์แบบสุ่มเหมาะอย่างยิ่งสำหรับปัญหามัลติคลาสในขณะที่ SVM นั้นมีสองชั้น สำหรับปัญหาแบบหลายคลาสคุณจะต้องลดปัญหานี้ลงในปัญหาการจำแนกประเภทไบนารีหลายรายการ
Random Forest ทำงานได้ดีด้วยการผสมผสานของคุณสมบัติตัวเลขและหมวดหมู่ เมื่อคุณสมบัติอยู่ในสเกลต่างๆมันก็ใช้ได้เช่นกัน พูดโดยประมาณด้วย Random Forest คุณสามารถใช้ข้อมูลได้เหมือนเดิม SVM เพิ่ม "ระยะขอบ" ให้สูงสุดจึงอาศัยแนวคิดของ "ระยะทาง" ระหว่างจุดต่าง ๆ ขึ้นอยู่กับคุณที่จะตัดสินใจว่า "ระยะทาง" มีความหมายหรือไม่ ด้วยเหตุนี้การเข้ารหัสแบบร้อนแรงสำหรับคุณสมบัติที่เป็นหมวดหมู่จึงเป็นสิ่งที่ต้องทำ นอกจากนี้ขอแนะนำให้ใช้ min-max หรือสเกลอื่น ๆ ในขั้นตอนก่อนการประมวลผล
nม.n × nn2
สำหรับปัญหาการจัดหมวดหมู่ป่าสุ่มให้โอกาสในการเป็นสมาชิกของชั้นเรียน SVM ให้ระยะทางกับขอบเขตคุณยังคงต้องแปลงเป็นความน่าจะเป็นถ้าคุณต้องการความน่าจะเป็น
สำหรับปัญหาเหล่านั้นที่ SVM นำไปใช้โดยทั่วไปแล้วจะทำงานได้ดีกว่า Random Forest
SVM ช่วยให้คุณ "สนับสนุนเวกเตอร์" ซึ่งเป็นคะแนนในแต่ละชั้นที่ใกล้เคียงที่สุดกับขอบเขตระหว่างชั้นเรียน พวกเขาอาจสนใจในการตีความ