วิธีการสุ่มสร้างป่านั้นไม่แปรเปลี่ยนไปจากการเปลี่ยนแปลงแบบโมโนโทนิของตัวแปรอิสระ แยกจะคล้ายคลึงกันอย่างสมบูรณ์ หากคุณเพียงต้องการความแม่นยำคุณจะไม่เห็นการปรับปรุงใด ๆ ในความเป็นจริงเนื่องจากป่าสุ่มสามารถค้นหาความซับซ้อนที่ไม่ใช่เชิงเส้น (ทำไมคุณเรียกการถดถอยเชิงเส้นนี้?) ความสัมพันธ์และการโต้ตอบของตัวแปรในทันทีหากคุณเปลี่ยนตัวแปรอิสระของคุณคุณอาจทำให้ข้อมูลเรียบง่ายขึ้น อย่างนี้
บางครั้งป่าสุ่มจะไม่ถือว่าเป็นกล่องดำและใช้สำหรับการอนุมาน ตัวอย่างเช่นคุณสามารถตีความการวัดความสำคัญของตัวแปรที่ให้ไว้หรือคำนวณผลกระทบส่วนเพิ่มของตัวแปรอิสระของคุณกับตัวแปรตาม นี่มักจะมองเห็นเป็นแปลงพึ่งพาบางส่วน ฉันค่อนข้างแน่ใจว่าสิ่งสุดท้ายนี้ได้รับอิทธิพลอย่างมากจากขนาดของตัวแปรซึ่งเป็นปัญหาเมื่อพยายามรับข้อมูลที่มีรายละเอียดมากขึ้นจากป่าสุ่ม ในกรณีนี้มันอาจช่วยให้คุณแปลงตัวแปรของคุณ (สร้างมาตรฐาน) ซึ่งอาจทำให้แปลงการพึ่งพาบางส่วนเทียบเคียง ไม่แน่ใจอย่างสมบูรณ์เกี่ยวกับเรื่องนี้จะต้องคิดเกี่ยวกับมัน
ไม่นานที่ผ่านมาฉันพยายามทำนายข้อมูลนับโดยใช้ Random Forest การถดถอยที่สแควร์รูทและบันทึกธรรมชาติของตัวแปรตามช่วยบิตไม่มากและไม่เพียงพอที่จะให้ฉันเก็บแบบจำลอง
แพคเกจบางอย่างที่คุณอาจใช้ฟอเรสต์แบบสุ่มสำหรับการอนุมาน:
https://uc-r.github.io/lime
https://cran.r-project.org/web/packages/randomForestExplainer/index.html
https://pbiecek.github.io/DALEX_docs/2-2-useCaseApartmetns.html