ฉันใช้ randomForest เพื่อจำแนกพฤติกรรมสัตว์ 6 อย่าง (เช่นการยืนการเดินการว่ายน้ำ ฯลฯ ) โดยใช้ตัวแปร 8 ตัว (ท่าทางการเคลื่อนไหวและการเคลื่อนไหวที่แตกต่างกัน)
MDSplot ในแพ็คเกจ randomForest ให้ผลลัพธ์นี้กับฉันและฉันมีปัญหาในการตีความผลลัพธ์ ฉันทำ PCA ด้วยข้อมูลเดียวกันและได้รับการแยกที่ดีระหว่างคลาสทั้งหมดใน PC1 และ PC2 แล้ว แต่ที่นี่ Dim1 และ Dim2 ดูเหมือนจะแยกพฤติกรรม 3 อย่างเท่านั้น สิ่งนี้หมายความว่าพฤติกรรมทั้งสามนี้มีความแตกต่างมากกว่าพฤติกรรมอื่น ๆ ทั้งหมด (ดังนั้น MDS จึงพยายามค้นหาความแตกต่างที่ยิ่งใหญ่ที่สุดระหว่างตัวแปร แต่ไม่จำเป็นต้องเป็นตัวแปรทั้งหมดในขั้นตอนแรก) การจัดตำแหน่งของทั้งสามคลัสเตอร์ (เช่นใน Dim1 และ Dim2) บ่งชี้ว่าอย่างไร เนื่องจากฉันค่อนข้างใหม่สำหรับ RI ก็มีปัญหาในการพล็อตเรื่องนี้ (แต่ฉันมีความคิดว่าสีที่ต่างกันหมายถึงอะไร) แต่บางทีใครบางคนอาจช่วยได้? ขอบคุณมาก!!
ฉันเพิ่มพล็อตที่สร้างด้วยฟังก์ชัน ClassCenter ใน RandomForest ฟังก์ชันนี้ยังใช้เมทริกซ์ความใกล้ชิด (เช่นเดียวกับใน MDS Plot) สำหรับการพล็อตต้นแบบ แต่จากการดูดาต้าพอยน์สำหรับพฤติกรรมหกอย่างที่แตกต่างกันฉันไม่สามารถเข้าใจได้ว่าทำไมเมทริกซ์ความใกล้ชิดจะพล็อตต้นแบบของฉันอย่างที่มันเป็น ฉันยังลองใช้ฟังก์ชั่น classcenter ด้วยข้อมูล iris และใช้งานได้ แต่ดูเหมือนว่ามันใช้ไม่ได้กับข้อมูลของฉัน ...
นี่คือรหัสที่ฉันใช้สำหรับพล็อตนี้
be.rf <- randomForest(Behaviour~., data=be, prox=TRUE, importance=TRUE)
class1 <- classCenter(be[,-1], be[,1], be.rf$prox)
Protoplot <- plot(be[,4], be[,7], pch=21, xlab=names(be)[4], ylab=names(be)[7], bg=c("red", "green", "blue", "yellow", "turquoise", "orange") [as.numeric(factor(be$Behaviour))])
points(class1[,4], class1[,7], pch=21, cex=2, bg=c("red", "green", "blue", "yellow", "turquoise", "orange"))
คอลัมน์คลาสของฉันเป็นคอลัมน์แรกตามด้วยตัวทำนาย 8 ตัว ฉันได้วางแผนตัวแปรตัวทำนายที่ดีที่สุดสองตัวคือ x และ y