ทั้งRoot-Mean-Square-Error (RMSE)และค่าสัมประสิทธิ์ของการตัดสินใจ (R2)เสนอข้อมูลที่แตกต่าง แต่ครบถ้วนซึ่งควรได้รับการประเมินเมื่อประเมินแบบจำลองทางกายภาพของคุณ ไม่มี "ดีกว่า" แต่รายงานบางฉบับอาจมุ่งเน้นที่การวัดมากกว่าหนึ่งขึ้นอยู่กับแอปพลิเคชันนั้น ๆ
ฉันจะใช้คำแนะนำทั่วไปต่อไปนี้เพื่อทำความเข้าใจความแตกต่างระหว่างตัวชี้วัดทั้งสอง:
RMSEช่วยให้คุณมีความรู้สึกของวิธีการปิด (หรือไกล) ค่าคาดการณ์ของคุณจะมาจากข้อมูลจริงที่คุณกำลังพยายามที่จะเป็นนางแบบ สิ่งนี้มีประโยชน์ในแอปพลิเคชั่นที่หลากหลายซึ่งคุณต้องการเข้าใจความแม่นยำและความแม่นยำของการทำนายของแบบจำลอง (เช่นการสร้างแบบจำลองต้นไม้สูง)
ข้อดี
- มันค่อนข้างง่ายต่อการเข้าใจและสื่อสารเนื่องจากค่าที่รายงานอยู่ในหน่วยเดียวกับตัวแปรตามที่กำลังทำตัวแบบ
จุดด้อย
- มันมีความไวต่อข้อผิดพลาดขนาดใหญ่ (ลงโทษข้อผิดพลาดการทำนายขนาดใหญ่มากกว่าข้อผิดพลาดการทำนายขนาดเล็ก)
ค่าสัมประสิทธิ์การตัดสินใจ (R2)มีประโยชน์เมื่อคุณพยายามเข้าใจว่าตัวแปรอิสระที่คุณเลือกอธิบายความแปรปรวนในตัวแปรตามของคุณได้ดีเพียงใด สิ่งนี้มีประโยชน์เมื่อคุณพยายามอธิบายว่าปัจจัยใดบ้างที่อาจทำให้เกิดกระบวนการที่น่าสนใจ (เช่นตัวแปรสภาพภูมิอากาศและสภาพดินที่เกี่ยวข้องกับความสูงของต้นไม้)
ข้อดี
- ให้ความรู้สึกโดยรวมว่าตัวแปรที่คุณเลือกนั้นเหมาะสมกับข้อมูลอย่างไร
จุดด้อย
- เมื่อมีการเพิ่มตัวแปรอิสระเข้ากับโมเดลของคุณ R2เพิ่มขึ้น (ดูadjR2หรือเกณฑ์ข้อมูลของ Akaikeเป็นทางเลือกที่เป็นไปได้)
แน่นอนข้างต้นจะขึ้นอยู่กับขนาดตัวอย่างและการออกแบบการสุ่มตัวอย่างและความเข้าใจทั่วไปที่ความสัมพันธ์ไม่ได้บ่งบอกถึงสาเหตุ
This value shows how well future outcomes can be predicted by the model
- นี้เป็นอย่างมากที่ทำให้เข้าใจผิดและเอนเอียงไปเพียงธรรมดาที่ไม่ถูกต้อง ไม่มีการรับประกันว่าสัมประสิทธิ์การตัดสินใจสูงในแบบจำลองที่เกี่ยวข้องจะเกี่ยวข้องกับการคาดการณ์ผลลัพธ์ในอนาคตได้ดีเพียงใด