วิธีการตีความการวัดข้อผิดพลาด?


41

ฉันใช้การจำแนกประเภทใน Weka สำหรับชุดข้อมูลบางอย่างและฉันสังเกตเห็นว่าถ้าฉันพยายามที่จะทำนายค่าเล็กน้อยผลลัพธ์จะแสดงค่าที่ถูกต้องและคาดการณ์ไม่ถูกต้องโดยเฉพาะ อย่างไรก็ตามตอนนี้ฉันกำลังเรียกใช้สำหรับคุณลักษณะที่เป็นตัวเลขและผลลัพธ์คือ:

Correlation coefficient                 0.3305
Mean absolute error                     11.6268
Root mean squared error                 46.8547
Relative absolute error                 89.2645 %
Root relative squared error             94.3886 %
Total Number of Instances               36441 

ฉันจะตีความสิ่งนี้ได้อย่างไร ฉันลองใช้ความคิดแต่ละอย่างแล้ว แต่ฉันไม่เข้าใจมากนักเนื่องจากสถิติไม่ได้อยู่ในความเชี่ยวชาญของฉัน ฉันขอขอบคุณคำตอบประเภท ELI5 อย่างมากในแง่ของสถิติ

คำตอบ:


52

ขอแสดงค่าที่แท้จริงของดอกเบี้ยและความคุ้มค่าโดยประมาณโดยใช้ขั้นตอนวิธีการบางอย่างที่θθθ^

ความสัมพันธ์จะบอกคุณเท่าใดและθที่เกี่ยวข้อง มันจะให้ค่าระหว่าง- 1และ1ที่0ไม่มีความสัมพันธ์ที่ 1มีความแข็งแรงมากความสัมพันธ์เชิงเส้นและ- 1เป็นเชิงเส้นความสัมพันธ์ผกผัน (เช่นค่าที่ใหญ่กว่าของθบ่งบอกถึงค่าที่เล็กกว่าของθหรือในทางกลับกัน) ด้านล่างคุณจะพบตัวอย่างที่แสดงให้เห็นถึงความสัมพันธ์θθ^-1101-1θθ^

ตัวอย่างความสัมพันธ์

(ที่มา: http://www.mathsisfun.com/data/correlation.html )

หมายถึงข้อผิดพลาดสัมบูรณ์คือ:

MAE=1ยังไม่มีข้อความΣผม=1ยังไม่มีข้อความ|θ^ผม-θผม|

รูทค่าเฉลี่ยของข้อผิดพลาดสแควร์คือ:

RMSE=1ยังไม่มีข้อความΣผม=1ยังไม่มีข้อความ(θ^ผม-θผม)2

ข้อผิดพลาดสัมบูรณ์สัมพัทธ์:

RAE=Σผม=1ยังไม่มีข้อความ|θ^ผม-θผม|Σผม=1ยังไม่มีข้อความ|θ¯-θผม|

θ¯θ

ข้อผิดพลาดกำลังสองของรูทสัมพัทธ์:

RRSE=Σผม=1ยังไม่มีข้อความ(θ^ผม-θผม)2Σผม=1ยังไม่มีข้อความ(θ¯-θผม)2

θ

MAERMSEMSEθθ^θ

RAERRSEθΣ(θ¯-θผม)2Σ|θ¯-θผม|θθθ

ตรวจสอบสไลด์เหล่านั้นด้วย


ขอบคุณสำหรับคำอธิบาย! ฉันพยายามประเมินประสิทธิภาพของอัลกอริทึมต่างๆ ตัวอย่างเช่นถ้าฉันได้รับผลลัพธ์อื่น ๆ (สหสัมพันธ์: 0.3044, แม่: 10.832, MSE: 47.2971, RAE: 83.163%, RSE: 95.2797%) และฉันพยายามที่จะเปรียบเทียบกับคนแรกที่ฉันสามารถทำได้ ดีขึ้นหรือไม่
FloIancu

5
คุณควรเลือกแบบจำลองที่มีความสัมพันธ์มากขึ้นและการประมาณข้อผิดพลาดน้อยลง ตามที่คุณเห็นมีการวัดประสิทธิภาพของแบบจำลองหลายแบบ (และมีเพียงไม่กี่แบบ) และบางครั้งพวกเขาก็ให้คำตอบที่แตกต่างกัน มันแทบจะไม่เคยได้รับคำตอบแบบ "ใช่ / ไม่ใช่" งานการเลือกแบบจำลองจะง่ายขึ้นถ้าคุณตามทฤษฎีคุณสามารถตรวจสอบตัวอย่างการบรรยายเหล่านั้นได้
ทิม

ขอบคุณมาก! ฉันไปข้างหน้าและทำเครื่องหมายคำตอบของคุณเป็นคำตอบเพราะคุณได้ช่วยฉันมากมาย!
FloIancu

1
@Tim Mean ข้อผิดพลาดแบบสัมบูรณ์น่าจะเป็นชื่อย่อว่า :) แม่
แอนทอน

1
@MewX การอ้างอิงประเภทใดที่คุณกำลังมองหา มันเป็นพื้น RMSE ช่วย ไม่มีอะไรจะพูดเกี่ยวกับมันมากนัก ...
ทิม
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.