ค่า R-squared เหมาะสมสำหรับการเปรียบเทียบแบบจำลองหรือไม่?


17

ฉันพยายามระบุโมเดลที่ดีที่สุดเพื่อทำนายราคารถยนต์โดยใช้ราคาและคุณสมบัติที่มีอยู่ในเว็บไซต์โฆษณาที่จัดประเภทรถยนต์

สำหรับเรื่องนี้ฉันใช้โมเดลสองรุ่นจากห้องสมุด scikit-Learn และโมเดลโครงข่ายประสาทจาก pybrain และ neurolab วิธีที่ฉันใช้จนถึงตอนนี้คือการเรียกใช้ข้อมูลจำนวนคงที่ผ่านบางรุ่น (อัลกอริทึมการเรียนรู้ของเครื่อง) และเปรียบเทียบค่าR2ที่คำนวณด้วยโมดูลตัวชี้วัดการเรียนรู้แบบ Scikit

  1. คือR2วิธีการที่ดีเพื่อเปรียบเทียบประสิทธิภาพของรูปแบบที่แตกต่างกันหรือไม่?
  2. แม้ว่าฉันจะได้ผลลัพธ์ที่น่าพอใจสำหรับแบบจำลองเช่น Elastic net และ Random forest ฉันได้รับค่าแย่มากR2สำหรับแบบจำลองโครงข่ายประสาทเทียมดังนั้นR2เป็นวิธีที่เหมาะสมสำหรับการประเมินเครือข่ายประสาท (หรือวิธีที่ไม่ใช่เชิงเส้น)

2
คำตอบสั้น ๆ คือไม่มี มันอาจช่วยให้คุณอ่านคำตอบของฉันที่นี่: การประเมินรุ่นและการเปรียบเทียบสำหรับการเลือกแบบจำลองที่ดีที่สุดซึ่งสัมพันธ์กับคำถามของคุณ วิธีการแก้ปัญหาผู้สมัครมีการอธิบายไว้ที่นี่ สำหรับความเข้าใจทั่วไปเพิ่มเติมคุณอาจลองอ่านเธรดบางส่วนในไซต์ที่จัดหมวดหมู่ภายใต้แท็กการเลือกแบบจำลอง
gung - Reinstate Monica

@gung ขอขอบคุณ! ฉันขอถามได้มั้ยว่าการวัดแบบเหมาะสมสำหรับการถดถอยโดยใช้โครงข่ายประสาทเทียมเป็นอย่างไร
Manik

คำตอบ:


18

ฉันคิดว่าส่วนสำคัญที่ต้องพิจารณาในการตอบคำถามของคุณคือ

ฉันพยายามระบุรุ่นที่ดีที่สุดเพื่อทำนายราคารถยนต์

เพราะคำสั่งนี้บอกเป็นนัยถึงสาเหตุคุณต้องการใช้โมเดล ตัวเลือกรูปแบบและการประเมินผลควรเป็นไปตามสิ่งที่คุณต้องการเพื่อให้บรรลุด้วยค่าติดตั้งของคุณ

ก่อนอื่นให้สรุปสิ่งที่ทำR2 : คำนวณมาตราส่วนตามฟังก์ชั่นการสูญเสียกำลังสองซึ่งฉันแน่ใจว่าคุณทราบแล้ว ที่เห็นนี้กำหนดที่เหลือสำหรับที่ i ของคุณสังเกตY ฉันและสอดคล้องกับค่าติดตั้งYฉัน โดยใช้สัญกรณ์สะดวกS S R : = Σ N ฉัน= 1อี2 ฉัน , S S T : = Σei=yiy^iyiy^iSSR:=i=1Nei2,R2ถูกกำหนดให้เป็นเพียงR2=1-SSR/SSTSST:=i=1N(yiy¯)2R2R2=1SSR/SST

ประการที่สองให้เราดูว่าการใช้สำหรับการเลือกรุ่น / การประเมินผลหมายถึงR2อะไร สมมติว่าเราเลือกจากชุดการทำนายที่สร้างขึ้นโดยใช้แบบจำลองM : M Mโดยที่Mคือชุดของแบบจำลองที่อยู่ในการพิจารณา (ในตัวอย่างของคุณการรวบรวมนี้จะมีเครือข่ายประสาทป่าสุ่มตาข่ายยืดหยุ่น ... ) ตั้งแต่S S Tจะยังคงอยู่อย่างต่อเนื่องในหมู่ทุกรุ่นถ้าการลดR 2คุณจะเลือกว่ารูปแบบที่ช่วยลดS S R คุณจะเลือกY¯MM:MMMSSTR2SSRที่ทำให้เกิดข้อผิดพลาดกำลังสองน้อยที่สุด!MM

ประการที่สามให้เราพิจารณาว่าทำไมR2หรือเท่าอาจจะน่าสนใจสำหรับการเลือกรูปแบบ ตามเนื้อผ้าการสูญเสียกำลังสอง ( L 2 norm) นั้นถูกใช้ด้วยเหตุผลสามประการ: (1) มันง่ายกว่าการคำนวณที่เบี่ยงเบนน้อยที่สุด (LAD, L 1 norm) เพราะไม่มีค่าสัมบูรณ์ปรากฏในการคำนวณ (2) มันลงโทษพอดี ค่าที่อยู่ไกลจากมูลค่าที่แท้จริงมากกว่า LAD (ในกำลังสองมากกว่าความรู้สึกสัมบูรณ์) และทำให้แน่ใจว่าเรามีค่าผิดปกติน้อยมาก (3) มันสมมาตร : - หรือประเมินราคารถยนต์ต่ำเกินไป ถือว่าเลวร้ายพอ ๆ กันSSR L2L1

R2Lp1p<2p=1LpLp

โดยสรุปตัวเลือกรูปแบบ / การประเมินผลไม่สามารถพิจารณาได้อย่างอิสระจากจุดมุ่งหมายของโมเดล

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.