บานพับขาดทุนและข้อดีและข้อเสีย / ข้อ จำกัด


14

การสูญเสียบานพับสามารถกำหนดใช้และการสูญเสียล็อกสามารถกำหนดเป็นล็อก( 1 + ประสบการณ์( - Y ฉันW T xฉัน ) )สูงสุด(0,1-YผมWTxผม)เข้าสู่ระบบ(1+ประสบการณ์(-YผมWTxผม))

ฉันมีคำถามต่อไปนี้:

  1. มีข้อเสียของการสูญเสียบานพับ (เช่นไวต่อค่าผิดปกติตามที่ระบุไว้ในhttp://www.unc.edu/~yfliu/papers/rsvm.pdf ) หรือไม่?

  2. อะไรคือความแตกต่างข้อดีข้อเสียของหนึ่งเมื่อเทียบกับที่อื่น

คำตอบ:


22

การลดการสูญเสียลอการิทึมทำให้เกิดผลลัพธ์ที่น่าจะเป็นไปได้

การสูญเสียบานพับนำไปสู่การกระจัดกระจายบางส่วน (ไม่รับประกัน) ในคู่ แต่ไม่ช่วยในการประมาณความน่าจะเป็น (นั่นคือเหตุผลที่มีประโยชน์มากในการกำหนดระยะขอบ): การลดลงของการสูญเสียบานพับจะมาพร้อมกับการลดลงของการจัดหมวดหมู่ผิดพลาดของขอบ

ดังนั้นสรุป:

  • การสูญเสียลอการิทึมนำไปสู่การประมาณความน่าจะเป็นที่ดีขึ้นด้วยต้นทุนของความแม่นยำ

  • การสูญเสียบานพับนำไปสู่ความแม่นยำที่ดีขึ้นและความกระจัดกระจายที่ค่าใช้จ่ายของความไวน้อยกว่ามากเกี่ยวกับความน่าจะเป็น


1
+1 การลดการสูญเสียโลจิสติกส์ให้สอดคล้องกับการเพิ่มโอกาสในการเกิดทวินามให้ได้มากที่สุด การลดการสูญเสียความผิดพลาดกำลังสองให้สอดคล้องกับการเพิ่มความเป็นไปได้ของ Gaussian (มันเป็นแค่ OLS regression สำหรับการจำแนกประเภท 2 ระดับมันเทียบเท่ากับ LDA จริง ๆ ) คุณรู้หรือไม่ว่าการลดการสูญเสียบานพับให้น้อยที่สุดสอดคล้องกับการเพิ่มโอกาสอื่น ๆ ให้มากที่สุด? คือมีแบบจำลองความน่าจะเป็นที่สอดคล้องกับการสูญเสียบานพับหรือไม่?
อะมีบาพูดว่า Reinstate Monica

1
@ amoeba เป็นคำถามที่น่าสนใจ แต่ SVM ไม่ได้มีพื้นฐานมาจากการสร้างแบบจำลองทางสถิติ ต้องบอกว่าให้ตรวจสอบคำตอบนี้โดย Glen_b ด้ายทั้งหมดเกี่ยวกับมัน แต่สำหรับบานพับ epsilon-insensitive แทน
Firebug

4

@Firebug มีคำตอบที่ดี (+1) อันที่จริงฉันมีคำถามคล้ายกันที่นี่

อะไรคือผลกระทบของการเลือกฟังก์ชั่นการสูญเสียที่แตกต่างกันในการจัดประเภทเป็นประมาณ 0-1 การสูญเสีย

ฉันแค่ต้องการเพิ่มข้อได้เปรียบที่ยิ่งใหญ่อีกประการหนึ่งของการสูญเสียโลจิสติก: การตีความความน่าจะเป็น ตัวอย่างสามารถพบได้ที่นี่

โดยเฉพาะการถดถอยโลจิสติกเป็นรูปแบบคลาสสิกในวรรณคดีสถิติ (ดูที่ชื่อ "การถดถอยโลจิสติก" หมายถึงอะไร?สำหรับการตั้งชื่อ) มีแนวคิดที่สำคัญมากมายที่เกี่ยวข้องกับการสูญเสียโลจิสติกเช่นการประมาณค่าความน่าจะเป็นของบันทึกการทำงานสูงสุดการทดสอบอัตราส่วนความน่าจะเป็น นี่คือการสนทนาที่เกี่ยวข้อง

การทดสอบอัตราส่วนความน่าจะเป็นใน R

เหตุใดการถดถอยแบบลอจิสติกจึงไม่เรียกว่าการจำแนกแบบลอจิสติก

มีข้อสมมติฐานเกี่ยวกับการถดถอยโลจิสติกหรือไม่

ความแตกต่างระหว่างรุ่น logit และ probit


1

เนื่องจาก @ hxd1011 เพิ่มข้อได้เปรียบของการข้ามเอนโทรปีฉันจะเพิ่มข้อเสียหนึ่งข้อ

ข้อผิดพลาดข้ามเอนโทรปีเป็นหนึ่งในหลาย ๆ มาตรการระยะห่างระหว่างการแจกแจงความน่าจะเป็น แต่ข้อเสียเปรียบประการหนึ่งคือการแจกแจงด้วยหางยาวสามารถจำลองแบบได้ไม่ดีโดยมีน้ำหนักมากเกินไปสำหรับเหตุการณ์ที่ไม่น่าเกิดขึ้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.