จะรู้ได้อย่างไรว่าเส้นโค้งการเรียนรู้จากตัวแบบ SVM ทนทุกข์จากความเอนเอียงหรือความแปรปรวน?


12

ฉันสร้างเส้นโค้งการเรียนรู้นี้และฉันต้องการที่จะรู้ว่ารุ่น SVM ของฉันมีปัญหาเรื่องอคติหรือความแปรปรวนหรือไม่? ฉันจะสรุปได้อย่างไรจากกราฟนี้

การเรียนรู้ cuve


นี่คือลิงค์ที่คุณสามารถเรียนรู้เกี่ยวกับหัวข้อนี้ได้ในdetail- dataquest.io/blog/learning-curves-machine-learning
Sri991

คำตอบ:


13

ส่วนที่ 1: วิธีอ่านช่วงการเรียนรู้

อันดับแรกเราควรเน้นที่ด้านขวาของพล็อตที่มีข้อมูลเพียงพอสำหรับการประเมิน

  • หากสองเส้นโค้งเป็น "ใกล้กัน" และทั้งสองมีคะแนนต่ำ แบบจำลองประสบปัญหาภายใต้ข้อต่อ (High Bias)

  • หากเส้นโค้งการฝึกอบรมมีคะแนนดีกว่ามาก แต่เส้นโค้งการทดสอบมีคะแนนต่ำกว่านั่นคือจะมีช่องว่างขนาดใหญ่ระหว่างสองเส้นโค้ง จากนั้นตัวแบบจะประสบปัญหาการสวมใส่เกิน (ความแปรปรวนสูง)

ส่วนที่ 2: การประเมินของฉันสำหรับพล็อตที่คุณให้

จากเนื้อเรื่องมันยากที่จะบอกว่าตัวแบบนั้นดีหรือไม่ เป็นไปได้ว่าคุณมี "ปัญหาง่าย" จริง ๆ แบบจำลองที่ดีสามารถบรรลุ 90% ในทางกลับกันเป็นไปได้ที่คุณจะมี "ปัญหาที่ยากมาก" ที่สิ่งที่ดีที่สุดที่เราสามารถทำได้คือบรรลุถึง 70% (โปรดทราบว่าคุณอาจไม่คาดหวังว่าคุณจะมีรูปแบบที่สมบูรณ์แบบบอกว่าคะแนนคือ 1 เท่าไหร่ที่คุณจะประสบความสำเร็จขึ้นอยู่กับว่าเสียงรบกวนในข้อมูลของคุณมากแค่ไหนสมมติว่าข้อมูลของคุณมีจุดข้อมูลจำนวนมาก ไม่ว่าคุณจะทำอะไรคุณไม่สามารถทำคะแนนได้ 1 คะแนน)

ปัญหาอีกประการหนึ่งในตัวอย่างของคุณคือตัวอย่าง 350 ตัวอย่างมีขนาดเล็กเกินไปในแอปพลิเคชันโลกแห่งความจริง

ส่วนที่ 3: คำแนะนำเพิ่มเติม

เพื่อความเข้าใจที่ดีขึ้นคุณสามารถทำการทดลองเพื่อรับประสบการณ์ภายใต้การปรับตัวที่เหมาะสมและสังเกตสิ่งที่จะเกิดขึ้นในช่วงการเรียนรู้

  • เลือกข้อมูลที่ซับซ้อนมากที่บอกว่าข้อมูล MNIST และพอดีกับโมเดลที่เรียบง่ายพูดโมเดลเชิงเส้นด้วยคุณลักษณะเดียว

  • เลือกข้อมูลอย่างง่ายพูดข้อมูลไอริสพอดีกับโมเดลความซับซ้อนพูด SVM


ส่วนที่ 4: ตัวอย่างอื่น ๆ

นอกจากนี้ฉันจะยกตัวอย่างสองตัวอย่างที่เกี่ยวข้องกับข้อต่อข้อต่อและข้อต่อ โปรดทราบว่านี่ไม่ใช่การเรียนรู้ของเส้นโค้ง แต่ประสิทธิภาพการทำงานที่เกี่ยวข้องกับจำนวนของการวนซ้ำในรูปแบบการไล่ระดับสีไล่ระดับที่การทำซ้ำมากขึ้นจะมีโอกาสมากขึ้นของการกระชับ แกน x แสดงจำนวนการวนซ้ำและแกน y แสดงประสิทธิภาพซึ่งเป็นพื้นที่เชิงลบภายใต้ ROC (ยิ่งต่ำยิ่งดี)

แผนย่อยด้านซ้ายไม่ได้รับผลกระทบจากการติดตั้งอุปกรณ์เกิน (ยังไม่ได้รับการติดตั้งเนื่องจากประสิทธิภาพการทำงานที่ดีพอสมควร) แต่หนึ่งที่เหมาะสมจะได้รับความเดือดร้อนจากการติดตั้งที่เหมาะสมเมื่อจำนวนการทำซ้ำมีขนาดใหญ่

ป้อนคำอธิบายรูปภาพที่นี่


ขอบคุณ hxd1011! คุณเห็นด้วยกับฉันไหมถ้าฉันบอกว่าแบบจำลองของฉันมีความแปรปรวนเล็กน้อยและมีอคติเล็กน้อย (เนื่องจากคะแนนไม่ใช่ 1)
Afke

@Papie ฉันคิดว่าคุณเป็นแบบอย่างที่ดี ... 80% กับคะแนนไม่เลวและสองเส้นโค้งอยู่ใกล้ ปัญหาเดียวคือตัวอย่างมากถึง 350 ซึ่งอาจน้อยเกินไปในแอปพลิเคชันโลกแห่งความจริง
Haitao Du

@Papie นอกจากนี้คุณอาจไม่คาดหวังว่าคุณจะมีรูปแบบที่สมบูรณ์แบบบอกว่าคะแนนคือ 1 เท่าไหร่ที่คุณสามารถทำได้ขึ้นอยู่กับว่าเสียงดังรบกวนในข้อมูลของคุณมากแค่ไหน สมมติว่าข้อมูลของคุณมีจุดข้อมูลจำนวนมากที่มีคุณสมบัติที่แน่นอน แต่ป้ายกำกับที่แตกต่างกันไม่ว่าคุณจะทำอะไรคุณไม่สามารถทำคะแนนได้ 1 คะแนน
Haitao Du

11
ฉันคิดว่า "80% ของคะแนนไม่เลว" ไม่ใช่วิธีที่ดีที่จะคิดเกี่ยวกับสิ่งต่าง ๆ ไม่มีคะแนนทั่วโลกที่ดีขึ้นอยู่กับปัญหาที่ได้รับการแก้ไขโดยเฉพาะอย่างยิ่งเกี่ยวกับอัตราส่วนสัญญาณต่อเสียงรบกวนในกระบวนการและข้อมูลที่มีอยู่ คุณชี้ให้เห็นในคำตอบของคุณดังนั้นฉันจะลบความคิดเห็น "ไม่เลว"
Matthew Drury

1
@ MatthewDrury ขอบคุณสำหรับคำแนะนำตอบแก้ไข!
Haitao Du
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.