'ผู้เรียนที่อ่อนแอ' มีความหมายอย่างไร


33

ใครสามารถบอกฉันได้ว่าวลี 'ผู้เรียนที่อ่อนแอ' มีความหมายอย่างไร มันควรจะเป็นสมมติฐานที่อ่อนแอหรือไม่? ฉันสับสนเกี่ยวกับความสัมพันธ์ระหว่างผู้เรียนที่อ่อนแอและผู้จําแนกอ่อนแอ ทั้งคู่เหมือนกันหรือแตกต่างกันบ้างไหม?

ในขั้นตอนวิธี AdaBoost T=10ที่ สิ่งนั้นมีความหมายอย่างไร ทำไมเราเลือกT=10?


1
ยินดีต้อนรับสู่เว็บไซต์ @vrushali ฉันแก้ไขสิ่งนี้เพื่อทำให้ภาษาอังกฤษนุ่มนวลขึ้น โปรดตรวจสอบให้แน่ใจว่ามันยังพูดในสิ่งที่คุณหมายถึง นอกจากนี้ฉันไม่แน่ใจว่าคำถามชุดที่สอง (เกี่ยวกับ adaboost) เหมือนกับคำถามชุดแรกหรือไม่ มันอาจจะเหมาะสมกว่าที่จะแยกพวกมันออกเป็นหลาย ๆ หัวข้อ
gung - Reinstate Monica

คำตอบ:


34

ผู้เรียนที่ 'อ่อนแอ' (classifer, predictor, etc) เป็นเพียงคนที่ทำงานได้ไม่ดีนัก - ความแม่นยำของมันนั้นเหนือโอกาส แต่ก็แทบจะไม่ มักจะมี แต่ไม่เสมอไปความหมายที่เพิ่มเข้ามานั้นเป็นเรื่องง่ายในการคำนวณ ผู้เรียนที่อ่อนแอยังแสดงให้เห็นว่าหลาย ๆ กรณีของอัลกอริธึมกำลังถูกรวมเข้าด้วยกัน

มันถูกกล่าวถึงในกระดาษ AdaBoost ดั้งเดิมโดย Freund & Schapire:

บางทีสิ่งที่น่าประหลาดใจที่สุดของแอปพลิเคชั่นเหล่านี้คือการได้มาของแอพพลิเคชั่นใหม่สำหรับ "การเพิ่ม" เช่นการแปลงอัลกอริทึมการเรียนรู้ PAC "อ่อนแอ" ที่ทำงานได้ดีกว่าการสุ่มแบบสุ่มเพียงเล็กน้อย - (Freund & Schapire, 1995)

แต่ฉันคิดว่าวลีนี้แก่กว่าจริง ๆ แล้ว - ฉันเคยเห็นผู้คนอ้างถึงเอกสารคำศัพท์ (?!) โดย Michael Kearns ในช่วงทศวรรษ 1980

ตัวอย่างแบบคลาสสิกของผู้เรียนที่อ่อนแอคือ Decision Stump ต้นไม้การตัดสินใจระดับเดียว (1R หรือ OneR เป็นผู้เรียนที่อ่อนแอคนหนึ่งที่ใช้กันทั่วไป มันค่อนข้างแปลกที่จะเรียก SVM ว่า 'ผู้เรียนที่อ่อนแอ' แม้ในสถานการณ์ที่มันทำงานได้ไม่ดี แต่มันก็สมเหตุสมผลดีที่จะเรียกการตัดสินใจเพียงครั้งเดียวว่าตอเป็นผู้เรียนที่อ่อนแอแม้ว่ามันจะทำงานได้ดีอย่างน่าประหลาดใจ


Adaboost เป็นอัลกอริทึมซ้ำและโดยทั่วไปหมายถึงจำนวนการวนซ้ำหรือ "ปัดเศษ" อัลกอริทึมเริ่มต้นด้วยการฝึกอบรม / ทดสอบผู้เรียนที่อ่อนแอเกี่ยวกับข้อมูลโดยให้น้ำหนักแต่ละตัวอย่างเท่า ๆ กัน ตัวอย่างที่ไม่ถูกต้องจะทำให้น้ำหนักของพวกเขาเพิ่มขึ้นสำหรับรอบต่อไปในขณะที่น้ำหนักที่ถูกจัดประเภทอย่างถูกต้องจะลดน้ำหนักลงT

ฉันไม่แน่ใจว่ามีมนต์ขลังอะไรเกี่ยวกับTในปี 1995 กระดาษให้เป็นพารามิเตอร์อิสระ (เช่นคุณตั้งค่าด้วยตัวคุณเอง)TT=10T


เท่าที่ฉันรู้ DecisionStump นั้นแตกต่างจาก 1Rule Decision Stump เป็นแผนผังไบนารีระดับ 1 เสมอ (สำหรับทั้งแอตทริบิวต์ที่ระบุและตัวเลข) 1 กฎสามารถมีเด็กได้มากกว่า 2 คน (สำหรับทั้งชื่อและตัวเลข) และสำหรับแอตทริบิวต์ที่เป็นตัวเลขนั้นจะมีการทดสอบที่ซับซ้อนกว่าการแยกไบนารีด้วยค่า นอกจากนี้ใน WEKA ยังมีการใช้งานที่แตกต่างกัน 2 แบบ: DecisionStump และ OneR
rapaio

อืม ... ฉันเดาว่าคุณพูดถูก กระดาษ 1R ดั้งเดิมบอกว่า "กฎเฉพาะที่ตรวจสอบในบทความนี้เรียกว่ากฎ 1 กฎคือกฎที่จำแนกวัตถุบนพื้นฐานของคุณลักษณะเดียว (กล่าวคือเป็นต้นไม้ตัดสินใจระดับ 1" แต่ต้นไม้ตัดสินใจสามารถ ถูกนำไปใช้ในหลาย ๆ วิธีฉันจะแก้ไขให้ชัดเจน
Matt Krause

นอกจากนี้ยังมีการใช้งานOneR ดั้งเดิม : แพ็คเกจ OneRบน CRAN: CRAN.R-project.org/package=OneRนี่คือบทความสั้น ๆ : cran.r-project.org/web/packages/OneR/vignettes/OneR html (การเปิดเผยแบบเต็ม: ฉันเป็นผู้เขียนแพ็คเกจนี้)
vonjd

7

ผู้เรียนที่อ่อนแอเป็นผู้เรียนที่ไม่ว่าการแจกจ่ายผ่านข้อมูลการฝึกอบรมจะดีกว่าโอกาสเสมอเมื่อพยายามติดป้ายกำกับข้อมูล การทำดีกว่าโอกาสหมายความว่าเรามักจะมีอัตราความผิดพลาดน้อยกว่า 1/2

XY

HxY

ในที่สุดสิ่งนี้จะช่วยปรับปรุงผู้เรียนที่อ่อนแอและแปลงให้เป็นผู้เรียนที่แข็งแกร่ง

สำหรับข้อมูลเพิ่มเติม: https://youtu.be/zUXJb1hdU0k


ยินดีต้อนรับสู่ประวัติย่อ เนื่องจากคุณใหม่ที่นี่คุณอาจต้องการเข้าชมทัวร์ของเราซึ่งมีข้อมูลสำหรับผู้ใช้ใหม่ . ดูเหมือนว่าคำตอบนี้จะไม่ให้สิ่งใหม่หรือปรับปรุงคำตอบก่อนหน้านี้ คุณคิดว่ามีบางสิ่งที่ขาดไปในครั้งก่อนหรือไม่?
TEG - Reinstate Monica

ทำไมมันควรต่ำกว่า 1/2 หากอัตราความผิดพลาดสูงกว่า 1/2 มันควรเป็นลักษณนามอ่อนแอ
รหัสสมเด็จพระสันตะปาปา

@CodePope ฉันได้รับจุดของคุณ แต่จริงๆแล้ว "ผู้เรียนที่อ่อนแอ" ถูกกำหนดอย่างเป็นทางการในเงื่อนไขดังกล่าว ฉันเห็นด้วยกับโมเดลที่มีข้อผิดพลาดมากกว่า 50% ก็แย่และอ่อนแอเช่นกัน แต่การพูดถึงคำจำกัดความที่เป็นทางการตามที่กำหนดโดยนักวิทยาศาสตร์ผู้เรียนที่อ่อนแอคือผู้ที่มีข้อผิดพลาดน้อยกว่า 1/2 หรือ 50%
Anish Singh Walia

1

ผู้เรียนที่อ่อนแอจะเหมือนกับลักษณนามอ่อนแอหรือผู้ทำนายอ่อนแอ ความคิดคือคุณใช้ลักษณนามนั่นก็คือ ... ไม่ดี แต่อย่างน้อยก็ดีกว่าสุ่ม ประโยชน์คือตัวจําแนกจะแข็งแกร่งใน overfitting แน่นอนว่าคุณไม่ได้ใช้เพียงชุดเดียว แต่เป็นชุดใหญ่ซึ่งแต่ละอันจะดีกว่าการสุ่มเล็กน้อย วิธีที่แน่นอนที่คุณเลือก / รวมเข้าด้วยกันนั้นขึ้นอยู่กับวิธีการ / อัลกอริทึมเช่น AdaBoost

ในทางปฏิบัติเป็นลักษณนามอ่อนแอคุณใช้บางสิ่งบางอย่างเช่นเกณฑ์ง่ายในคุณลักษณะเดียว หากคุณลักษณะนั้นสูงกว่าขีด จำกัด คุณจะต้องคาดการณ์ว่าคุณสมบัตินั้นเป็นผลบวก ไม่แน่ใจเกี่ยวกับ T = 10 เนื่องจากไม่มีบริบท แต่ฉันสามารถสันนิษฐานได้ว่ามันเป็นตัวอย่างของการทำซ้ำคุณลักษณะบางอย่าง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.