อะไรคือความแตกต่างระหว่าง Multiclass และ Multilabel Problem


52

อะไรคือความแตกต่างระหว่างปัญหามัลติคลาสและปัญหามัลติคาสต์?


สามารถทำงานทั้งสองอย่างได้ด้วยชุดซอฟต์แวร์ Vowpal Wabbit (บรรทัดคำสั่งมีการผูก python ไว้)
Vladislavs Dovgalecs

ฉันได้เรียนรู้แนวคิดนี้และสร้างความเข้าใจกับโพสต์นี้พวกเขาอธิบายการจัดหมวดหมู่หลายป้ายอย่างสวยงามมาก
235077

คำตอบ:


45

ฉันสงสัยว่าความแตกต่างคือในปัญหาหลายชั้นเรียนเป็นพิเศษร่วมกันในขณะที่สำหรับปัญหาหลายฉลากแต่ละป้ายแสดงงานการจำแนกประเภทที่แตกต่างกัน แต่งานที่เกี่ยวข้องอย่างใด (ดังนั้นจึงมีประโยชน์ในการแก้ปัญหาด้วยกันมากกว่าแยกต่างหาก ) ตัวอย่างเช่นในชุดข้อมูล leptograspus crab ที่มีชื่อเสียงมีตัวอย่างของเพศชายและเพศหญิงในรูปแบบปูสองสี คุณสามารถเข้าถึงปัญหานี้เป็นปัญหาหลายคลาสที่มีสี่คลาส (ชาย - น้ำเงิน, หญิง - น้ำเงิน, ส้มชาย, หญิงส้ม) หรือเป็นปัญหาหลายฉลากซึ่งหนึ่งป้ายจะเป็นชาย / หญิงและสีน้ำเงินอื่น ๆ /ส้ม. เป็นหลักในปัญหาหลายฉลากรูปแบบสามารถเป็นของมากกว่าหนึ่งคลาส


@ Dirkran ขอบคุณสำหรับคำอธิบายของคุณ คุณรู้หรือไม่ว่ามีแหล่งอื่นที่ฉันสามารถรับชุดข้อมูลหลายค่านอกเหนือจากcsie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multilabel.htmlและmulan.sourceforge.net/datasets.html
Learner

@Learner ขออภัยมันไม่ใช่สิ่งที่ฉันได้ทำไปมาก คุณอาจต้องการดูการเรียนรู้แบบมัลติทาสก์ซึ่งมีความคล้ายคลึงกับการเรียนรู้แบบหลายฉลาก บางทีชุดข้อมูลบางชุดที่ใช้ในการทำเช่นนั้นอาจเป็นประโยชน์ในการเป็นเกณฑ์มาตรฐานสำหรับการเรียนรู้แบบหลายฉลาก
Dikran Marsupial

26

การจำแนกประเภท Multiclassหมายถึงงานการจำแนกที่มีมากกว่าสองคลาส เช่นจัดเรียงชุดรูปภาพผลไม้ซึ่งอาจเป็นส้มแอปเปิ้ลหรือลูกแพร์ การจำแนกประเภทหลายคลาสทำให้สันนิษฐานว่าแต่ละตัวอย่างถูกกำหนดให้กับหนึ่งป้ายเดียวเท่านั้น: ผลไม้สามารถเป็นได้ทั้งแอปเปิ้ลหรือลูกแพร์ แต่ไม่ใช่ทั้งสองอย่างในเวลาเดียวกัน

การจำแนกประเภทหลายป้ายกำกับให้แต่ละชุดตัวอย่างของฉลากเป้าหมาย สิ่งนี้สามารถคิดได้ว่าเป็นการทำนายคุณสมบัติของจุดข้อมูลที่ไม่ได้เกิดร่วมกันเช่นหัวข้อที่เกี่ยวข้องกับเอกสาร ข้อความอาจเกี่ยวกับศาสนาการเมืองการเงินหรือการศึกษาในเวลาเดียวกันหรือไม่มีเลยก็ได้

นำมาจากhttp://scikit-learn.org/stable/modules/multiclass.html


18

เพื่อเติมเต็มคำตอบอื่น ๆ นี่คือตัวเลขบางส่วน One row = เอาต์พุตที่คาดหวังสำหรับหนึ่งตัวอย่าง

multiclass

หนึ่งคอลัมน์ = หนึ่งคลาส (การเข้ารหัสหนึ่งร้อน)

ป้อนคำอธิบายรูปภาพที่นี่

Multilabel

หนึ่งคอลัมน์ = หนึ่งคลาส

ป้อนคำอธิบายรูปภาพที่นี่


คุณเห็นว่า:

  • ในกรณีที่มีหลายฉลากหนึ่งตัวอย่างอาจถูกกำหนดให้มากกว่าหนึ่งคลาส
  • ในกรณีที่มีหลายคลาสมีทั้งหมดมากกว่า 2 คลาส

ในฐานะที่เป็นบันทึกย่อด้านไม่มีสิ่งใดป้องกันคุณจากการมีปัญหาการจำแนกประเภทมัลติเอาต์พุต - มัลติคลาสเช่น:

ป้อนคำอธิบายรูปภาพที่นี่


7

ปัญหาหลายชั้นมีการกำหนดอินสแตนซ์ให้กับหนึ่งในคอลเลกชัน จำกัด แน่นอนซึ่งกันและกันร่วมกันของชั้นเรียน ดังตัวอย่างที่ได้รับจากปู (จาก @Dikran): ตัวผู้ - น้ำเงิน, ตัวเมีย - น้ำเงิน, ตัวผู้ - ส้ม, ตัวเมีย - ส้ม แต่ละเหล่านี้เป็นเอกสิทธิ์ของผู้อื่นและนำมารวมกันพวกเขาจะครอบคลุม

รูปแบบหนึ่งของปัญหาหลายฉลากคือการแบ่งสิ่งเหล่านี้ออกเป็นสองฉลากเพศและสี ที่เพศสามารถเป็นชายหรือหญิงและสีสามารถเป็นสีฟ้าหรือสีส้ม แต่โปรดทราบว่านี่เป็นกรณีพิเศษของปัญหาหลายฉลากเนื่องจากทุกตัวอย่างจะได้รับทุกป้าย (นั่นคือปูทุกตัวมีทั้งเพศและสี)

ปัญหาหลายฉลากยังรวมถึงกรณีอื่น ๆ ที่อนุญาตให้มีการกำหนดจำนวนป้ายชื่อตัวแปรให้กับแต่ละอินสแตนซ์ ตัวอย่างเช่นบทความในหนังสือพิมพ์หรือบริการสายอาจได้รับมอบหมายให้อยู่ในหมวดหมู่ข่าวการเมืองกีฬาเวชภัณฑ์ ฯลฯ หนึ่งเรื่องราวเกี่ยวกับการแข่งขันกีฬาที่สำคัญจะได้รับการมอบหมายของฉลากกีฬา; ในขณะที่อีกเรื่องหนึ่งเกี่ยวข้องกับความตึงเครียดทางการเมืองที่ถูกเปิดเผยโดยการแข่งขันกีฬาโดยเฉพาะอาจได้รับทั้งฉลากกีฬาและการเมือง ฉันอยู่ที่ไหนในสหรัฐอเมริกาผลลัพธ์ของ Superbowl นั้นมีทั้งป้ายกีฬาและข่าวที่ได้รับผลกระทบทางสังคมจากเหตุการณ์

โปรดทราบว่าการติดฉลากรูปแบบนี้ที่มีหมายเลขตัวแปรของฉลากสามารถนำกลับมาใช้ใหม่ในรูปแบบที่คล้ายกับตัวอย่างของปู ยกเว้นว่าทุกป้ายจะถือว่าเป็น LABEL-X หรือไม่ -LABEL-X แต่ไม่ใช่ว่าทุกวิธีจะต้องมีการหล่อใหม่


2

และความแตกต่างอีกอย่างหนึ่งก็คือปัญหาหลายป้ายต้องใช้แบบจำลองเพื่อเรียนรู้ความสัมพันธ์ระหว่างคลาสที่แตกต่างกัน แต่ในปัญหาหลายคลาสคลาสที่ต่างกันนั้นเป็นอิสระจากกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.