ฉันจะเข้าถึงปัญหาการจำแนกประเภทที่คลาสใดคลาสหนึ่งได้รับการกำหนดโดย 'ไม่ได้อยู่ในคลาสอื่น'


9

สมมติว่าฉันสนใจในสามชั้น , , c_3แต่ชุดของฉันจริงมีหลายชั้นเรียนจริงมากขึ้น nc1c2c3(cj)j=4n

คำตอบที่ชัดเจนคือการกำหนด classที่อ้างอิงถึงคลาสทั้งหมด ,แต่ฉันสงสัยว่านี่ไม่ใช่ความคิดที่ดีเนื่องจากตัวอย่างในจะหายากและไม่เหมือนกันมากc^4cjj>3c^4

เพื่อให้เห็นภาพสิ่งที่ฉันพยายามจะพูดสมมติว่าฉันมีพื้นที่ว่างสองตัวแปรต่อไปนี้และคลาส , , ,ถูกอธิบายด้วยสีแดง, til, green และ สีดำตามลำดับ นี่คือวิธีที่ฉันสงสัยว่าข้อมูลของฉันจะเป็นอย่างไรc1c2c3c^4=j=4ncj

ป้อนคำอธิบายรูปภาพที่นี่

มีวิธีมาตรฐานในการแก้ไขปัญหานี้หรือไม่? อะไรจะเป็นลักษณนามที่มีประสิทธิภาพมากที่สุดและทำไม?


พิจารณาใช้ one vs. rest en.wikipedia.org/wiki/Multiclass_classification#One-vs.-rest
DaL

1
คุณอาจต้องการที่จะสำรวจรุ่นบวกไม่มีป้ายกำกับ ดูเหมือนว่าปัญหาที่คล้ายกันยกเว้นเป็นมัลติคลาสไม่ใช่ไบนารีเป็นปัญหา PU ส่วนใหญ่
Ricardo Cruz

คำตอบ:


4

ฉันจะใช้วิธีการสองขั้นตอนโดยใช้แนวคิดของ c4^ ชั้นที่คุณพูดถึง

ในขั้นตอนแรกให้ใช้ตัวจําแนกแบบไบนารี (ผ่านการฝึกอบรมกับชุดข้อมูลทั้งหมด) เพื่อตัดสินใจว่าตัวอย่างเป็นของคลาสหรือไม่ c4^(เช่นในชั้นเรียนที่ไม่น่าสนใจ) สำหรับขั้นตอนนี้คุณสามารถดูวิธีการตรวจหาค่าผิดปกติได้หากตัวอย่างที่อยู่ในคลาส "น่าสนใจ" นั้นแตกต่างจากส่วนที่เหลือ

หากผลลัพธ์เป็นลบให้ไปยังขั้นตอนต่อไปตัวแยกประเภทใหม่ที่ได้รับการฝึกฝนเฉพาะตัวอย่างที่อยู่ในคลาส c1,c2,c3 และใช้การทำนายนั้นเป็นสิ่งสุดท้าย

ฉันคิดว่าแม้จะใช้วิธีการจัดกลุ่มอย่างง่ายเป็นขั้นตอนแรก (เช่น 4-clustering k- หมายถึงการใช้เป็นค่าเริ่มต้น centroid ค่า centroid เฉลี่ยcentj=xiD:yi=jxixiD:yi=j1 แต่ละ c1,c2,c3,c4^) จะยังคงมีประโยชน์


คำแนะนำของ Bogas นั้นยอดเยี่ยมถ้าคุณไม่มีคลาสที่ทับซ้อนกันมาก มิฉะนั้นไปกับรุ่นหลายป้าย
Ricardo Cruz

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.