การเรียนรู้แบบมีผู้สอนพร้อมข้อมูลที่ไม่แน่นอน?


11

มีวิธีการที่มีอยู่สำหรับการใช้โมเดลการเรียนรู้แบบมีผู้สอนเข้ากับชุดข้อมูลที่ไม่แน่นอนหรือไม่? ตัวอย่างเช่นสมมติว่าเรามีชุดข้อมูลที่มีคลาส A และ B:

+----------+----------+-------+-----------+
| FeatureA | FeatureB | Label | Certainty |
+----------+----------+-------+-----------+
|        2 |        3 | A     | 50%       |
|        3 |        1 | B     | 80%       |
|        1 |        1 | A     | 100%      |
+----------+----------+-------+-----------+

เราจะฝึกโมเดลการเรียนรู้ของเครื่องได้อย่างไร? ขอบคุณ

คำตอบ:


11

ด้วยคุณภาพเชิงตัวเลขที่คุณกำหนดให้กับข้อมูลของคุณฉันคิดว่า "ความแน่นอน" นี้สามารถใช้เป็นน้ำหนักได้อย่างแน่นอน คะแนน "ความแน่นอน" ที่สูงขึ้นจะเพิ่มน้ำหนักที่ตัวเลขมีในฟังก์ชันการตัดสินใจซึ่งเหมาะสม

อัลกอริทึมการเรียนรู้แบบมีผู้สอนจำนวนมากรองรับน้ำหนักดังนั้นคุณเพียงแค่ต้องค้นหารุ่นถ่วงน้ำหนักของสิ่งที่คุณตั้งใจจะใช้


2
(+1) และเนื่องจากน้ำหนักส่วนใหญ่มีแนวโน้มที่จะทำหน้าที่เป็น "ซ้ำ" ของคะแนนอาจอัลกอริธึมใด ๆ ที่สามารถทำให้กลายเป็นรุ่นที่มีน้ำหนักแบบนั้นเช่นในตัวอย่าง OP ส่งสำเนา [5,8,10] 3 คะแนนซึ่งสะท้อนความมั่นใจของพวกเขา [50,80,100]% (สิ่งนี้ไม่ควรเป็นสิ่งจำเป็นอย่างแท้จริงราวกับว่ามันสามารถทำได้ในหลักการควรมีอัลกอริธึมเวอร์ชันถ่วงน้ำหนักที่สอดคล้องกัน)
GeoMatt22

5

1A0B0.6AAB01

เข้าสู่ระบบพี(A|x)พี(B|x)=เข้าสู่ระบบพี(A|x)1-P(A|x)β0+β1Txพี(A|x)Aβ0+β1Tx>0B


ดังนั้นถ้าคุณมีปัญหาการจำแนกหลายคลาสคุณสามารถกำหนดเป้าหมายเป็นเวกเตอร์ที่มีความยาวเท่ากับจำนวนคลาสได้หรือไม่
ไฮเปอร์โด

จำนวนคลาส -1, โดยถือว่าความมั่นใจรวมเป็น 100%; ตัวอย่างคล้ายกับการถดถอยโลจิสติก ตัวแยกประเภทจำนวนมากให้คะแนน (เช่นค่าประมาณของ p (class | data) ภายใต้แบบจำลองบางรุ่น) คำตอบทั้งหมดนี้เสนอคือแทนที่จะคาดคะเนคลาสโดยตรงดูใบรับรองเป็นคะแนนและทำนายแทน จากนั้นทำอะไรกับคะแนน
แบทแมน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.