การเรียนรู้ของเครื่อง: ฉันควรใช้เอนโทรปีของการแยกประเภทเอนโทรปีหรือการสูญเสียเอนโทรปีในการทำนายแบบไบนารี


35

ก่อนอื่นฉันรู้ว่าฉันต้องทำการคาดคะเนไบนารีฉันต้องสร้างคลาสอย่างน้อยสองคลาสผ่านการเข้ารหัสหนึ่งครั้ง ถูกต้องหรือไม่ อย่างไรก็ตามเอนโทรปีของไบนารีไขว้สำหรับการทำนายด้วยคลาสเดียวเท่านั้น? หากฉันต้องใช้การสูญเสียเอนโทรปีของการจำแนกอย่างเป็นหมวดหมู่ซึ่งมักพบในห้องสมุดส่วนใหญ่ (เช่น TensorFlow) จะมีความแตกต่างที่สำคัญหรือไม่

ในความเป็นจริงอะไรคือความแตกต่างที่แน่นอนระหว่างเอนโทรปีของการแบ่งประเภทและการข้ามแบบไบนารี? ฉันไม่เคยเห็นการใช้งานของเอนโทรปีของการข้ามเลขฐานสองใน TensorFlow ดังนั้นฉันคิดว่าบางทีหมวดหมู่อาจใช้ได้ดี


1
ตัวอย่างการจำแนกเลขฐานสอง: machinelearningmastery.com/และการจำแนกหลายระดับ: machinelearningmastery.com/
1367204

@ user1367204: ลิงก์ไปยังการจัดประเภทหลายคลาสเปลี่ยนเส้นทางไปยังการจำแนกประเภทไบนารี มันควรเป็นอันนี้
user3389669

คำตอบ:


50

ทวินามสูญเสียข้ามเอนโทรปีเป็นกรณีพิเศษของพหุนามการสูญเสียข้ามเอนโทรปีสำหรับm=2 2

L(θ)=1ni=1n[yilog(pi)+(1yi)log(1pi)]=1ni=1nj=1myijlog(pij)

ijypij(0,1):jpij=1i,j


3
มันหมายถึงการพูดตราบใดที่ฉันใช้ 2 คลาสในการสูญเสียเอนโทรปีของ Multinomial cross ฉันกำลังใช้การสูญเสียเอนโทรปีแบบไบนารีข้ามเป็นหลัก?
infomin101

2
@leekwotsin yup
Reinstate Monica

17

Binary cross-entropy นั้นใช้สำหรับการจำแนกประเภทหลายฉลากในขณะที่การจัดหมวดหมู่ข้าม Entropy สำหรับการจำแนกประเภทหลายชั้นที่แต่ละตัวอย่างเป็นของชั้นเดียว


3
อะไรคือเหตุผลสำหรับคำสั่งของคุณ? ทำไมคุณไม่ใช้เอนโทรปีของการแยกประเภทแบบหลายหมวดหมู่กับหลายหมวดหมู่?
michal

เกิดอะไรขึ้นถ้ามีป้ายกำกับหลายป้ายแต่ละรายการมีหลายคลาส
slizb

1
นี่คือสิ่งที่ฉันต้องการที่จะได้ยิน แต่ไม่ใช่สิ่งที่เจ้านายของฉันต้องการที่จะได้ยิน คำอธิบายเล็กน้อยน่าจะยอดเยี่ยมมาก
Aditya

2

ฉันคิดว่ามีงานการจำแนกสามประเภท:

  1. การจำแนกประเภทไบนารี: สองคลาสพิเศษ
  2. การจำแนกประเภทหลายชั้น: มากกว่าสองชั้นเรียนพิเศษ
  3. การจัดหมวดหมู่หลายฉลาก: เป็นคลาสที่ไม่ใช่แบบเอกสิทธิ์เท่านั้น

จากนี้เราสามารถพูดได้

  • ในกรณีของ (1) คุณต้องใช้ไบนารีไขว้เอนโทรปี
  • ในกรณีของ (2) คุณต้องใช้เอนโทรปีของการแยกประเภทอย่างเด็ดขาด
  • ในกรณีของ (3) คุณต้องใช้ไบนารีไขว้เอนโทรปี คุณสามารถพิจารณาตัวแยกประเภทแบบหลายป้ายชื่อเป็นตัวแยกประเภทไบนารีแบบแยกหลายส่วนได้ หากคุณมี 10 คลาสที่นี่คุณมีตัวแยกประเภทไบนารี 10 แบบแยกกัน ลักษณนามของไบนารีแต่ละตัวได้รับการฝึกฝนอย่างอิสระ ดังนั้นเราสามารถผลิตหลายฉลากสำหรับแต่ละตัวอย่าง หากคุณต้องการให้แน่ใจว่าจะต้องมีฉลากอย่างน้อยหนึ่งป้ายคุณสามารถเลือกได้ด้วยฟังก์ชั่นการสูญเสียการจำแนกประเภทที่ต่ำที่สุดหรือใช้ตัวชี้วัดอื่น ๆ

ฉันต้องการเน้นย้ำว่าการจำแนกประเภทหลายคลาสนั้นไม่คล้ายกับการจำแนกประเภทหลายป้าย ! ค่อนข้างลักษณนามหลายฉลากยืมความคิดจากลักษณนามไบนารี!

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.