f- วัดความหมายเหมือนกันกับความถูกต้อง?


11

ฉันเข้าใจว่า f- การวัด (ตามความแม่นยำและการเรียกคืน) เป็นค่าประมาณความแม่นยำของตัวจําแนก นอกจากนี้f-measure ยังได้รับความนิยมมากกว่าความถูกต้องเมื่อเรามีชุดข้อมูลที่ไม่สมดุล ฉันมีคำถามง่าย ๆ (ซึ่งเกี่ยวกับการใช้คำศัพท์ที่ถูกต้องมากกว่าเกี่ยวกับเทคโนโลยี) ฉันมีชุดข้อมูลที่ไม่สมดุลและฉันใช้การวัดแบบ f ในการทดลองของฉัน ฉันกำลังจะเขียนกระดาษซึ่งไม่ใช่สำหรับการเรียนรู้ด้วยเครื่องจักร / การประชุมการทำเหมืองข้อมูล ดังนั้นฉันสามารถอ้างถึงการวัดค่า f เหมือนกันกับความถูกต้องในบริบทนี้ ยกตัวอย่างเช่นฉันมี f- วัด 0.82 แล้วฉันจะบอกได้ว่าลักษณนามของฉันบรรลุการทำนายที่แม่นยำ 82%


มันจะเป็นการดีกว่าที่จะแนะนำ f-measure หากคุณใช้ การแทนที่ทั้งสองนั้นไม่ถูกต้องในมุมมองของฉัน ในกรณีของคุณหากความแม่นยำของคุณคือ 99% คุณจะได้การคาดการณ์ที่แม่นยำ 99% ไม่ว่าการวัด f ของคุณคืออะไรและอาจทำให้ผู้อ่านเกิดข้อผิดพลาด
AdrienNK

@AdrienNK: ความแม่นยำ 99% ไม่ได้บอกถึงการคาดการณ์ที่ถูกต้อง 99% ยกเว้นว่าความถี่สัมพัทธ์ของกรณีทดสอบจะเหมือนกับในสถานการณ์การใช้งานจริง
cbeleites ไม่มีความสุขกับ SX

@celeites คุณถูกต้องฉันรู้ แต่บ่อยครั้งที่กรณีทดสอบออกมาจากการแจกแจงแบบเดียวกัน (บางทีนั่นอาจเป็นมุมมองที่ลำเอียงที่ฉันมีเพราะฉันไม่ค่อยได้ทำงานกับข้อมูลที่ไม่ใช่กรณี)
AdrienNK

@AdrienNK: ฉันเป็นนักเคมีวิเคราะห์ที่ทำงานเพื่อการวินิจฉัยทางการแพทย์ ความชุกของโรคในคำถามอาจแตกต่างกันเกี่ยวกับคำสั่งของขนาดระหว่างประชากรย่อยของผู้ป่วยที่แตกต่างกัน ดูเช่นการอภิปราย PPV ที่แตกต่างกันในช่วงครึ่งหลังของบทความนี้: nature.com/news/2011/110323/full/471428a.html
cbeleites ไม่พอใจกับ SX

2
นั่นเป็นการอ่านที่น่าสนใจขอบคุณที่นำสิ่งนั้นมาสู่ความสนใจของฉัน
AdrienNK

คำตอบ:


13

ก่อนอื่นฉันพบว่า "ความแม่นยำ" บางครั้งอาจทำให้เข้าใจผิดเล็กน้อยเนื่องจากมันอ้างถึงสิ่งที่แตกต่าง:

ความถูกต้องของคำในยีนสำหรับการประเมินระบบหรือวิธีการ (ฉันวิเคราะห์เชิงเคมี) หมายถึงอคติของการทำนายนั่นคือตอบคำถามที่การคาดคะเนที่ดีนั้นโดยเฉลี่ย

ดังที่คุณทราบมีการวัดประสิทธิภาพที่แตกต่างกันมากมายซึ่งตอบสนองแง่มุมต่าง ๆ ของประสิทธิภาพสำหรับตัวแยกประเภท หนึ่งในนั้นเกิดขึ้นเรียกว่าความแม่นยำเช่นกัน หากกระดาษของคุณไม่เหมาะสำหรับการเรียนรู้ / การจัดหมวดหมู่ของเครื่องฉันขอแนะนำให้แยกความแตกต่างนี้อย่างชัดเจน แม้สำหรับความหมายที่เฉพาะเจาะจงมากขึ้นของความถูกต้องฉันก็จะชัดเจนมากในสิ่งที่ฉันเรียกความถูกต้องเป็นอีกหลายวิธีในการจัดการกับความไม่สมดุลระดับอาจเกิดขึ้น โดยทั่วไปแล้วความไม่สมดุลของคลาสจะถูกละเว้นซึ่งนำไปสู่การรู้จักกันดีTP+Tยังไม่มีข้อความaล.ล. asอีsการคำนวณ อย่างไรก็ตามคุณอาจใช้ค่าเฉลี่ยของความไวและความเฉพาะเจาะจงซึ่งเป็นจำนวนเงินในการควบคุมความไม่สมดุลของคลาสโดยการถ่วงน้ำหนักค่าเฉลี่ยของคุณ

F-คะแนนมักจะถูกนำมาเป็นค่าเฉลี่ยฮาร์โมนิของความแม่นยำและการเรียกคืน (หรือค่าพยากรณ์บวกและความไว) สำหรับคำถามของคุณฉันคิดว่ามันมีประโยชน์ในการสะกดคำนี้ออกไปอีกเล็กน้อยและทำให้มันง่ายขึ้น:

F=2พีRอีผมsผมโอnRอีaล.ล.พีRอีผมsผมโอn+Rอีaล.ล.=2TPaล.ล. PTPaล.ล.TTPaล.ล. P+TPaล.ล.T=2TP2aล.ล. Paล.ล.TTPaล.ล. Taล.ล. Paล.ล.T+TPaล.ล. Paล.ล. Paล.ล.T=2 TP2TPaล.ล. T+TPaล.ล. P=2 TPaล.ล. T+aล.ล. P

การแสดงออกครั้งสุดท้ายไม่ใช่เศษเสี้ยวของสิ่งใดที่ฉันสามารถนึกได้ว่าเป็นกรณีทดสอบบางกลุ่ม โดยเฉพาะอย่างยิ่งจะมีการทับซ้อน (หนัก) ระหว่าง TRUE และเคสเป็นบวก สิ่งนี้จะป้องกันไม่ให้ฉันแสดงคะแนน F เป็นเปอร์เซ็นต์ตามประเภทของคดี ที่จริงฉันคิดว่าฉันเตือนผู้อ่านว่าคะแนน F ไม่มีการตีความเช่นนี้


โดยเฉพาะอย่างยิ่งนี่คือ F1วัด. คะแนน F สามารถทั่วไปด้วยพารามิเตอร์ที่แยกต่างหาก
qwr

0

คำตอบที่รวดเร็ว:

ไม่มีF-measureสูตรไม่ประกอบด้วยTNปัจจัยและมันก็เป็นประโยชน์ในการดึงปัญหา(doc)

ดังนั้นมันเป็น ( F-measure) แนวทางที่ถูกต้องในการประเมินชุดข้อมูลขาดดุลหรือในกรณีปัญหาการดึงแทนและaccuracyROC

Accuracy = (TP+TN) / (TP+FP+FN+TN)

F1_Score = 2*(Recall * Precision) / (Recall + Precision)
# or
F1_Score = 2*TP / (2*TP + FP + FN)

[ หมายเหตุ ]:

Precision = TP / (TP+FP)

Recall = TP / (TP+FN)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.