ฉันจะอธิบายสิ่งเหล่านี้ด้วยวิธีที่ต่างกันเล็กน้อยเพราะช่วยให้ฉันเข้าใจ
ลองมาตัวอย่างที่เฉพาะเจาะจง คุณกำลังทำการทดสอบโรคกับคนกลุ่มหนึ่ง ทีนี้เรามานิยามคำศัพท์กัน สำหรับแต่ละข้อต่อไปนี้ฉันหมายถึงบุคคลที่ผ่านการทดสอบแล้ว:
True positive (TP) : มีโรคระบุว่ามีโรค
False positive (FP) : ไม่มีโรคที่ระบุว่าเป็นโรค
True negative (TN) : ไม่มีโรคที่ระบุว่าไม่มีโรค
False ลบ (FN) : มีโรคระบุว่าไม่มีโรค
โดยทั่วไปแล้วจะแสดงให้เห็นโดยใช้เมทริกซ์ความสับสน :
อัตราบวกปลอม (FPR)คือจำนวนของคนที่ไม่ได้มีโรค แต่จะมีการระบุว่ามีการเกิดโรค (ทุก fps) ที่หารด้วยจำนวนรวมของคนที่ไม่ได้มีโรค (รวมแอบแฝงและ TNS) .
FPR = FPFP+ Tยังไม่มีข้อความ
อัตราการค้นพบที่ผิดพลาด (FDR)คือจำนวนของคนที่ไม่ได้มีโรค แต่จะมีการระบุว่ามีโรค (ทุก fps) ที่หารด้วยจำนวนของคนที่มีการระบุว่ามีการเกิดโรค (รวมแอบแฝงและ TPS )
FD R = FPFP+ TP
ดังนั้นความแตกต่างในตัวส่วนคืออะไรคุณเปรียบเทียบจำนวนผลบวกที่ผิดกับอะไร
FPRจะบอกคุณสัดส่วนของทุกคนที่ไม่ได้มีโรคที่จะระบุว่ามีการเกิดโรค
FDRจะบอกคุณสัดส่วนของทุกคนที่ระบุว่ามีการเกิดโรคที่ไม่ได้มีการเกิดโรค
ทั้งสองมีประโยชน์มาตรการที่แตกต่างของความล้มเหลว ขึ้นอยู่กับสถานการณ์และสัดส่วนของ TP, FPs, TNs และ FN คุณอาจสนใจมากกว่านั้น
ตอนนี้เราจะใส่ตัวเลขลงไปในสิ่งนี้ คุณวัดคนได้ 100 คนสำหรับโรคนี้
True positive (TPs) : 12
ผลบวกผิด (FPs) : 4
True negatives (TNs) : 76
ฟิล์มเนกาทีฟ (FNs) : 8
หากต้องการแสดงสิ่งนี้โดยใช้เมทริกซ์ความสับสน:
จากนั้น
FPR = FPFP+ Tยังไม่มีข้อความ= 44 + 76= 480= 0.05 = 5 %
FD R = FPFP+ TP= 44 + 12= 416= 0.25 = 25 %
ในคำอื่น ๆ
FPR บอกคุณว่า 5% ของคนที่ไม่มีโรคถูกระบุว่าเป็นโรค FDR บอกคุณว่า 25% ของคนที่ถูกระบุว่าเป็นโรคนั้นไม่มีโรค
แก้ไขตามความคิดเห็นของ @ amoeba (เช่นตัวเลขในตัวอย่างด้านบน):
nผลอย่างมีนัยสำคัญโดยการแก้ไข FPR คุณจริงๆจริงๆต้องพิจารณาวิธีการหลายผลอย่างมีนัยสำคัญของคุณจะไม่ถูกต้อง ในตัวอย่างข้างต้น 25% ของ 'ผลลัพธ์ที่สำคัญ' อาจผิดพลาดได้!
[บันทึกด้านข้าง: วิกิพีเดียชี้ให้เห็นว่าแม้ว่า FPR นั้นเทียบเท่ากับอัตราความผิดพลาดทางคณิตศาสตร์ในทางคณิตศาสตร์ แต่ก็ถือว่าแตกต่างทางแนวคิดเพราะโดยทั่วไปแล้วจะมีการตั้งค่าเบื้องต้นก่อนในขณะที่อื่น ๆ จะถูกใช้เพื่อวัดประสิทธิภาพของการทดสอบในภายหลัง นี่เป็นเรื่องสำคัญ แต่ฉันจะไม่พูดเรื่องนี้
และเพื่อความสมบูรณ์ยิ่งขึ้นอีกเล็กน้อย:
เห็นได้ชัดว่า FPR และ FDR ไม่ได้เป็นเพียงการวัดที่เกี่ยวข้องเท่านั้นที่คุณสามารถคำนวณด้วยปริมาณสี่ปริมาณในเมทริกซ์ความสับสน ในการวัดที่เป็นไปได้มากมายซึ่งอาจเป็นประโยชน์ในบริบทที่แตกต่างกันมีสองวิธีที่ค่อนข้างธรรมดาที่คุณน่าจะพบคือ:
True Positive Rate (TPR)หรือที่เรียกว่าไวเป็นสัดส่วนของคนที่มีโรคที่ระบุว่ามีโรค
TPR = TPTP+ Fยังไม่มีข้อความ
True Negative Rate (TNR)หรือที่รู้จักกันว่าความจำเพาะเป็นสัดส่วนของคนที่ไม่มีโรคที่ระบุว่าไม่มีโรค
Tยังไม่มีข้อความR = Tยังไม่มีข้อความTยังไม่มีข้อความ+ FP