การใช้คำตอบของ Erikกับ Michael's :
คุณสามารถคิดแบบเดียวกันกับที่ Erik อ้างถึงเมื่อเลือกการวัดประสิทธิภาพ
ฉันพบว่ามีประโยชน์ในการอ้างถึงมาตรการที่แตกต่างกันตามคำถามที่พวกเขาตอบ (ที่นี่ในภาษาการวินิจฉัยทางการแพทย์ซึ่งฉันคุ้นเคยมากที่สุด - แต่บางทีคุณสามารถเปลี่ยนผู้ป่วยด้วยข้อความและโรคโดยสแปม ;-)):
ความไว: เมื่อผู้ป่วยมีโรคอย่างแท้จริงแล้วตัวจำแนกประเภทมีแนวโน้มที่จะตระหนักได้อย่างไร
ความจำเพาะ: เมื่อผู้ป่วยไม่มีโรคอย่างแท้จริงแล้วผู้จำแนกประเภทจะตระหนักได้อย่างไร
ค่าทำนายเชิงบวก: เนื่องจากตัวจําแนกอ้างว่าผู้ป่วยจะเป็นโรควิธีการที่ผู้ป่วยจะมีโรคจริงๆ
ค่าพยากรณ์ลบ: เนื่องจากตัวจําแนกอ้างว่าผู้ป่วยไม่ต้องเป็นโรคผู้ป่วยจะไม่มีโรคนี้ได้อย่างไร
ดังที่คุณเห็นค่าของภาคแสดงเป็นสิ่งที่แพทย์และผู้ป่วยให้ความสนใจจริง ๆ อย่างไรก็ตามเกือบทุกคนจะจำแนกลักษณะของตัวจําแนกตามความไวและความเฉพาะเจาะจง เหตุผลก็คือค่าการทำนายจำเป็นต้องคำนึงถึงความชุกของโรคและสิ่งนี้อาจแตกต่างกันอย่างมาก (คำสั่งของขนาด!) สำหรับผู้ป่วยประเภทต่าง ๆ
เพิ่มเติมเกี่ยวกับหัวข้อสำหรับคำถามของคุณ:
ฉันพนันได้เลยว่าคุณกังวล
ยกตัวอย่างสถานการณ์ของ Erik ทั้งสอง:
นี่คือตัวอย่างทดสอบอิสระ:
> binom.test (x = 810, n = 1000, p = 0.8)
Exact binomial test
data: 810 and 1000
number of successes = 810, number of trials = 1000, p-value = 0.4526
alternative hypothesis: true probability of success is not equal to 0.8
95 percent confidence interval:
0.7842863 0.8338735
sample estimates:
probability of success
0.81
(โปรดทราบว่าการทดสอบนี้เป็นแบบสองด้านโดยสมมติว่าตัวจําแนกทั้งสองจะได้รับการตีพิมพ์แม้ว่าผลลัพธ์จะเป็นไปในทางตรงกันข้าม ... )
นี่คือสถานการณ์ที่ดีที่สุดที่เป็นไปได้: การทดสอบจับคู่และตัวแยกประเภทใหม่ที่เหมาะสมสำหรับตัวอย่างทั้งหมดที่เก่าถูกต้องรวมทั้งอีก 10:
> ## mc.nemar: best possible case
> oldclassif <- c (rep ("correct", 800), rep ("wrong", 200))
> newclassif <- c (rep ("correct", 810), rep ("wrong", 190))
> table (oldclassif, newclassif)
newclassif
oldclassif correct wrong
correct 800 0
wrong 10 190
> mcnemar.test (oldclassif, newclassif)
McNemar's Chi-squared test with continuity correction
data: oldclassif and newclassif
McNemar's chi-squared = 8.1, df = 1, p-value = 0.004427
(p-value ยังคงต่ำกว่าเวทย์มนตร์ 0.05 ตราบใดที่ตัวอย่างจากผู้ทำนายไม่เกิน 10 ตัวอย่างจาก 1,000คนนั้นแตกต่างกัน)
แม้ว่าค่า p จะเป็นคำตอบที่ถูกต้องสำหรับคำถามที่ผิด แต่ก็มีข้อบ่งชี้ว่าเป็นสถานที่ที่แน่น
อย่างไรก็ตามโดยคำนึงถึงการปฏิบัติทางวิทยาศาสตร์ตามปกติคือมีการทดสอบคุณสมบัติใหม่ที่ไม่รู้จัก (ไม่ได้เผยแพร่) และมีการเผยแพร่คุณลักษณะที่ได้ผลดีกว่าเพียงเล็กน้อยเท่านั้น และจากนั้นตัวแยกประเภท 80% อาจเป็นตัวต่อของตัวแยกประเภท 79% บางส่วน ...
หากคุณสนุกกับการอ่านภาษาเยอรมันมีหนังสือที่ดีจริง ๆ โดย Beck-Bornhold และ Dubben ถ้าฉันจำได้อย่างถูกต้องMit an Wahrscheinlichkeit grenzender Sicherheitมีการสนทนาที่ดีมากเกี่ยวกับปัญหาเหล่านี้ (ฉันไม่รู้ว่ามีฉบับภาษาอังกฤษหรือไม่การแปลชื่อเรื่องค่อนข้างตามตัวอักษรคือ "ด้วยความแน่นอนว่ามีพรมแดนติดกับความน่าจะเป็น")