ปัญหาเกี่ยวกับความแม่นยำ
ความถูกต้องมาตรฐานหมายถึงอัตราส่วนของการจำแนกประเภทที่ถูกต้องต่อจำนวนการจำแนกประเภทที่ทำ
accuracy:=correct classificationsnumber of classifications
ดังนั้นจึงเป็นการวัดโดยรวมสำหรับทุกชั้นเรียนและในไม่ช้าเราจะเห็นว่าไม่ใช่วิธีที่ดีในการบอก oracle นอกเหนือจากการทดสอบที่เป็นประโยชน์จริง oracle เป็นฟังก์ชั่นการจัดหมวดหมู่ที่ส่งกลับการคาดเดาแบบสุ่มสำหรับแต่ละตัวอย่าง ในทำนองเดียวกันเราต้องการให้คะแนนประสิทธิภาพการจำแนกประเภทของฟังก์ชันการจำแนกประเภทของเรา Accuracy \ textit {can} เป็นเครื่องมือวัดที่มีประโยชน์ถ้าเรามีจำนวนตัวอย่างต่อคลาสเท่ากัน แต่ถ้าเรามีกลุ่มตัวอย่างที่ไม่เที่ยงตรงไม่แม่นยำก็ไม่มีประโยชน์เลย ยิ่งไปกว่านั้นการทดสอบสามารถมีความแม่นยำสูง แต่จริง ๆ แล้วทำงานได้แย่กว่าการทดสอบที่มีความแม่นยำต่ำกว่า
ถ้าเรามีการแจกแจงตัวอย่างซึ่ง 90 \% ของตัวอย่างอยู่ในคลาส , 5 \% เป็นของและอีก 5 \% เป็นของจากนั้นฟังก์ชั่นการจำแนกประเภทต่อไปนี้ จะมีความแม่นยำ :ABC0.9
classify(sample):={Aif ⊤
กระนั้นก็เป็นที่ชัดเจนว่าเรารู้ว่าการงานนี้มันไม่สามารถบอกชั้นเรียนได้เลย ในทำนองเดียวกันเราสามารถสร้างฟังก์ชั่นการจัดหมวดหมู่classify
classify(sample):=guess⎧⎩⎨ABCwith p =0.96with p =0.02with p =0.02
ซึ่งมีความแม่นยำและจะไม่คาดเดา
แต่ยังให้เรารู้ว่าการทำงานเป็นที่ชัดเจนว่าไม่สามารถแยกชั้นเรียนได้ ความแม่นยำในกรณีนี้เพียงบอกเราว่าฟังก์ชันการจำแนกประเภทของเราคาดเดาได้ดีแค่ไหน ซึ่งหมายความว่าความแม่นยำไม่ใช่วิธีที่ดีที่จะบอก oracle นอกเหนือจากการทดสอบที่มีประโยชน์0.96⋅0.9+0.02⋅0.05⋅2=0.866Aclassify
ความแม่นยำต่อคลาส
เราสามารถคำนวณความถูกต้องเป็นรายบุคคลต่อคลาสโดยให้ฟังก์ชันการจำแนกประเภทของเรามีเพียงตัวอย่างจากคลาสเดียวกันและจดจำและนับจำนวนการจำแนกประเภทที่ถูกต้องและการจำแนกประเภทที่ไม่ถูกต้องแล้วคำนวณ{}) เราทำสิ่งนี้ซ้ำสำหรับทุกชั้นเรียน ถ้าเรามีฟังก์ชั่นการจัดหมวดหมู่ที่สามารถจำ classได้อย่างแม่นยำ
แต่จะส่งผลการทายแบบสุ่มสำหรับคลาสอื่นดังนั้นผลลัพธ์นี้มีความแม่นยำสำหรับ
และความแม่นยำaccuracy:=correct/(correct+incorrect)A1.00A0.33สำหรับคลาสอื่น นี่เป็นวิธีที่ดีกว่าในการตัดสินประสิทธิภาพของฟังก์ชั่นการจำแนกประเภทของเรา นักทำนายที่คาดเดาคลาสเดียวกันเสมอจะสร้างความแม่นยำต่อคลาสที่สำหรับคลาสนั้น แต่สำหรับคลาสอื่น หากการทดสอบของเราจะเป็นประโยชน์ถูกต้องทั้งหมดต่อชั้นควรจะ>ไม่เช่นนั้นการทดสอบของเราจะไม่ดีไปกว่าโอกาส อย่างไรก็ตามความแม่นยำต่อคลาสไม่ได้คำนึงถึงผลบวกที่ผิดพลาด แม้ว่าฟังก์ชั่นการจัดหมวดหมู่ของเรามีความแม่นยำ 100% สำหรับ classก็จะมีผลบวกเป็นเท็จสำหรับ (เช่นจำแนกผิดเป็น )1.000.00>0.5AABA
ความไวและความจำเพาะ
ในการทดสอบทางการแพทย์ความไวหมายถึงอัตราส่วนระหว่างคนที่ระบุอย่างถูกต้องว่ามีโรคและจำนวนของคนที่มีโรคจริง ความเฉพาะเจาะจงถูกกำหนดให้เป็นอัตราส่วนระหว่างคนที่ระบุอย่างถูกต้องเป็นสุขภาพและจำนวนของคนที่มีสุขภาพดีจริง จำนวนคนที่เป็นโรคจริงคือจำนวนผลการทดสอบที่เป็นบวกที่แท้จริงบวกกับจำนวนของผลการทดสอบที่เป็นเท็จ จำนวนคนที่มีสุขภาพดีจริง ๆ คือจำนวนของผลการทดสอบเชิงลบที่แท้จริงบวกกับจำนวนของผลการทดสอบเชิงบวกที่ผิดพลาด
การจำแนกประเภทไบนารี
ปัญหาการจัดหมวดหมู่ไบนารีมีสองชั้นและ{N} อ้างถึงจำนวนตัวอย่างที่ระบุอย่างถูกต้องว่าเป็นของคลาสและอ้างถึงจำนวนตัวอย่างที่ถูกระบุว่าเป็นของชั้นอย่างไม่ถูกต้อง ในกรณีนี้ความไวและความจำเพาะถูกกำหนดดังนี้:PNTnnFnn
sensitivity:=TPTP+FNspecificity:=TNTN+FP
TPเป็นจริงบวกเป็นเท็จลบ
เป็นจริงและลบเป็นบวกปลอม . แต่คิดในแง่ของเชิงลบและบวกจะดีสำหรับการทดสอบทางการแพทย์ แต่เพื่อที่จะได้รับสัญชาติญาณที่ดีกว่าเราไม่ควรคิดในแง่ของเชิงลบและบวก แต่ในชั้นเรียนทั่วไปและ\จากนั้นเราสามารถพูดได้ว่าจำนวนตัวอย่างที่ระบุอย่างถูกต้องว่าเป็นของคือและจำนวนตัวอย่างที่เป็นของคือFNTNFPαβαTααTα+Fβ. จำนวนของกลุ่มตัวอย่างระบุได้อย่างถูกต้องที่จะไม่เป็นของเป็นและปริมาณของตัวอย่างจริงไม่ได้เป็นของเป็น
alpha} นี้ทำให้เรามีความไวและความจำเพาะสำหรับแต่เรายังสามารถนำไปใช้ในสิ่งเดียวกันกับระดับ\จำนวนของกลุ่มตัวอย่างระบุอย่างถูกต้องตามที่เป็นของคือ
และปริมาณของตัวอย่างจริงที่เป็นของคือalpha} จำนวนตัวอย่างที่ถูกต้องระบุว่าไม่ได้เป็นของคือαTβαTβ+FααββTββTβ+FαβTαและปริมาณของตัวอย่างจริงไม่ได้เป็นของคือเบต้า} เราจึงได้รับความไวและความจำเพาะต่อคลาส:βTα+Fβ
sensitivityα:=TαTα+Fβspecificityα:=TβTβ+Fαsensitivityβ:=TβTβ+Fαspecificityβ:=TαTα+Fβ
sensitivityα=specificityβspecificityα=sensitivityβ. ซึ่งหมายความว่าถ้าเรามีเพียงสองคลาสเราไม่ต้องการความไวและความจำเพาะต่อคลาส
การจำแนก N-Ary
ความไวและความเฉพาะเจาะจงต่อคลาสนั้นไม่มีประโยชน์หากเรามีเพียงสองคลาสเท่านั้น แต่เราสามารถขยายไปยังหลายคลาสได้ ความไวและความจำเพาะถูกกำหนดเป็น:
sensitivity:=true positivestrue positives+false negativesspecificity:=true negativestrue negatives+false-positives
Tn∑i(Fn,i)∑i(Fi,n)n∑i(Ti)−T(n)nn∑i(∑k(Fi,k))nn∑i(Fn,i)n∑i(Fi,n)∑i(Ti)−T(n)+∑i(∑k(Fn,i))−∑i(Fn,i)−∑i(Fi,n). โดยสรุปเรามี:
true positives:=Tntrue negatives:=∑i(Ti)−T(n)+∑i(∑k(Fn,i))−∑i(Fn,i)−∑i(Fi,n)false positives:=∑i(Fi,n)false negatives:=∑i(Fn,i)
sensitivity(n):=TnTn+∑i(Fn,i)specificity(n):=∑i(Ti)−Tn+∑i(∑k(Fi,k))−∑i(Fn,i)−∑i(Fi,n)∑i(Ti)−Tn+∑i(∑k(Fi,k))−∑i(Fn,i)
แนะนำความเชื่อมั่น
confidence⊤Tn+∑i(Fi,n)nTn
confidence⊤(n):=TnTn+∑i(Fi,n)
confidence⊥nn
∑i(∑k(Fi,k))−∑i(Fi,n)+∑i(Ti)−Tn∑i(Fn,i)
confidence⊥(n)=∑i(∑k(Fi,k))−∑i(Fi,n)+∑i(Ti)−Tn−∑i(Fn,i)∑i(∑k(Fi,k))−∑i(Fi,n)+∑i(Ti)−Tn