ฉันกำลังศึกษาหลักสูตรการเรียนรู้ของเครื่องและสไลด์บรรยายมีข้อมูลที่ฉันพบว่าขัดแย้งกับหนังสือที่แนะนำ
ปัญหาดังต่อไปนี้: มีตัวแยกประเภทสามตัว:
- ลักษณนาม Aให้ประสิทธิภาพที่ดีขึ้นในช่วงล่างของขีด จำกัด
- ลักษณนามขให้ประสิทธิภาพที่ดีขึ้นในช่วงที่สูงขึ้นของเกณฑ์
- ลักษณนาม Cสิ่งที่เราได้รับโดยการโยนเหรียญและเลือกจากตัวแยกประเภทสองตัว
ประสิทธิภาพของลักษณนาม C คืออะไรเมื่อดูบนเส้นโค้ง ROC
สไลด์บรรยายระบุว่าเพียงแค่พลิกเหรียญนี้เราจะได้รับ " เรือนูน " ที่มีมนต์ขลังของตัวแยกประเภท A และ B ของเส้นโค้ง ROC
ฉันไม่เข้าใจประเด็นนี้ เพียงแค่โยนเหรียญเราจะได้รับข้อมูลได้อย่างไร
สไลด์บรรยาย
หนังสือเล่มนี้พูดอะไร
หนังสือที่แนะนำ ( Data Mining ... โดย Ian H. Witten, Eibe Frank และ Mark A. Hall ) ในทางกลับกันระบุว่า:
หากต้องการดูสิ่งนี้ให้เลือกความน่าจะเป็นที่เฉพาะเจาะจงสำหรับวิธี A ที่ให้อัตราบวกจริงและเท็จของ tA และ fA ตามลำดับและอีกทางลัดสำหรับวิธี B ที่ให้ tB และ fB หากคุณใช้สองรูปแบบเหล่านี้โดยการสุ่มด้วยความน่าจะเป็น p และ q โดยที่ p + q = 1 คุณจะได้รับอัตราการบวก p จริงและเท็จ tA + q tB และ p fA + q FB. สิ่งนี้แสดงถึงจุดที่อยู่บนเส้นตรงที่รวมจุด (tA, fA) และ (tB, fB) และด้วยการเปลี่ยนแปลง p และ q คุณสามารถติดตามทั้งเส้นระหว่างจุดสองจุดนี้
ในความเข้าใจของฉันสิ่งที่หนังสือกล่าวคือการได้รับข้อมูลจริงและไปถึงเปลือกนูนที่เราต้องทำบางสิ่งที่ก้าวหน้ากว่าเพียงแค่โยนเหรียญ
AFAIK วิธีที่ถูกต้อง (ตามที่แนะนำโดยหนังสือ) มีดังต่อไปนี้:
- เราควรหาเกณฑ์ที่เหมาะสมสำหรับ Oa สำหรับตัวจําแนก A
- เราควรหาเกณฑ์ที่เหมาะสม Ob สำหรับตัวจําแนก B
กำหนด C ดังต่อไปนี้:
- ถ้า t <Oa ให้ใช้ตัวจําแนก A กับ t
- ถ้า t> Ob ให้ใช้ตัวจําแนก B กับ t
- ถ้า Oa <t <Ob เลือกระหว่างลักษณนาม A กับ Oa และ B กับ Ob โดยความน่าจะเป็นเป็นการรวมกันเชิงเส้นของตำแหน่งที่เราอยู่ระหว่าง Oa และ Ob
ถูกต้องหรือไม่ ถ้าใช่มีความแตกต่างที่สำคัญเล็กน้อยเมื่อเทียบกับสิ่งที่สไลด์แนะนำ
- มันไม่ใช่การโยนเหรียญแบบง่ายๆ แต่เป็นอัลกอริธึมขั้นสูงที่ต้องการคะแนนที่กำหนดเองและการเลือกตามพื้นที่ที่เราอยู่
- มันไม่เคยใช้ตัวจําแนก A และ B พร้อมค่าเกณฑ์ระหว่าง Oa และ Ob
คุณช่วยอธิบายปัญหานี้ให้ฉันฟังได้อย่างไรและอะไรคือวิธีที่ถูกต้องที่จะเข้าใจหากความเข้าใจของฉันไม่ถูกต้อง
จะเกิดอะไรขึ้นถ้าเราเพียงแค่พลิกเหรียญแบบที่สไลด์แนะนำ? ฉันคิดว่าเราจะได้เส้นโค้ง ROC ที่อยู่ระหว่าง A และ B แต่จะไม่ดีกว่าจุดที่กำหนด
เท่าที่ฉันเห็นฉันไม่เข้าใจจริงๆว่าสไลด์นั้นถูกต้องได้อย่างไร การคำนวณความน่าจะเป็นที่ด้านซ้ายมือไม่สมเหตุสมผลสำหรับฉัน
อัปเดต: พบบทความที่เขียนโดยผู้เขียนต้นฉบับที่คิดค้นวิธีการนูนเรือ: http://www.bmva.org/bmvc/1998/pdf/p082.pdf