AUC ในการถดถอยโลจิสติกอันดับ


10

ฉันใช้การถดถอยโลจิสติก 2 ชนิด - ชนิดหนึ่งเป็นแบบง่ายสำหรับการจำแนกไบนารีและอีกประเภทหนึ่งคือการถดถอยโลจิสติกอันดับ สำหรับการคำนวณความแม่นยำของครั้งแรกฉันใช้การตรวจสอบความถูกต้องข้ามซึ่งฉันคำนวณ AUC สำหรับแต่ละเท่าและกว่าการคำนวณ AUC เฉลี่ย ฉันจะทำอย่างไรสำหรับการถดถอยโลจิสติกอันดับ ฉันได้ยินเกี่ยวกับ ROC ทั่วไปสำหรับเครื่องมือทำนายหลายระดับ แต่ฉันไม่แน่ใจว่าจะคำนวณได้อย่างไร

ขอบคุณ!


1
ไม่ใช่ AUC แต่เกี่ยวข้องกับ: บนเส้นโค้งเรียกคืนแบบไมโคร / มาโครที่stats.stackexchange.com/questions/21551/ …
Yevgeny

คำตอบ:


4

ฉันชอบพื้นที่ใต้เส้นโค้ง ROC ( -index) เพราะมันเป็นความน่าจะเป็นที่สอดคล้องกัน เป็นหน่วยการสร้างสัมประสิทธิ์สหสัมพันธ์อันดับ ยกตัวอย่างเช่นซอมเมอร์{2}) สำหรับลำดับ ,เป็นมาตรการที่ดีของการเลือกปฏิบัติที่คาดการณ์และการ R แพคเกจมีวิธีง่ายที่จะได้รับบูตประมาณการ overfitting-แก้ไขของ{} คุณสามารถ backsolve สำหรับ -index ทั่วไป (generalized AUROC) มีเหตุผลไม่ได้ที่จะต้องพิจารณาในแต่ละระดับของการเป็นแยกกันเพราะไม่ได้ใช้ประโยชน์จากธรรมชาติลำดับของYDxY=2×(-12)YDxYrmsDxYYY

ในrmsมีสองหน้าที่สำหรับการถดถอยอันดับ: lrmและormหลังการจัดการอย่างต่อเนื่องและให้ครอบครัวการกระจายมากขึ้น (ฟังก์ชั่นการเชื่อมโยง) กว่าอัตราต่อรองสัดส่วนY


ปัญหาหลักจะเป็นวิธีคำนวณ rms -ผมndอีx ใช้ในของ Sommer DxY?
Chamberlain Foncha

1
มันจะสะกดของ Somer โดยทั่วไป- ดัชนีคำนวณโดยการแปลงสมการที่ฉันได้กล่าวไว้ข้างต้น ชุดค่าผสมภายในที่เป็นไปได้ทั้งหมดของการสังเกตมีความแตกต่างกันYค่าจะถูกตรวจสอบและเศษส่วนของคู่ดังกล่าวที่การทำนายอยู่ในลำดับเดียวกันคือการประมาณความน่าจะเป็นที่สอดคล้องกัน ฉันแปลผิดหนึ่งสิ่ง: ormฟังก์ชันใช้ Spearman'sρ แทน DxY.
Frank Harrell

ขอบคุณสำหรับการแก้ไขตัวสะกด ในการถดถอยอันดับมันจะน่าสนใจมากขึ้นไม่เพียง แต่จะดูที่การสั่งซื้อแบบคู่ตามที่ทำในฟังก์ชั่น orm ที่คุณกล่าวถึง แต่ยังดูที่การสั่งซื้อที่สอดคล้องกัน โดยสรุปสิ่งที่ฉันพูดคือ: ด้วยการถดถอยโลจิสติกที่สะสมตัวอย่างเช่นการเรียงลำดับของชั้นเรียนจะได้รับการดูแลในรูปแบบ การวัดแบบคาดการณ์ไม่ควรทำการเปรียบเทียบแบบเป็นคู่P(พีRอีd1<พีRอีd2|โอs1<โอs2)แต่การเปรียบเทียบแบบฟอร์ม $ P (pred_1 <pred_2 <pred_3 | obs_1 <obs_2 <o
Chamberlain Foncha

ไม่ทราบเกี่ยวกับมาตรการดังกล่าวปฏิกิริยาแรกของฉันคือพวกเขากำลังตั้งค่าแถบสูงเพื่อกีดขวาง
Frank Harrell

1

AUC สำหรับการถดถอยเชิงอันดับเป็นสิ่งที่ยุ่งยาก คุณอาจต้องการคำนวณ AUC สำหรับแต่ละชั้นเรียนโดยการสร้างหุ่นจำลองเพื่อรับค่า 1 สำหรับชั้นเรียนที่คุณกำลังคำนวณ AUC และ 0 สำหรับชั้นเรียนอื่น ๆ ที่เหลือ หากคุณมี 4 คลาสคุณจะสร้าง 4 AUC และเขียนลงบนกราฟเดียวกัน ปัญหาหลักของวิธีนี้คือความจริงที่ว่ามันเป็นการลงโทษที่จำแนกผิดพลาดอย่างเท่าเทียมกัน การแยกประเภทของคลาสที่ 1 ลงในคลาสที่ 3 โดยสังหรณ์ใจน่าจะแย่กว่าคลาสที่พลาดไปในคลาสที่ 1

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.