"ปฏิเสธการอนุมาน" คืออะไรและจะใช้เพื่อเพิ่มความแม่นยำของแบบจำลองได้อย่างไร


10

ใครช่วยอธิบายรายละเอียดได้:

  1. การปฏิเสธการอนุมานหมายความว่าอย่างไร
  2. จะใช้เพื่อเพิ่มความแม่นยำของแบบจำลองของฉันได้อย่างไร

ฉันมีความคิดที่จะปฏิเสธการอนุมานในการสมัครบัตรเครดิต แต่ต้องดิ้นรนกับความคิดที่จะใช้มันเพื่อเพิ่มความแม่นยำของแบบจำลองของฉัน

คำตอบ:


23

ในการสร้างแบบจำลองเครดิตการปฏิเสธการอนุมานเป็นกระบวนการของการอนุมานประสิทธิภาพของบัญชีเครดิตที่ถูกปฏิเสธในกระบวนการสมัคร

เมื่อสร้างแบบจำลองความเสี่ยงด้านเครดิตของแอปพลิเคชันเราต้องการสร้างแบบจำลองที่มีการบังคับใช้แบบ " ผ่านประตู " เช่นเราป้อนข้อมูลแอปพลิเคชันทั้งหมดลงในแบบจำลองความเสี่ยงด้านเครดิตและแบบจำลองแสดงระดับความเสี่ยง จากค่าเริ่มต้น ปัญหาเมื่อใช้การถดถอยเพื่อสร้างแบบจำลองจากข้อมูลในอดีตคือเรารู้ประสิทธิภาพของบัญชีสำหรับแอปพลิเคชันที่ยอมรับในอดีตเท่านั้น อย่างไรก็ตามเราไม่ทราบถึงประสิทธิภาพของการคัดแยกเพราะหลังจากใช้แล้วเราก็ส่งพวกเขากลับไปที่ประตู สิ่งนี้อาจส่งผลให้มีอคติในการเลือกแบบจำลองของเราเพราะถ้าเราใช้ "ยอมรับ" ที่ผ่านมาในรูปแบบของเราเท่านั้นแบบจำลองอาจทำงานได้ไม่ดีในประชากร "ผ่านประตู"

มีหลายวิธีในการจัดการกับการปฏิเสธการอนุมานซึ่งทั้งหมดเป็นข้อโต้แย้ง ฉันจะพูดถึงสองวิที่นี่

  • "กำหนดอดีตปฏิเสธว่าไม่ดี"
  • การบรรจุหีบห่อ

"กำหนดอดีตปฏิเสธว่าไม่ดี" เพียงนำข้อมูลแอปพลิเคชันที่ถูกปฏิเสธทั้งหมดไปใช้และแทนที่จะทิ้งไว้เมื่อสร้างแบบจำลองกำหนดให้พวกเขาทั้งหมดไม่ดี วิธีนี้มีอคติต่อโมเดลในการยอมรับ / ปฏิเสธนโยบายอย่างมาก

"การบรรจุหีบห่อ" นั้นซับซ้อนกว่าเล็กน้อย มันประกอบด้วย

  1. สร้างแบบจำลองการถดถอยด้วยอดีต "ยอมรับ"
  2. ใช้โมเดลกับอดีตปฏิเสธเพื่อกำหนดการจัดอันดับความเสี่ยงให้กับพวกเขา
  3. การใช้ความน่าจะเป็นค่าเริ่มต้นที่คาดไว้สำหรับการจัดระดับความเสี่ยงแต่ละครั้งให้กำหนดแอปพลิเคชันที่ถูกปฏิเสธว่ามีทั้งดีและไม่ดี ตัวอย่างเช่นหากการจัดอันดับความเสี่ยงมีความน่าจะเป็นที่จะผิดนัดชำระ 10% และมีแอปพลิเคชันที่ถูกปฏิเสธ 100 รายการที่ตกอยู่ในการจัดอันดับความเสี่ยงนี้ให้กำหนด 10 การปฏิเสธเป็น "ไม่ดี" และ 90 รายการของการปฏิเสธเป็น "ดี"
  4. สร้างโมเดลการถดถอยใหม่โดยใช้แอปพลิเคชันที่ได้รับการยอมรับและตอนนี้ประสิทธิภาพที่อนุมานได้ของแอปพลิเคชันที่ถูกปฏิเสธ

มีวิธีต่าง ๆ ในการกำหนดให้ดีหรือไม่ดีในขั้นตอนที่ 3 และกระบวนการนี้สามารถนำไปใช้ซ้ำได้

ตามที่ระบุไว้ก่อนหน้านี้การใช้การอนุมานแบบปฏิเสธนั้นเป็นการโต้เถียงและเป็นการยากที่จะให้คำตอบที่ตรงไปตรงมาเกี่ยวกับวิธีการใช้เพื่อเพิ่มความแม่นยำของแบบจำลอง ฉันจะพูดถึงคนอื่นในเรื่องนี้

Jonathan Crook และ John Banasik ปฏิเสธการอนุมานจริง ๆ ปรับปรุงประสิทธิภาพของแบบจำลองการให้คะแนนของแอปพลิเคชันหรือไม่

อย่างแรกแม้ในกรณีที่สัดส่วนของผู้สมัครถูกปฏิเสธจำนวนมากขอบเขตของการปรับปรุงพารามิเตอร์ของแบบจำลองที่ได้รับการยอมรับนั้นจะปรากฏเพียงเล็กน้อย ในกรณีที่อัตราการปฏิเสธไม่ใหญ่มากขอบเขตนั้นก็ดูเหมือนจะเล็กมากอย่างแน่นอน

เดวิดแฮนด์ "การอนุมานโดยตรงในการดำเนินงานด้านเครดิต" ปรากฏในคู่มือการให้คะแนนเครดิต 2001

มีการเสนอวิธีการหลายวิธีและมีการใช้และในขณะที่บางวิธีไม่ชัดเจนและไม่ควรแนะนำ แต่ก็ไม่มีวิธีที่ดีที่สุดในการบังคับใช้สากลเว้นแต่จะได้รับข้อมูลเพิ่มเติม นั่นคือทางออกที่ดีที่สุดคือการได้รับข้อมูลเพิ่มเติม (บางทีอาจเป็นการให้สินเชื่อแก่ผู้ที่มีโอกาสถูกปฏิเสธ) เกี่ยวกับผู้สมัครที่ตกอยู่ในภูมิภาคที่ถูกปฏิเสธ


1
+1 สำหรับภาพรวมที่ครอบคลุม ตอนนี้ฉันรู้มากเกินไปสิ่งที่ปฏิเสธการสรุปอิงเป็น :)
mpiktas

1
ขอบคุณ แต่คุณจะกำหนดในขั้นตอนที่ 3 ได้อย่างไร ฉันได้อ่าน instad ของการใช้ 1 หรือ 0 คุณสามารถใช้ความน่าจะเป็นสำหรับแต่ละบรรทัด ดังนั้นคุณจะมีคนคนเดียวกันกับ 10% และ 90% สิ่งนี้จะทำงานกับการสร้างรูปแบบโลจิสติกส์ใหม่ได้อย่างไร
GabyLP

1

@GabyLP ในความคิดเห็นก่อนหน้า จากประสบการณ์ของฉันคุณสามารถแยกลูกค้าออกเป็นสองส่วนและกำหนดน้ำหนักสำหรับทั้งสองแยกตามความน่าจะเป็น ตัวอย่างเช่นหากลูกค้าที่ถูกปฏิเสธมี 10% PD คุณสามารถสร้างลูกค้าสองรายจากลูกค้ารายนี้ ก่อนมีตัวแปรเป้าหมาย 1 และน้ำหนัก 0.1 และวินาทีมีตัวแปรเป้าหมาย 0 และน้ำหนัก 0.9

ตัวอย่างที่ลูกค้ายอมรับทั้งหมดจะมีน้ำหนัก == 1

แม้ว่ามันจะทำงานได้ดีกับการถดถอยแบบโลจิสติก แต่มันก็ไม่สามารถทำงานกับแบบจำลองที่ใช้แผนภูมิ


คุณมีแหล่งที่มาสำหรับคำสั่งของคุณ?
ต. สีเบจ

หากคำถามเกี่ยวกับมันไม่ได้ทำงานกับโมเดลที่มีโครงสร้างแบบต้นไม้คำตอบของฉันคือ - ประสบการณ์ส่วนตัว ฉันพยายามใช้วิธีนี้ แต่ไม่ประสบความสำเร็จ
MiksL
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.