การรวมตัวแปรคำอธิบายที่ละเอียดมากขึ้นเมื่อเวลาผ่านไป


9

ฉันพยายามที่จะเข้าใจว่าฉันจะสร้างแบบจำลองตัวแปรที่ดีที่สุดได้อย่างไรเมื่อเวลาผ่านไป ตัวอย่างเช่นพิจารณาการสร้างแบบจำลองอัตราการกู้คืนเงินให้สินเชื่อที่ผิดนัด สมมติว่าเรามีชุดข้อมูลที่มีข้อมูล 20 ปีและในช่วง 15 ปีแรกเรารู้เพียงว่าเงินกู้นั้นมีหลักประกันหรือไม่ แต่ไม่มีอะไรเกี่ยวกับคุณลักษณะของหลักประกันนั้น อย่างไรก็ตามในช่วงห้าปีที่ผ่านมาเราสามารถแบ่งหลักประกันออกเป็นหมวดหมู่ต่างๆซึ่งคาดว่าจะเป็นตัวทำนายที่ดีของอัตราการกู้คืน

ด้วยการตั้งค่านี้ฉันต้องการให้พอดีกับแบบจำลองของข้อมูลกำหนดมาตรการต่าง ๆ เช่นนัยสำคัญทางสถิติของตัวทำนายและจากนั้นทำนายด้วยตัวแบบ

กรอบข้อมูลใดที่ขาดหายไปพอดีกับสิ่งนี้? มีการพิจารณาพิเศษใด ๆ ที่เกี่ยวข้องกับความจริงที่ว่าตัวแปรอธิบายที่ละเอียดมากขึ้นมีให้เฉพาะหลังจากเวลาที่กำหนดซึ่งต่างจากการกระจัดกระจายไปทั่วตัวอย่างประวัติศาสตร์หรือไม่?

คำตอบ:


1

ตกลงจากประสบการณ์ในการใช้ข้อมูลประวัติประวัติที่มากขึ้นอาจทำให้การถดถอยนั้นดูดีขึ้น แต่ถ้าการทำนายเป็นจุดของการออกกำลังกายคำตอบทั่วไปจะได้รับการเตือน ในกรณีที่ข้อมูลสะท้อนช่วงเวลาที่ 'โลก' แตกต่างกันมากความเสถียรของสหสัมพันธ์นั้นเป็นที่น่าสงสัย สิ่งนี้เกิดขึ้นโดยเฉพาะอย่างยิ่งในด้านเศรษฐศาสตร์ที่ตลาดและกฎระเบียบต่าง ๆ มีการพัฒนาอยู่ตลอดเวลา

สิ่งนี้ถือเป็นตลาดอสังหาริมทรัพย์ซึ่งนอกจากนี้อาจมีรอบยาว ยกตัวอย่างเช่นการประดิษฐ์หลักทรัพย์ที่ได้รับการสนับสนุนการจำนองแปลงตลาดจำนองและเปิดประตูน้ำท่วมเพื่อการจำนองและโชคไม่ดีที่การเก็งกำไร

วิธีการทดสอบการเปลี่ยนแปลงระบอบการปกครองจะมีประโยชน์อย่างยิ่งในการตัดสินใจในลักษณะที่ไม่ใช่อัตนัยเมื่อไม่รวมประวัติศาสตร์


1

โดยทั่วไปสิ่งนี้สามารถดูได้ว่าเป็นปัญหาค่าพารามิเตอร์ที่มีขอบเขต เมื่อฉันเข้าใจคำถามของคุณคุณมีพารามิเตอร์ข้อมูลน้อยกว่า (หลักประกันคุณภาพที่ไม่รู้จัก [Cu]) ในช่วงต้นข้อมูลของคุณและให้ข้อมูลเพิ่มเติม (หลักประกันที่มี [Ch] สูงปานกลาง [Cm] หรือคุณภาพต่ำ [Cl]) ข้อมูลในภายหลัง

หากคุณเชื่อว่าพารามิเตอร์ที่ไม่ได้สังเกตเห็นสำหรับโมเดลนั้นไม่เปลี่ยนแปลงตลอดเวลาดังนั้นเมธอดสามารถเป็นเรื่องง่ายโดยที่คุณคิดว่าการประมาณจุดของแต่ละพารามิเตอร์คือ Cl <Cm <Ch และ Cl <= Cu <= Ch เหตุผลก็คือ Cl นั้นแย่ที่สุดและ Ch นั้นดีที่สุดดังนั้นเมื่อไม่ทราบข้อมูลมันจะต้องอยู่ระหว่างหรือเท่ากับนั้น หากคุณเต็มใจที่จะเข้มงวดเล็กน้อยและคิดว่าไม่ใช่หลักประกันทั้งหมดที่มีคุณภาพสูงหรือต่ำในช่วง 15 ปีแรกคุณสามารถสันนิษฐานได้ว่า Cl <Cu <Ch ซึ่งทำให้การประมาณการง่ายขึ้นอย่างมีนัยสำคัญ

ในทางคณิตศาสตร์สิ่งเหล่านี้สามารถประมาณด้วยสิ่งที่ชอบ:

Cl=exp(β1)Cm=exp(β1)+exp(β2)Cu=exp(β1)+exp(β3)1+exp(β4)Ch=exp(β1)+exp(β2)+exp(β3)

ในกรณีที่ฟังก์ชัน logit ใน Cu จำกัด ค่าให้อยู่ระหว่าง Cl และ Ch โดยไม่ จำกัด ที่สัมพันธ์กับ Cm (สามารถใช้ฟังก์ชั่นอื่น ๆ ระหว่าง 0 ถึง 1 ได้)

ความแตกต่างในแบบจำลองก็คือควรสร้างความแปรปรวนเพื่อให้ความแปรปรวนที่เหลือขึ้นอยู่กับช่วงเวลาเพราะข้อมูลในแต่ละช่วงเวลานั้นแตกต่างกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.