นี่อาจไม่ใช่สิ่งที่ดีที่จะทำ เมื่อมองไปที่บุคคลที่แปรเปลี่ยนมาก่อนแล้วจึงสร้างแบบจำลองที่มีนัยสำคัญเทียบเท่ากับกระบวนการค้นหาอัตโนมัติ ในขณะที่วิธีการนี้ใช้งานง่ายการอ้างถึงที่ทำจากโพรซีเดอร์นี้จะไม่ถูกต้อง (เช่นค่า p จริงนั้นแตกต่างจากที่รายงานโดยซอฟต์แวร์) ปัญหาถูกขยายให้ใหญ่ขึ้นเท่าขนาดของชุดเริ่มต้นของ covariates คือ หากคุณทำเช่นนี้ (และน่าเสียดายที่หลายคนทำ) คุณไม่สามารถใช้โมเดลที่เป็นผลลัพธ์ได้อย่างจริงจัง แต่คุณจะต้องทำการศึกษาใหม่ทั้งหมดรวบรวมตัวอย่างที่เป็นอิสระและปรับรุ่นก่อนหน้าให้เหมาะสมเพื่อทดสอบ อย่างไรก็ตามสิ่งนี้ต้องการทรัพยากรจำนวนมากและยิ่งกว่านั้นเนื่องจากกระบวนการมีข้อบกพร่องและรุ่นก่อนหน้าน่าจะเป็นรุ่นที่ไม่ดีเปลืองทรัพยากรมาก
วิธีที่ดีกว่าคือการประเมินแบบจำลองที่คุณสนใจอย่างมาก จากนั้นใช้เกณฑ์ข้อมูลที่ลงโทษความยืดหยุ่นของโมเดล (เช่น AIC) เพื่อตัดสินระหว่างโมเดลเหล่านั้น สำหรับการถดถอยโลจิสติก AIC คือ:
AIC=−2×ln(likelihood)+2k
โดยคือจำนวนโควาเรียตที่รวมอยู่ในแบบจำลองนั้น คุณต้องการโมเดลที่มีค่าน้อยที่สุดสำหรับ AIC ทุกสิ่งเท่าเทียมกัน อย่างไรก็ตามมันไม่ง่ายเสมอไป ระวังเมื่อหลายรุ่นมีค่าที่คล้ายกันสำหรับ AIC แม้ว่าหนึ่งอาจจะต่ำที่สุด k
ฉันรวมสูตรสมบูรณ์สำหรับ AIC ไว้ที่นี่เพราะซอฟต์แวร์ที่แตกต่างกันให้ข้อมูลต่างกัน คุณอาจต้องคำนวณจากโอกาสที่จะเกิดขึ้นหรือคุณอาจได้คะแนน AIC ขั้นสุดท้ายหรืออะไรก็ตาม