แม้ว่าคำถามนี้และคำตอบแรกของมันดูเหมือนว่าจะมุ่งเน้นไปที่ประเด็นทางทฤษฎีของการสอบเทียบแบบจำลองการถดถอยโลจิสติกปัญหาของ:
หนึ่งจะทำลายการสอบเทียบของการถดถอยโลจิสติก ...
สมควรได้รับความสนใจเกี่ยวกับแอปพลิเคชันที่ใช้งานจริงสำหรับผู้อ่านในอนาคตของหน้านี้ เราไม่ควรลืมว่าจะต้องระบุรูปแบบการถดถอยโลจิสติกส์อย่างดีและปัญหานี้อาจเป็นปัญหาโดยเฉพาะอย่างยิ่งสำหรับการถดถอยโลจิสติก
ก่อนอื่นถ้าอัตราต่อรองของการเป็นสมาชิกชั้นเรียนไม่เกี่ยวข้องกับตัวทำนายที่เป็นเส้นตรงในโมเดลนั้นจะไม่ได้รับการสอบเทียบอย่างเหมาะสม บทที่ 10 ของ Harrellเกี่ยวกับการถดถอยแบบโลจิสติกไบนารีอุทิศประมาณ 20 หน้าใน "การประเมินแบบจำลองพอดี" เพื่อที่เราจะได้ใช้ประโยชน์จาก
ประการที่สองสเปครุ่นเป็นปัญหาโดยเฉพาะอย่างยิ่งในการถดถอยโลจิสติกในขณะที่มันมีโดยธรรมชาติละเว้นอคติตัวแปรที่สามารถนำความประหลาดใจให้กับผู้ที่มีพื้นหลังในการถดถอยเชิงเส้นธรรมดา เมื่อหน้านั้นวางไว้:
ตัวแปรที่ถูกละเว้นจะมีอคติกับค่าสัมประสิทธิ์ของตัวแปรที่รวมแม้ว่าตัวแปรที่ละเว้นจะไม่สัมพันธ์กับตัวแปรที่รวมอยู่
หน้านั้นยังมีคำอธิบายที่เป็นประโยชน์ว่าทำไมถึงต้องมีการคาดการณ์พฤติกรรมนี้พร้อมคำอธิบายเชิงทฤษฎีสำหรับโมเดล probit ที่เกี่ยวข้อง ดังนั้นหากคุณไม่ทราบว่าคุณได้รวมเครื่องมือทำนายไว้ทั้งหมดที่เกี่ยวข้องกับการเป็นสมาชิกในชั้นเรียนคุณอาจพบอันตรายจากการสะกดคำผิดและการสอบเทียบไม่ดี
ด้วยความเคารพต่อข้อกำหนดของแบบจำลองมันเป็นไปได้มากที่วิธีการที่ใช้ต้นไม้เช่นป่าสุ่มซึ่งไม่ถือว่าเป็นเชิงเส้นในช่วงของค่าทำนายทั้งหมดและให้ความเป็นไปได้ในการค้นหาและรวมถึงปฏิสัมพันธ์ระหว่างผู้ทำนายด้วย แบบจำลองที่ปรับเทียบในทางปฏิบัติกว่าแบบจำลองการถดถอยโลจิสติกซึ่งไม่นำเงื่อนไขการโต้ตอบหรือความไม่เป็นเชิงเส้นมาพิจารณาอย่างเพียงพอ ด้วยความเคารพต่ออคติแบบละเว้นตัวแปรมันไม่ชัดเจนสำหรับฉันว่าวิธีใดในการประเมินความน่าจะเป็นสมาชิกระดับชั้นเรียนสามารถจัดการกับปัญหานั้นได้อย่างเพียงพอ