ฉันหมายถึงคำถามและคำตอบ: วิธีการเปรียบเทียบ (ความน่าจะเป็น) ความสามารถในการทำนายของแบบจำลองที่พัฒนาจากการถดถอยโลจิสติก? โดย @Clark Chong และคำตอบ / ความคิดเห็นโดย @Frank Harrell และคำถามองศาความเป็นอิสระของในการทดสอบ Hosmer-Lemeshowและความคิดเห็น
ฉันได้อ่านเอกสารDW Hosmer, T. Hosmer, S. Le Cessie, S. Lemeshow, "การเปรียบเทียบการทดสอบความดีพอดีสำหรับรูปแบบการถดถอยโลจิสติก", สถิติการแพทย์, ฉบับที่ 16, 965-980 (1997)
หลังจากอ่านฉันสับสนเพราะคำถามที่ฉันอ้างถึงขอให้ชัดเจนสำหรับ "(ความน่าจะเป็น) ความสามารถในการทำนาย" ซึ่งในความคิดของฉันไม่เหมือนกับสิ่งที่ดี - ของ - พอดี - แบบทดสอบในกระดาษ supra มุ่ง:
ดังที่พวกเราส่วนใหญ่ทราบกันว่าการถดถอยแบบลอจิสติกถือว่าการเชื่อมโยงรูปตัว S ระหว่างตัวแปรอธิบายและความน่าจะเป็นของความสำเร็จรูปแบบการทำงานของรูปตัว S คือ
โดยไม่ต้องแสร้งว่าไม่มีข้อบกพร่องในการทดสอบ Hosmer – Lemeshow ฉันคิดว่าเราต้องแยกแยะระหว่างการทดสอบสำหรับความสามารถในการคาดการณ์ (a) '(ความน่าจะเป็น) ' และ (b) ' ความดี - พอดี '
เป้าหมายของอดีตคือการทดสอบว่าความน่าจะเป็นที่คาดการณ์ได้ดีหรือไม่ในขณะที่การทดสอบความดีของความพอดีนั้นทดสอบว่าฟังก์ชันรูปตัว S ข้างต้นเป็นฟังก์ชัน 'ถูกต้อง' หรือไม่ เป็นทางการมากขึ้น:
- การทดสอบสำหรับ 'การทดสอบความสามารถในการคาดการณ์ความน่าจะเป็น' มีระบุว่าความน่าจะเป็นที่จะประสบความสำเร็จนั้นได้รับการทำนายโดยแบบจำลอง
- ในขณะที่การทดสอบความดีพอดีคือ (ดู Hosmer et. al.) ว่ารูปแบบการใช้งานรูปตัว S เป็นแบบที่ถูกต้อง Hosmer และคณะ ทำแบบจำลองที่พวกเขาพบว่าพลังในการตรวจจับการเบี่ยงเบนสองประเภทจากโมฆะนั่นคือฟังก์ชั่นลิงค์ผิดหรือเลขชี้กำลังในตัวส่วนนั้นไม่ใช่แบบเชิงเส้น
เห็นได้ชัดว่าหากฟังก์ชั่นด้านบนมีรูปแบบการทำงานที่ 'ถูกต้อง' (ดังนั้นหากการทดสอบสรุปว่าเราสามารถยอมรับสำหรับการทดสอบความดีพอดี), ดังนั้นความน่าจะเป็นที่คาดการณ์จะดีขึ้น ...
คำพูดแรก
... อย่างไรก็ตามการยอมรับเป็นข้อสรุปที่อ่อนแอตามที่อธิบายไว้ในสิ่งต่อไปนี้ถ้าเราล้มเหลวในการปฏิเสธสมมติฐานว่าง .
คำถามแรก
คำถาม / ข้อสังเกตที่สำคัญที่สุดที่ฉันมีคือหากความดีงามของความพอดีถูกปฏิเสธดังนั้นบทสรุปของการทดสอบก็คือรูปแบบการทำงานไม่ใช่แบบ 'ถูกต้อง' อย่างไรก็ตามสิ่งนี้แสดงถึงความน่าจะเป็น ทำนายไม่ดีเหรอ?
คำถามที่สอง
นอกจากนี้ฉันต้องการชี้ไปที่บทสรุปของ Hosmer และ อัล; (ฉันอ้างจากนามธรรม):
'' การตรวจสอบประสิทธิภาพของการทดสอบเมื่อแบบจำลองที่ถูกต้องมีคำว่ากำลังสอง แต่แบบจำลองที่มีเฉพาะคำเชิงเส้นตรงพอดีแสดงว่าเพียร์สันไคสแควร์เพียร์สันไคส์สแควร์ที่ไม่มีน้ำหนัก ของความเสี่ยงผลรวมของสแควร์สเรียบและการทดสอบคะแนนของ Stukel มีอำนาจเกินกว่า 50 เปอร์เซ็นต์ในการตรวจสอบขาออกระดับปานกลางจากเส้นตรงเมื่อขนาดตัวอย่าง 100 และมีอำนาจมากกว่า 90 เปอร์เซ็นต์สำหรับทางเลือกเดียวกันเหล่านี้สำหรับตัวอย่างขนาด 500 การทดสอบทั้งหมดไม่มีอำนาจเมื่อแบบจำลองที่ถูกต้องมีปฏิสัมพันธ์ระหว่างโควาริเตตแบบแบ่งขั้วและแบบต่อเนื่อง แต่แบบจำลองโควาเรียตต่อเนื่องนั้นพอดี อำนาจในการตรวจสอบลิงก์ที่ระบุอย่างไม่ถูกต้องนั้นไม่ดีสำหรับตัวอย่างขนาด 100 สำหรับตัวอย่างขนาด 500 Stukel ' การทดสอบคะแนนมีพลังดีที่สุด แต่เกิน 50 เปอร์เซ็นต์ในการตรวจสอบฟังก์ชันลิงค์อสมมาตร พลังของการทดสอบ sum-of-squares ที่ไม่ถ่วงเพื่อตรวจสอบฟังก์ชันลิงก์ที่ระบุอย่างไม่ถูกต้องนั้นน้อยกว่าการทดสอบคะแนนของ Stukel เล็กน้อย ''
ฉันสามารถสรุปได้จากการทดสอบนี้ที่มีพลังมากขึ้นหรือ Hosmer – Lemeshow มีพลังน้อยกว่า (เพื่อตรวจสอบความผิดปกติเฉพาะเหล่านี้)
คำพูดที่สอง
กระดาษโดย Hosmer et อัล ที่ฉันเรียกว่า supra, คำนวณ (จำลอง) พลังในการตรวจจับความผิดปกติเฉพาะ (พลังสามารถคำนวณได้เฉพาะเมื่อมีการระบุ ) ตามความเห็นของฉันฉันไม่ได้บอกเป็นนัยว่าผลลัพธ์เหล่านี้สามารถสรุปเป็น '' ทางเลือกที่เป็นไปได้ทั้งหมด ''