มีหลายประเด็นที่นี่
โดยปกติเราต้องการที่จะกำหนดขนาดของกลุ่มตัวอย่างขั้นต่ำเพื่อให้บรรลุในระดับที่ยอมรับได้น้อยที่สุดของอำนาจทางสถิติ ขนาดตัวอย่างที่ต้องการคือฟังก์ชั่นของปัจจัยหลายอย่างโดยหลักแล้วขนาดของเอฟเฟกต์ที่คุณต้องการจะแตกต่างจาก 0 (หรือสิ่งใดก็ตามที่คุณใช้เป็นโมฆะ แต่ 0 เป็นเรื่องธรรมดามากที่สุด) และความน่าจะเป็นขั้นต่ำ ต้องการจะมี. ทำงานจากมุมมองนี้ขนาดตัวอย่างถูกกำหนดโดยการวิเคราะห์พลังงาน
สิ่งที่ควรพิจารณาอีกประการคือความเสถียรของแบบจำลองของคุณ (ตามบันทึก @cbeleites) โดยทั่วไปเมื่ออัตราส่วนของพารามิเตอร์ที่ประมาณจำนวนข้อมูลใกล้เคียงกับ 1 แบบจำลองของคุณจะอิ่มตัวและจำเป็นต้องมีความเหมาะสมมากเกินไป (ยกเว้นในความเป็นจริงไม่มีการสุ่มในระบบ) กฎของอัตราส่วน 1 ถึง 10 ของหัวแม่มือมาจากมุมมองนี้ โปรดทราบว่าโดยทั่วไปแล้วการมีพลังอำนาจที่เพียงพอจะครอบคลุมข้อกังวลนี้ของคุณ แต่ไม่ใช่ในทางกลับกัน
อย่างไรก็ตามกฎ 1 ถึง 10 นั้นมาจากโลกของการถดถอยเชิงเส้นดังนั้นสิ่งสำคัญคือต้องตระหนักว่าการถดถอยโลจิสติกส์มีความซับซ้อนเพิ่มขึ้น ปัญหาหนึ่งคือการถดถอยโลจิสติกทำงานได้ดีที่สุดเมื่อเปอร์เซ็นต์ของ 1 และ 0 นั้นประมาณ 50% / 50% (ตามที่ @ andrea และ @psj อภิปรายในความคิดเห็นด้านบน) อีกประเด็นที่ต้องคำนึงถึงคือการแยกออกจากกัน นั่นคือคุณไม่ต้องการรวบรวม 1 ทั้งหมดของคุณไว้ในตัวแปรอิสระตัวใดตัวหนึ่ง (หรือบางส่วนรวมกัน) และ 0 ทั้งหมดที่สุดขั้วอื่น ๆ แม้ว่านี่จะดูเหมือนเป็นสถานการณ์ที่ดีเพราะมันจะทำให้การคาดการณ์ที่สมบูรณ์แบบง่าย แต่จริง ๆ แล้วทำให้กระบวนการประมาณค่าพารามิเตอร์ระเบิดขึ้น (@Scortchi มีการอภิปรายที่ยอดเยี่ยมของวิธีการจัดการกับการแยกในการถดถอยโลจิสติกที่นี่:วิธีจัดการกับการแยกที่สมบูรณ์แบบในการถดถอยโลจิสติก? ) ด้วย IV ที่มากขึ้นสิ่งนี้จะมีโอกาสมากขึ้นแม้ว่าขนาดที่แท้จริงของเอฟเฟกต์จะคงที่และโดยเฉพาะอย่างยิ่งถ้าการตอบสนองของคุณไม่สมดุลกัน ดังนั้นคุณสามารถต้องการมากกว่า 10 ข้อมูลต่อ IV
ปัญหาหนึ่งที่ผ่านมากับกฎของหัวแม่มือนั้นก็คือว่ามันจะถือว่า IV ของคุณเป็นมุมฉาก สิ่งนี้มีความเหมาะสมสำหรับการทดลองที่ออกแบบมา แต่ด้วยการศึกษาเชิงสังเกตการณ์เช่นของคุณ IV ของคุณแทบจะไม่ได้ตั้งฉากแบบคร่าวๆเลย มีกลยุทธ์ในการจัดการกับสถานการณ์นี้ (เช่นการรวมหรือการลดลงของ IV ดำเนินการวิเคราะห์องค์ประกอบหลักก่อน ฯลฯ ) แต่หากไม่ได้รับการแก้ไข (ซึ่งเป็นเรื่องปกติ) คุณจะต้องการข้อมูลเพิ่มเติม
คำถามที่สมเหตุสมผลแล้วค่าต่ำสุด N ของคุณควรเป็นเท่าใดและ / หรือขนาดตัวอย่างของคุณเพียงพอหรือไม่ ในการแก้ไขปัญหานี้ฉันขอแนะนำให้คุณใช้วิธีการ @cbeleites พูดถึง; การใช้กฎ 1 ถึง 10 จะไม่เพียงพอ
1
ของ) และ 90 ไม่ใช่คดี (0
ของ) แล้วกฎบอกว่า "รวมเพียง 1 ทำนาย" แต่ถ้าฉันทำตัวเป็นแบบจำลอง0
แทนที่จะ1
เป็นแล้วฉันก็ใช้ส่วนกลับของอัตราส่วนอัตราต่อรองโดยประมาณ ฉันจะได้รับอนุญาตให้รวมตัวทำนาย 9 ตัวหรือไม่ นั่นทำให้ฉันไม่มีเหตุผล