พิจารณาปัญหาคลาสสิกการวิเคราะห์ข้อมูลที่คุณมีผลและวิธีการที่เกี่ยวข้องกับจำนวนของการทำนาย . ประเภทพื้นฐานของแอปพลิเคชันในที่นี้คือ
บางผลระดับกลุ่มเช่นอัตราการเกิดอาชญากรรมในเมืองผม
ทำนายลักษณะระดับกลุ่มเช่นคุณลักษณะทางประชากรของเมืองที่ฉัน
เป้าหมายพื้นฐานคือเพื่อให้เหมาะสมกับโมเดลการถดถอย (อาจมีเอฟเฟกต์แบบสุ่ม แต่ลืมไปแล้วว่าตอนนี้):
ความยุ่งยากทางเทคนิคบางอย่างเกิดขึ้นหรือไม่เมื่อหนึ่ง (หรือมากกว่า) ของผู้ทำนายเป็นผลจากการสำรวจที่มีขนาดตัวอย่างแตกต่างกันสำหรับแต่ละหน่วย? ตัวอย่างเช่นสมมติว่าเป็นคะแนนสรุปสำหรับเมืองที่ฉันนั่นคือการตอบสนองโดยเฉลี่ยจากกลุ่มตัวอย่างประชาชนจากเมืองฉันแต่ตัวอย่างขนาดเฉลี่ยเหล่านี้อยู่บนพื้นฐานของความแตกต่างกันอย่างดุเดือด:
เนื่องจากตัวแปรทำนายไม่ได้มีความหมายเหมือนกันในบางแง่มุมสำหรับแต่ละเมืองฉันกลัวว่าการปรับเปลี่ยนตัวแปรเหล่านี้ในรูปแบบการถดถอยราวกับว่าพวกเขาทั้งหมด "สร้างเท่ากัน" อาจทำให้การอนุมานที่ทำให้เข้าใจผิดบางอย่าง
มีชื่อสำหรับปัญหาประเภทนี้หรือไม่? ถ้าเป็นเช่นนั้นมีงานวิจัยเกี่ยวกับวิธีจัดการกับเรื่องนี้หรือไม่?
ความคิดของฉันคือการปฏิบัติต่อมันเป็นตัวแปรทำนายที่วัดได้ด้วยความผิดพลาดและทำบางสิ่งบางอย่างตามเส้นเหล่านี้ แต่มีความแตกต่างของข้อผิดพลาดในการวัดดังนั้นจึงมีความซับซ้อนมาก ฉันคิดว่าวิธีนี้ผิดหรืออาจทำให้มันซับซ้อนกว่านี้ แต่การสนทนาใด ๆ ที่นี่จะเป็นประโยชน์