ไม่กี่เดือนที่ผ่านมาฉันฝึกงานที่องค์กรนี้ และในฐานะที่เป็นของขวัญวันหยุดฉันตัดสินใจใช้เวลาหนึ่งสัปดาห์ที่ผ่านมาไม่ว่าจะมีเวลาว่างเพื่อศึกษาปัจจัยที่มีผลต่อเงินเดือนครู ปัญหาหนึ่งที่ฉันพบกับเงินเดือนครูคือการแจกแจงสถานะที่กำหนดนั้นเบ้ ฉันมีข้อสังเกตมากมายที่เกาะอยู่กับระดับล่างสุดของค่าจ้าง ฉันพยายามแก้ไขปัญหานี้โดยการรวมดัชนีค่าจ้างที่เปรียบเทียบได้ลงในตัวแปรตาม (ค่าจ้างครู) ของฉัน แต่ผลลัพธ์ที่ฉันพบนั้นล้าสมัยสำหรับขอบเขตของโครงการของฉัน ฉันตัดสินใจที่จะบันทึกตัวแปรตามของฉันแทน นี่เป็นสิ่งที่ดีเพราะตอนนี้ค่าแรงของฉันมีการกระจายตัวแบบปกติและมันก็ดูสมบูรณ์แบบในฮิสโตแกรม เมื่อฉันเริ่มทดสอบลงฉันไปถึงจุดที่ฉันถูกทิ้งให้อยู่กับตัวแปรอิสระตัวสุดท้ายตัวหนึ่งคืนภาษีทรัพย์สิน ปัญหาเกี่ยวกับค่าจ้างเชิงบรรทัดฐานของฉันก็เห็นได้ชัดในการสังเกตการคืนภาษีทรัพย์สินของฉัน ฉันมีการคืนภาษีทรัพย์สินจำนวนมากบิดเบือนไปจนถึงระดับล่างสุดของสเปกตรัม ดังนั้นฉันบันทึกตัวแปรนี้ด้วยและมันก็ยังผ่านการทดสอบสมมติฐานว่าง
ฉันไม่แน่ใจว่าสิ่งนี้ถูกต้องหรือไม่ แต่โดยการเปรียบเทียบการเปลี่ยนแปลงของตัวแปรที่บันทึกไว้หนึ่งตัวกับตัวแปรที่บันทึกไว้อีกตัวหนึ่งทำให้ฉันมีความยืดหยุ่น สมมติว่าสิ่งนี้ถูกต้องสมการการถดถอยของฉัน (คล้าย LogWages = B0 + B1 (LogPropertyTaxReturns)) แสดงความยืดหยุ่นระหว่างตัวแปรสองตัว สิ่งนี้มีความหมายไหม? หากเป้าหมายของฉันคือการดูว่าตัวแปรใดที่ส่งผลกระทบต่อเงินเดือนครูมากที่สุดในเขตที่กำหนดไว้ในรัฐของฉันการแสดงความยืดหยุ่นระหว่างตัวแปรทั้งสองนั้นมีประโยชน์หรือไม่ เราต้องการยกระดับการปกครองด้วยเงินเดือนครูต่ำที่สุดเพื่อเพิ่มมาตรฐานการครองชีพของพวกเขา แต่ฉันกลัวว่าฉันคาดการณ์ไกลจากการสังเกตจริง ๆ ว่าสมการการถดถอยสุดท้ายของฉันไม่มีความหมาย
แก้ไข: หนึ่งในความกลัวที่ใหญ่กว่าของฉันคือฉันควรใช้โมเดลที่ไม่ใช่เชิงเส้นเพื่อแสดงความสัมพันธ์ ฉันรู้สึกว่าการบังคับให้ทั้งตัวแปรอิสระและอิสระให้ความร่วมมือในการถดถอยเชิงเส้นนี้ทำให้เข้าใจผิดในทางใดทางหนึ่ง