เศรษฐมิติ: ความยืดหยุ่นมีความหมายในการถดถอยของฉันหรือไม่?


13

ไม่กี่เดือนที่ผ่านมาฉันฝึกงานที่องค์กรนี้ และในฐานะที่เป็นของขวัญวันหยุดฉันตัดสินใจใช้เวลาหนึ่งสัปดาห์ที่ผ่านมาไม่ว่าจะมีเวลาว่างเพื่อศึกษาปัจจัยที่มีผลต่อเงินเดือนครู ปัญหาหนึ่งที่ฉันพบกับเงินเดือนครูคือการแจกแจงสถานะที่กำหนดนั้นเบ้ ฉันมีข้อสังเกตมากมายที่เกาะอยู่กับระดับล่างสุดของค่าจ้าง ฉันพยายามแก้ไขปัญหานี้โดยการรวมดัชนีค่าจ้างที่เปรียบเทียบได้ลงในตัวแปรตาม (ค่าจ้างครู) ของฉัน แต่ผลลัพธ์ที่ฉันพบนั้นล้าสมัยสำหรับขอบเขตของโครงการของฉัน ฉันตัดสินใจที่จะบันทึกตัวแปรตามของฉันแทน นี่เป็นสิ่งที่ดีเพราะตอนนี้ค่าแรงของฉันมีการกระจายตัวแบบปกติและมันก็ดูสมบูรณ์แบบในฮิสโตแกรม เมื่อฉันเริ่มทดสอบลงฉันไปถึงจุดที่ฉันถูกทิ้งให้อยู่กับตัวแปรอิสระตัวสุดท้ายตัวหนึ่งคืนภาษีทรัพย์สิน ปัญหาเกี่ยวกับค่าจ้างเชิงบรรทัดฐานของฉันก็เห็นได้ชัดในการสังเกตการคืนภาษีทรัพย์สินของฉัน ฉันมีการคืนภาษีทรัพย์สินจำนวนมากบิดเบือนไปจนถึงระดับล่างสุดของสเปกตรัม ดังนั้นฉันบันทึกตัวแปรนี้ด้วยและมันก็ยังผ่านการทดสอบสมมติฐานว่าง

ฉันไม่แน่ใจว่าสิ่งนี้ถูกต้องหรือไม่ แต่โดยการเปรียบเทียบการเปลี่ยนแปลงของตัวแปรที่บันทึกไว้หนึ่งตัวกับตัวแปรที่บันทึกไว้อีกตัวหนึ่งทำให้ฉันมีความยืดหยุ่น สมมติว่าสิ่งนี้ถูกต้องสมการการถดถอยของฉัน (คล้าย LogWages = B0 + B1 (LogPropertyTaxReturns)) แสดงความยืดหยุ่นระหว่างตัวแปรสองตัว สิ่งนี้มีความหมายไหม? หากเป้าหมายของฉันคือการดูว่าตัวแปรใดที่ส่งผลกระทบต่อเงินเดือนครูมากที่สุดในเขตที่กำหนดไว้ในรัฐของฉันการแสดงความยืดหยุ่นระหว่างตัวแปรทั้งสองนั้นมีประโยชน์หรือไม่ เราต้องการยกระดับการปกครองด้วยเงินเดือนครูต่ำที่สุดเพื่อเพิ่มมาตรฐานการครองชีพของพวกเขา แต่ฉันกลัวว่าฉันคาดการณ์ไกลจากการสังเกตจริง ๆ ว่าสมการการถดถอยสุดท้ายของฉันไม่มีความหมาย

แก้ไข: หนึ่งในความกลัวที่ใหญ่กว่าของฉันคือฉันควรใช้โมเดลที่ไม่ใช่เชิงเส้นเพื่อแสดงความสัมพันธ์ ฉันรู้สึกว่าการบังคับให้ทั้งตัวแปรอิสระและอิสระให้ความร่วมมือในการถดถอยเชิงเส้นนี้ทำให้เข้าใจผิดในทางใดทางหนึ่ง


1
มันมีความหมายอย่างยิ่ง ดูคำจำกัดความของความยืดหยุ่น โดยทั่วไปคุณมีข้อมูลเกี่ยวกับทิศทางของความสัมพันธ์ระหว่างค่าจ้างและ PropertyTaxReturns ยิ่งกว่านั้นคุณมีการวัดความสัมพันธ์โดยประมาณ เนื่องจากเป็นบันทึกการทำงานค่าจ้างจะเปลี่ยนเป็นร้อยละ B1 ต่อการเปลี่ยนแปลงร้อยละหนึ่งของการคืนภาษีทรัพย์สิน คุณสามารถทำการวิเคราะห์อนุกรมเวลาเพื่อยืนยัน ที่จริงแล้วเพียงแค่แสดงกราฟค่าแรงและการคืนภาษีทรัพย์สินเมื่อเวลาผ่านไปก็เพียงพอที่จะเห็นความสัมพันธ์คืออะไร นั่นเป็นวิธีการพื้นฐานที่ไม่สามารถอธิบายตัวแปรที่ซ่อนอยู่และอื่น ๆ ได้
Koba

@Koba ขอบคุณที่แสดงความคิดเห็นอย่างรวดเร็ว ไม่ใช่ปัญหาแม้ว่าความยืดหยุ่นนั้นจะเปลี่ยนไปตามเส้นโค้งหรือไม่? ความเสียใจที่ยิ่งใหญ่ที่สุดของฉันคือฉันอาจบังคับให้แบบจำลองเป็นเส้นตรงบังคับให้ความยืดหยุ่นมีความเสถียรพอสมควร ลองนึกย้อนกลับไปมันอาจจะดีกว่าถ้ามีโมเดลที่ไม่ใช่เชิงเส้นเพื่อสะท้อนความเบ้นี้ที่ฉันพูดถึง
rosenjcb

ไม่มีอะไรผิดปกติในการแปลงตัวแปรโดยใช้ log, square root, reciprocals หรือวิธีอื่น คุณไม่ได้บังคับอะไรเลย คุณใช้การแปลงเพื่อค้นหาความสัมพันธ์เชิงเส้นระหว่างตัวแปร บางครั้งมันง่ายเหมือนคุณแค่ใช้ y = b0 + b1 * x ตัวแปรอื่น ๆ นั้นมีความสัมพันธ์เชิงเส้นในลักษณะที่ซับซ้อนกว่าเช่น log (y) = b0 + b1 * (1 / x) ฟังก์ชั่นสุดท้ายอาจให้ความสัมพันธ์เชิงเส้นที่ดีกับคุณ แต่มันยากที่จะตีความดังนั้นการแปลงที่น้อยกว่าคุณสามารถใช้ที่ดีกว่าได้
Koba

ฟังก์ชั่นบันทึกการทำงานคือบันทึกตรงไปตรงมา (y) = b0 + b1 * บันทึก (x) B1 คือการเปลี่ยนแปลงเปอร์เซ็นต์ใน y ต่อการเปลี่ยนแปลงหนึ่งเปอร์เซ็นต์ใน x ในการวิเคราะห์แบบตัดขวางของคุณ อีกครั้งหากคุณมีข้อมูลนี้ในช่วงระยะเวลาหนึ่งคุณสามารถสร้างกราฟเพื่อดูความสัมพันธ์
Koba

ฉันบันทึกตัวแปรไว้ก่อนและทำการเปลี่ยนแปลงอื่น ๆ สำหรับแบบจำลองการถดถอยของฉัน ฉันแค่กังวลว่าความยืดหยุ่นให้ข้ออ้างในการประชุม แม้ว่าจะคิดย้อนกลับไปแบบจำลองเป็นแบบเชิงเส้น แต่ก็มีปัญหาในการมีตัวแปรตามและตัวแปรอิสระที่มีการแจกแจงแบบเบ้
rosenjcb

คำตอบ:


12

คำตอบสำหรับคำถามคือใช่มันมีความหมายจริง ๆ (อย่างน้อยก็พูดทางคณิตศาสตร์) ถ้าคุณประมาณสมการเชิงเส้น

W=β0+β1PTR,

β1=WPTRβ1PTRW

log(W)=β0+β1log(PTR),

β1=WPTRPTRW

โดยทั่วไปการแปลงเชิงเส้นจะมีผลต่อการตีความค่าสัมประสิทธิ์เท่านั้น แต่ความถูกต้องของการถดถอยเอง (ในแง่เศรษฐกิจกว้าง) นั้นได้มาจากการตั้งสมมติฐานของแบบจำลองและการวิเคราะห์ปรากฏการณ์ทางเศรษฐกิจ


8

Y=αXβlnY=lnα+βlnX

ฉันเดาว่าคำถามของคุณคือการใช้แบบฟอร์มการทำงานนี้เหมาะสมหรือไม่ในแบบจำลองเฉพาะของคุณ มันยากที่จะพูด. เช่นเดียวกับการถดถอยเชิงเส้นธรรมดาคุณกำลังตั้งสมมติฐานเกี่ยวกับรูปแบบการทำงาน อย่างน้อยคุณก็สามารถคิดได้ว่ามันเป็นการประมาณเชิงเส้นที่เหมาะสมกว่าหลังจากการแปลงล็อก - ล็อก


7

xαβF

เข้าสู่ระบบYผม=α+βเข้าสู่ระบบxผม+ΣJ=2SγJχJ+λJχJเข้าสู่ระบบxผม
χJγλ

โปรดทราบว่าในฐานะตัวแทนของการตัดสินใจที่แท้จริง "จริง" ทำให้การแปลงทั้งหมดที่ทำให้เกิดการถดถอยเชิงเส้นเป็นสิ่งที่ผิด ในความเป็นจริงทุกรุ่นจะผิด คำถามคือจริง ๆ : สถิติที่คุณได้รับจากโมเดลนี้มีประโยชน์ต่อปัญหาของคุณหรือไม่ หากการศึกษาของคุณมุ่งเน้นไปที่การกำหนดรูปแบบพื้นฐานนี่เป็นช่วงเวลาที่บอกสิ่งที่คุณสนใจเกี่ยวกับตัวแบบที่ลึกกว่านั้นหรือไม่? หากคุณมุ่งเน้นนโยบายมากกว่านี้การประมาณที่มีความยืดหยุ่นคงที่จะช่วยให้คุณเข้าใกล้ความจริงที่ว่าการปรับปรุงเพิ่มเติมนั้นไม่เกี่ยวข้องหรือไม่ อาจเป็นคำถามที่ตอบยากมากในฐานะผู้สังเกตการณ์ภายนอก แต่ถ้าทางเลือกเดียวที่คุณกังวลคือความยืดหยุ่นของตัวแปรการทดสอบที่ฉันระบุไว้ด้านบนอาจทำให้คุณสบายใจ


4

คำตอบอื่น ๆ ครอบคลุมประเด็นหลักฉันต้องการตอบ "แก้ไข" ที่ทำโดย OP ในคำถาม:

แก้ไข: หนึ่งในความกลัวที่ใหญ่กว่าของฉันคือฉันควรใช้โมเดลที่ไม่ใช่เชิงเส้นเพื่อแสดงความสัมพันธ์ ฉันรู้สึกว่าการบังคับให้ทั้งตัวแปรอิสระและอิสระให้ความร่วมมือในการถดถอยเชิงเส้นนี้ทำให้เข้าใจผิดในทางใดทางหนึ่ง

เรามักจะลืมว่า "การเปลี่ยนตัวแปร" นำไปสู่ตัวแปรใหม่ซึ่งพฤติกรรมอาจแตกต่างจาก "ต้นฉบับ" อย่างสิ้นเชิง ตัวอย่างที่ง่ายที่สุดคือการเปรียบเทียบกราฟของตัวแปรและสแควร์ของมัน

ดังนั้นโดยพิจารณาลอการิทึมธรรมชาติของตัวแปรของคุณคุณไม่ตรวจสอบความสัมพันธ์ระหว่างพวกเขาแต่ความสัมพันธ์ระหว่างบางฟังก์ชั่นของพวกเขา มันเป็นโชคดีว่าแนวคิดทางคณิตศาสตร์ของ "ลอการิทึม" สามารถเชื่อมโยงกับแนวคิดของ "ความยืดหยุ่น" ซึ่งอธิบายความสัมพันธ์ระหว่างการเปลี่ยนแปลงเปอร์เซ็นต์ซึ่งเป็นสิ่งที่เราเข้าใจจากจุดทางเศรษฐกิจของมุมมองและเรามีความหมายสามารถแปลความหมายและการใช้งาน

หากตัวแปรสามารถพูดได้อย่างสมเหตุสมผลว่าจะแสดง "ความสัมพันธ์เชิงเส้นในลอการิทึม" นั่นหมายความว่าระดับของพวกเขา (เช่นตัวแปรที่แท้จริง) มีความสัมพันธ์ที่ไม่ใช่เชิงเส้น:

LNYa+LNxYอีa+x

เหตุใดจึงไม่ประมาณโมเดลที่ไม่ใช่เชิงเส้น
ในหลักการ (คณิตศาสตร์) ไม่มีเหตุผลว่าทำไมไม่ ปัญหาในทางปฏิบัติคือ:

1)มีความสัมพันธ์ที่ไม่ใช่เชิงเส้นหลายรูปแบบมากเกินไปมีเพียงหนึ่งความสัมพันธ์เชิงเส้น (การพูดเชิงโครงสร้าง) เป็นเรื่องของ "ต้นทุนการค้นหา" สำหรับข้อกำหนดที่เหมาะสมที่สุด

2)ความสัมพันธ์ที่ไม่ใช่เชิงเส้นที่ได้รับอาจไม่มีคำอธิบายทางเศรษฐกิจที่ชัดเจน ทำไมนี่เป็นปัญหา เพราะเราไม่ได้เปิดเผย "กฎแห่งธรรมชาติ" ที่นี่ไม่เปลี่ยนแปลงตลอดเวลาและสถานที่ เราใกล้เคียงกับปรากฏการณ์ทางสังคม มีการประมาณซึ่งยิ่งกว่านั้นสามารถนำเสนอเป็นสูตรทางคณิตศาสตร์เท่านั้นโดยไม่มีการใช้เหตุผลทางเศรษฐกิจที่ตรวจสอบและสนับสนุนทำให้ผลที่ได้บางมาก

3) การประมาณค่าแบบไม่เชิงเส้นมีความเสถียรน้อยกว่าเนื่องจากกลไกของขั้นตอนการประมาณค่า


3

ฉันจะบอกว่าแบบจำลองของคุณในกรณีนี้ดูเหมือนจะไม่มีความหมายหาก " เป้าหมายของคุณคือการดูว่าเงินเดือนครูที่ได้รับผลกระทบมากที่สุดในเขตใดก็ได้ในรัฐของฉัน " คุณเพิ่งแสดงให้เห็นว่าความสัมพันธ์ระหว่างค่าแรง (บันทึกของ) กับการคืนภาษีทรัพย์สินคืออะไร อย่างน้อยคุณควรใช้การถดถอยหลายครั้ง

แน่นอนว่าคุณสามารถดำเนินการต่อและพัฒนากลยุทธ์การระบุตัวตนที่มีความสมบูรณ์พร้อมด้วยเครื่องมือวิธีการที่เหมาะสมเพื่อประเมินความเข้มของผลกระทบแต่ละสาเหตุและค้นหาสิ่งที่ยิ่งใหญ่ที่สุด ... ในความเป็นจริงคุณอาจไม่สามารถทำได้ ที่จะทำมันให้ซับซ้อนของงานดังกล่าว มันเป็นความต่อเนื่องของการปรับแต่งและคุณอยู่ใกล้กับโมเดลที่เป็นไปได้ที่โหดร้ายที่สุดที่ใช้อธิบายค่าแรงซึ่งอยู่ไกลจากสิ่งที่ฉันจะพิจารณาถึงการประมาณค่าที่ยอมรับได้ของคำตอบสำหรับคำถามโดยปริยายในเป้าหมายของคุณ คุณควรพยายามขอความช่วยเหลือจากนักเศรษฐศาสตร์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.