ฉันเคยคิดว่า "แบบจำลองเอฟเฟกต์แบบสุ่ม" ในเศรษฐมิติสอดคล้องกับ "โมเดลผสมกับการสกัดกั้นแบบสุ่ม" นอกเศรษฐมิติ แต่ตอนนี้ฉันไม่แน่ใจ ทำมัน?
เศรษฐมิติใช้คำเช่น "เอฟเฟ็กต์คงที่" และ "เอฟเฟ็กต์แบบสุ่ม" ค่อนข้างแตกต่างจากวรรณกรรมในโมเดลผสมและสิ่งนี้ทำให้เกิดความสับสนฉาวโฉ่ ให้เราพิจารณาสถานการณ์ง่าย ๆ ที่เชิงเส้นขึ้นอยู่กับแต่ด้วยการสกัดกั้นที่แตกต่างกันในการวัดกลุ่มต่างๆ:
นี่แต่ละหน่วย / กลุ่มเป็นที่สังเกตที่แตกต่างกัน timepoints ทีนักเศรษฐศาสตร์เรียกมันว่า "ข้อมูลแผง"
ในคำศัพท์แบบผสมเราสามารถถือว่าเป็นเอฟเฟกต์คงที่หรือเป็นเอฟเฟกต์แบบสุ่ม (ในกรณีนี้คือการสกัดกั้นแบบสุ่ม) การดำเนินการตามที่ได้รับการแก้ไขหมายถึงการติดตั้งและเพื่อลดข้อผิดพลาดกำลังสอง (เช่นการเรียกใช้ OLS regression พร้อมกับตัวแปรกลุ่มจำลอง) การปฏิบัติเป็นแบบสุ่มหมายความว่าเรายังสมมติว่าและใช้โอกาสสูงสุดเพื่อให้พอดีกับและแทนการปรับแต่ละด้วยตนเอง นี้นำไปสู่ผล "บางส่วนร่วมกัน" ซึ่งประมาณการได้รับการหดตัวที่มีต่อค่าเฉลี่ยของพวกเขาu_0เบต้าUฉันU ฉัน ~ N ( U 0 , σ 2 U ) U 0 σ 2 U u ที่ฉันUฉันU 0
R formula when treating group as fixed: y ~ x + group R formula when treating group as random: y ~ x + (1|group)
- ในคำศัพท์เศรษฐมิติเราสามารถใช้แบบจำลองทั้งหมดนี้เป็นแบบจำลองลักษณะพิเศษแบบคงที่หรือเป็นแบบจำลองลักษณะพิเศษแบบสุ่ม ตัวเลือกแรกเทียบเท่ากับผลกระทบคงที่ด้านบน (แต่เศรษฐมิติมีวิธีการประมาณในกรณีนี้เรียกว่า) ฉันเคยคิดว่าตัวเลือกที่สองนั้นเทียบเท่ากับเอฟเฟกต์แบบสุ่มด้านบน เช่น @JiebiaoWang ในคำตอบที่ได้รับการโหวตขึ้นอย่างสูงของเขาต่อความแตกต่างระหว่างเอฟเฟกต์แบบสุ่ม - เอฟเฟกต์คงที่ - และโมเดลร่อแร่คืออะไร บอกว่า
"within" estimator
ในเศรษฐมิติตัวแบบสุ่มเอฟเฟกต์อาจอ้างถึงรูปแบบการสกัดกั้นแบบสุ่มเท่านั้นในด้านชีวสถิติ
โอเค - ให้เราทดสอบว่าความเข้าใจนี้ถูกต้องหรือไม่ นี่คือข้อมูลสุ่มที่สร้างโดย @ChristophHanck ในคำตอบของเขาต่อความแตกต่างระหว่างเอฟเฟกต์คงที่เอฟเฟกต์แบบสุ่มและเอฟเฟกต์ผสมคืออะไร (ฉันใส่ข้อมูลที่นี่บน pastebinสำหรับผู้ที่ไม่ได้ใช้ R):
@ Christoph ทำสองวิธีที่เหมาะสมกับการใช้เศรษฐมิติ:
fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")
คนแรกให้ผลการประมาณการของเบต้าเท่ากับ-1.0451
คนที่สอง0.77031
(ใช่บวก!) ฉันพยายามทำซ้ำด้วยlm
และlmer
:
l1 = lm(stackY ~ stackX + as.factor(unit), data = paneldata)
l2 = lmer(stackY ~ stackX + (1|as.factor(unit)), data = paneldata)
คนแรกให้ผลตอบแทน-1.045
ที่สอดคล้องกับผู้ประเมินภายในข้างต้น เย็น. แต่ผลผลิตที่สอง-1.026
ซึ่งอยู่ห่างจากตัวประมาณเอฟเฟกต์แบบสุ่มเป็นไมล์ หึ? เกิดอะไรขึ้น? ในความเป็นจริงสิ่งที่จะ ทำplm
แม้เมื่อเรียกด้วย?model = "random"
ไม่ว่ามันจะทำอะไรเราสามารถเข้าใจมันผ่านมุมมองโมเดลผสมได้หรือไม่?
และสัญชาตญาณที่อยู่เบื้องหลังสิ่งที่มันทำคืออะไร? ฉันอ่านในสถานที่เศรษฐมิติสองแห่งที่ตัวประมาณผลกระทบแบบสุ่มเป็นค่าเฉลี่ยถ่วงน้ำหนักระหว่างตัวประมาณค่าผลกระทบคงที่และ"between" estimator
ความชันถดถอยมากขึ้นหรือน้อยลงหากเราไม่ได้รวมตัวตนของกลุ่มไว้ในแบบจำลองเลย กรณีรอบ4
) เช่น @Andy เขียนที่นี่ :
ตัวประมาณเอฟเฟกต์แบบสุ่มจะใช้ค่าเฉลี่ยถ่วงน้ำหนักเมทริกซ์ของความแปรปรวนภายในและระหว่างข้อมูล [... ] สิ่งนี้ทำให้เอฟเฟกต์แบบสุ่มมีประสิทธิภาพมากขึ้น [.]
ทำไม? ทำไมเราต้องการค่าเฉลี่ยถ่วงน้ำหนักนี้ และโดยเฉพาะอย่างยิ่งทำไมเราถึงต้องการแทนที่จะใช้โมเดลผสม?