คำถามติดแท็ก econometrics

เศรษฐมิติเป็นสาขาสถิติที่เกี่ยวข้องกับการใช้งานด้านเศรษฐศาสตร์

4
วิธีเก็บรักษาตัวแปรที่คงที่ของเวลาในรูปแบบเอฟเฟกต์คงที่
ฉันมีข้อมูลเกี่ยวกับพนักงานของ บริษัท ขนาดใหญ่ของอิตาลีในช่วงสิบปีที่ผ่านมาและฉันต้องการดูว่าช่องว่างทางเพศในรายได้ของเพศชายและเพศหญิงมีการเปลี่ยนแปลงตลอดเวลาอย่างไร เพื่อจุดประสงค์นี้ฉันใช้ pooled OLS: โดยที่คือรายได้จากการบันทึกต่อปีรวม covariates ที่แตกต่างกันไปตามแต่ละบุคคลและเวลาคือ dummies ปีและ{\ rm male} _iเท่ากับหนึ่งถ้าคนงานเป็นผู้ชายและไม่มีศูนย์yit=X′itβ+δmalei+∑t=110γtdt+εityit=Xit′β+δmalei+∑t=110γtdt+εit y_{it} = X'_{it}\beta + \delta {\rm male}_i + \sum^{10}_{t=1}\gamma_t d_t + \varepsilon_{it} yyyXitXitX_{it}dtdtd_tmaleimalei{\rm male}_i ตอนนี้ฉันมีความกังวลว่าเพื่อนร่วมพันธุ์บางคนอาจมีความสัมพันธ์กับเอฟเฟกต์คงที่ที่ไม่ได้สังเกต แต่เมื่อฉันใช้เอฟเฟ็กต์คงที่ (ภายใน) ตัวประมาณหรือความแตกต่างครั้งแรกฉันเสียโมเดลเพศเพราะตัวแปรนี้ไม่เปลี่ยนแปลงตลอดเวลา ฉันไม่ต้องการใช้ตัวประมาณเอฟเฟกต์แบบสุ่มเพราะฉันมักจะได้ยินคนพูดว่ามันทำให้สมมติฐานที่ไม่สมจริงมากและไม่น่าจะถือได้ มีวิธีใดบ้างที่จะรักษาความหลอกทางเพศและควบคุมเอฟเฟกต์คงที่ในเวลาเดียวกันได้หรือไม่? หากมีวิธีฉันต้องจัดกลุ่มหรือดูแลปัญหาอื่น ๆ ด้วยข้อผิดพลาดสำหรับการทดสอบสมมติฐานเกี่ยวกับตัวแปรเพศหรือไม่?

3
ประโยชน์ของทฤษฎีบท Frisch-Waugh
ฉันควรจะสอนทฤษฎีบท Frish Waugh ในสาขาเศรษฐศาสตร์ซึ่งฉันไม่ได้ศึกษา ฉันเข้าใจคณิตศาสตร์ที่อยู่ข้างหลังและฉันก็หวังว่าความคิดนี้เช่นกัน "ค่าสัมประสิทธิ์ที่คุณได้รับสำหรับค่าสัมประสิทธิ์เฉพาะจากแบบจำลองเชิงเส้นหลายเส้นนั้นเท่ากับสัมประสิทธิ์ของตัวแบบการถดถอยอย่างง่ายถ้าคุณ" กำจัด "อิทธิพลของตัวถดถอยอื่น ๆ ดังนั้นแนวคิดทางทฤษฎีจึงเจ๋งมาก (ถ้าฉันเข้าใจผิดโดยสิ้นเชิงฉันยินดีต้อนรับการแก้ไข) แต่มันมีประเพณีดั้งเดิม / การปฏิบัติบางอย่าง? แก้ไข : ฉันยอมรับคำตอบแล้ว แต่ยังยินดีที่จะมีคำตอบใหม่ที่นำตัวอย่าง / แอปพลิเคชันอื่นมาใช้

5
ความแตกต่างระหว่างเศรษฐมิติอนุกรมเวลาและเศรษฐมิติข้อมูลแบบแผงคืออะไร
คำถามนี้อาจไร้เดียงสามาก แต่วิธีที่ฉันสอนเกี่ยวกับเศรษฐมิติฉันสับสนมากหากมีความแตกต่างระหว่างอนุกรมเวลาและวิธีการคำนวณข้อมูล เกี่ยวกับอนุกรมเวลาฉันได้กล่าวถึงหัวข้อต่าง ๆ เช่นความแปรปรวนแบบคงที่, AR, MA และอื่น ๆ เกี่ยวกับข้อมูลพาเนลฉันได้เห็นการอภิปรายในรูปแบบของเอฟเฟกต์คงที่เทียบกับเอฟเฟ็กต์แบบสุ่มเท่านั้น ในความแตกต่าง ฯลฯ หัวข้อเหล่านี้เกี่ยวข้องกันในบางวิธีหรือไม่? เนื่องจากข้อมูลพาเนลยังมีมิติเวลาเหตุใดจึงไม่มีการอภิปราย AR, MA และอื่น ๆ อีกด้วย หากคำตอบคือการศึกษาของฉันเกี่ยวกับวิธีการสอนไม่เพียงพอคุณสามารถชี้ไปที่หนังสือที่ครอบคลุมมากกว่าแค่ FE / RE, ความแตกต่างในความแตกต่างหรือไม่?

2
ความสัมพันธ์เชิงพื้นที่สัมพันธ์กับความนิ่งเชิงพื้นที่
สมมติว่าเรามีจุดในพื้นที่สองมิติและเราต้องการที่จะวัดผลกระทบของคุณลักษณะแอตทริบิวต์Y แบบจำลองการถดถอยเชิงเส้นทั่วไปคือแน่นอน y = X β + ϵXXXyyyy=Xβ+ϵy=Xβ+ϵy= X\beta + \epsilon มีสองปัญหาอยู่ที่นี่: ครั้งแรกก็คือว่าแง่อาจจะมีความสัมพันธ์เชิงพื้นที่ (ละเมิดสมมติฐานข้อผิดพลาดที่เป็นอิสระและเหมือนกัน) และอย่างที่สองก็คือว่าสัมประสิทธิ์การถดถอยอาจแตกต่างกันไปทั่วพื้นที่ ปัญหาแรกสามารถแก้ไขได้ด้วยการรวมคำศัพท์เชิงพื้นที่เชิงล่าช้าเข้ากับโมเดลดังเช่นϵϵ\epsilon y=ρWy+Xβ+ϵy=ρWy+Xβ+ϵy=\rho W y + X\beta + \epsilon เรายังสามารถรวมตัวแปรที่ข้ามการข้ามค่าอัตโนมัติเชิงพื้นที่ (spatial fixed effects) กับโมเดล Durbin เชิงพื้นที่ที่อธิบายไว้ในข้อความโดย LeSage และ Pace y=ρWy+Xβ+WXλ+ϵy=ρWy+Xβ+WXλ+ϵy=\rho W y + X\beta + WX\lambda + \epsilon ρρ\rhoWWW βiβi\beta_iβ^i=(XTWiX)−1XTWiyβ^i=(XTWiX)−1XTWiy\hat{\beta}_i = (X^TW_iX)^{-1}X^T W_i yWWW XXXyyyββ\beta นี่คือความพยายามของฉันที่คำตอบแรก: …

2
อนุกรมเวลาไม่สม่ำเสมอในการวิจัยทางการเงิน / เศรษฐศาสตร์
ในงานวิจัยทางเศรษฐศาสตร์การเงินมันเป็นเรื่องธรรมดามากที่จะตรวจสอบความสัมพันธ์ระหว่างอนุกรมเวลาทางการเงินที่จะใช้รูปแบบของข้อมูลรายวัน ตัวแปรมักจะทำให้โดยการบันทึกความแตกต่างเช่น; LN ( P T ) - LN ( P T - 1 )I(0)I(0)I(0)ln(Pt)−ln(Pt−1)ln⁡(Pt)−ln⁡(Pt−1)\ln(P_t)-\ln(P_{t-1}) อย่างไรก็ตามข้อมูลรายวันหมายความว่ามีจุดข้อมูลในแต่ละสัปดาห์และวันเสาร์และวันอาทิตย์จะหายไป ดูเหมือนจะไม่ได้กล่าวถึงในวรรณคดีประยุกต์ที่ฉันรู้ นี่คือคำถามที่เกี่ยวข้องอย่างใกล้ชิดที่ฉันมีที่มาจากการสังเกตนี้:555 สิ่งนี้มีคุณสมบัติเป็นข้อมูลที่เว้นระยะไม่สม่ำเสมอหรือไม่แม้ว่าตลาดการเงินจะปิดทำการในช่วงสุดสัปดาห์ ถ้าเป็นเช่นนั้นจะมีผลต่อความถูกต้องของผลลัพธ์เชิงประจักษ์ที่ยังไม่ได้รวบรวมไว้ในเอกสารจำนวนมหาศาลที่ไม่สนใจเรื่องนี้อย่างไร

5
ตำราสำหรับเศรษฐมิติแบบเบย์
ฉันกำลังมองหาตำราเรียนที่เข้มงวดทางทฤษฎีเกี่ยวกับเศรษฐมิติแบบเบย์โดยมีความเข้าใจอย่างถ่องแท้เกี่ยวกับเศรษฐมิติเชิงเศรษฐศาสตร์ ฉันอยากจะแนะนำหนึ่งงานต่อหนึ่งคำตอบเพื่อให้ข้อเสนอแนะนั้นสามารถโหวตขึ้นหรือลงทีละรายการได้

2
เวรกรรมใน microeconometrics เทียบกับเวรกรรมของ granger ในเศรษฐมิติอนุกรมเวลา
ฉันเข้าใจถึงสาเหตุที่ใช้ในเศรษฐศาสตร์จุลภาค (โดยเฉพาะอย่างยิ่ง IV หรือการออกแบบความไม่ต่อเนื่องของการถดถอย) และสาเหตุของ Granger ที่ใช้ในเศรษฐมิติอนุกรมเวลา ฉันจะสัมพันธ์กับอีกวิธีหนึ่งได้อย่างไร ตัวอย่างเช่นฉันได้เห็นวิธีการทั้งสองที่ใช้สำหรับข้อมูลพาเนล (พูดว่า , ) การอ้างอิงถึงเอกสารใด ๆ ในเรื่องนี้จะได้รับการชื่นชมT = 20ยังไม่มีข้อความ= 30N=30N=30T= 20T=20T=20

4
อะไรคือความหมายของรูปแบบที่ลดลง?
ในเศรษฐมิติสิ่งที่มีความหมายโดยรูปแบบลดลง? นอกจากนี้สิ่งที่ผู้คนกำลังมองหาเมื่อพวกเขาพูดว่า "ฉันต้องการที่จะเห็นประมาณการแบบฟอร์มที่ลดลง" สิ่งนี้เกิดขึ้นจากการทำงานและคำอธิบายของแต่ละบุคคลและการค้นหาของ Google นั้นเป็นเรื่องทางเทคนิคมากเกินไป หวังว่าใครบางคนที่สามารถยกตัวอย่างง่ายๆ

2
เหตุใดนักวิจัยในสาขาเศรษฐศาสตร์จึงใช้การถดถอยเชิงเส้นสำหรับตัวแปรตอบสนองแบบไบนารี
เมื่อเร็ว ๆ นี้ฉันต้องอ่านบทความทางเศรษฐศาสตร์หลายฉบับ (สาขาที่ฉันไม่คุ้นเคย) สิ่งหนึ่งที่ฉันสังเกตเห็นคือแม้ว่าตัวแปรตอบสนองจะเป็นแบบไบนารี่ แต่โมเดลการถดถอยเชิงเส้นที่ใช้ OLS นั้นเป็นที่แพร่หลาย คำถามของฉันคือ: เหตุใดการถดถอยเชิงเส้นจึงได้รับการสนับสนุนเช่นการถดถอยโลจิสติกส์ในสาขาเศรษฐศาสตร์ นี่เป็นวิธีปฏิบัติทั่วไปหรือเป็นขั้นตอนที่ได้รับการสนับสนุนอย่างแข็งขัน (ในเอกสารโดยอาจารย์และอื่น ๆ )? โปรดทราบว่าฉันไม่ได้ถามว่าทำไมการใช้การถดถอยเชิงเส้นกับการตอบกลับแบบไบนารีอาจเป็นความคิดที่ไม่ดีหรือวิธีการทางเลือกอื่นคืออะไร ในทางตรงกันข้ามฉันถามว่าทำไมผู้คนใช้การถดถอยเชิงเส้นในการตั้งค่านี้เพราะฉันรู้คำตอบของคำถามทั้งสองนี้

1
2SLS นั้นได้รับการจำแนกโดยชอบธรรม
ในเศรษฐมิติที่ไม่เป็นอันตรายส่วนใหญ่: สหายของนักประจักษ์ (Angrist and Pischke, 2009: หน้า 209) ฉันได้อ่านสิ่งต่อไปนี้: ( ... ) ในความเป็นจริง 2SLS เพียงระบุ (พูด, ประมาณการ Wald ง่าย) จะอยู่ที่ประมาณเป็นกลาง นี่เป็นเรื่องยากที่จะแสดงอย่างเป็นทางการเพราะ 2SLS ที่เพิ่งระบุมีช่วงเวลาไม่นาน (เช่นการกระจายตัวตัวอย่างมีหางอ้วน) อย่างไรก็ตามถึงแม้จะมีเครื่องมือที่อ่อนแอ แต่ 2SLS ที่เพิ่งได้รับการระบุก็ยังมีศูนย์กลางอยู่ที่ควร ดังนั้นเราจึงกล่าวว่า 2SLS ที่เพิ่งระบุมีค่ามัธยฐาน ( ... ) แม้ว่าผู้เขียนบอกว่า 2SLS เพียงระบุเป็นค่ามัธยฐาน-เป็นกลางพวกเขาไม่พิสูจน์มันมิได้ให้การอ้างอิงถึงหลักฐาน ที่หน้า 213 พวกเขากล่าวถึงข้อเสนออีกครั้ง แต่ไม่มีการอ้างอิงถึงข้อพิสูจน์ นอกจากนี้ฉันไม่สามารถหาแรงจูงใจสำหรับข้อเสนอในบันทึกการบรรยายของพวกเขาเกี่ยวกับตัวแปรเครื่องมือจาก MIT , หน้า 22 เหตุผลอาจเป็นไปได้ว่าเรื่องที่เป็นเท็จตั้งแต่พวกเขาปฏิเสธมันในข้อความในบล็อกของพวกเขา อย่างไรก็ตาม 2SLS ที่เพิ่งได้รับการระบุนั้นมีค่ามัธยฐานโดยประมาณโดยประมาณพวกเขาเขียน …


5
นักสถิติภาคเอกชนพยายามหาสาเหตุหรือไม่?
นักเศรษฐศาสตร์เชิงวิชาการมักให้ความสนใจในการกำหนดเวรกรรม ดูเหมือนว่างานด้านวิทยาศาสตร์สถิติ / ข้อมูลภาคเอกชนทั้งหมดที่ฉันได้ยินเกี่ยวกับการหาแบบจำลองการทำนาย มีงานใดในภาคเอกชน (หรืองานของรัฐ) ที่เป็นสาเหตุการวิจัย?

2
นิยาม AIC ที่แตกต่าง
จากวิกิพีเดียมีคำนิยามของ Akaike's Information Criterion (AIC) เป็นโดยที่kคือจำนวนพารามิเตอร์และlog Lคือความเป็นไปได้ของโมเดลA Iค= 2 k - 2 บันทึกLAIC=2k−2log⁡L AIC = 2k -2 \log L kkkเข้าสู่ระบบLlog⁡L\log L อย่างไรก็ตามบันทึกเศรษฐเราในมหาวิทยาลัยของรัฐที่นับหน้าถือตาที่ฉันC = บันทึก( σ 2 ) + 2 ⋅ k . นี่ σ 2คือความแปรปรวนโดยประมาณสำหรับข้อผิดพลาดในรูปแบบ ARMA และTคือจำนวนของการสังเกตในชุดข้อมูลชุดเวลาA Iค= บันทึก( σ^2) + 2 ⋅ kTAIC=log⁡(σ^2)+2⋅kT AIC = \log (\hat{\sigma}^2) + \frac{2 …

4
ซีรีส์เครื่องเขียนเทรนด์สามารถใช้กับ ARIMA ได้หรือไม่?
ฉันมีคำถาม / ความสับสนเกี่ยวกับชุดเครื่องเขียนที่จำเป็นสำหรับการสร้างแบบจำลองด้วย ARIMA (X) ฉันคิดถึงสิ่งนี้มากขึ้นในแง่ของการอนุมาน (ผลของการแทรกแซง) แต่อยากรู้ว่าการคาดการณ์และการอนุมานนั้นสร้างความแตกต่างในการตอบสนองหรือไม่ คำถาม: แหล่งข้อมูลเบื้องต้นทั้งหมดที่ฉันได้อ่านระบุว่าซีรีส์ต้องหยุดนิ่งซึ่งทำให้ฉันรู้สึกว่าเหมาะสมและนั่นคือที่ "ฉัน" ใน arima เข้ามา (ต่างกัน) สิ่งที่ทำให้ฉันสับสนคือการใช้แนวโน้มและการล่องลอยใน ARIMA (X) และความหมาย (ถ้ามี) สำหรับข้อกำหนดที่อยู่กับที่ การใช้เทอมคงที่ / ดริฟท์และ / หรือตัวแปรเทรนด์เป็นตัวแปรภายนอก (เช่นการเพิ่ม 't' เป็น regressor) ลบล้างความต้องการของซีรีส์ที่อยู่กับที่หรือไม่? คำตอบนั้นแตกต่างกันไปหรือไม่ขึ้นอยู่กับว่าซีรี่ส์มีรูทยูนิต (เช่น adf test) หรือมีแนวโน้มที่กำหนดขึ้น แต่ไม่มีรูทยูนิตหรือไม่ หรือ ซีรีย์ต้องหยุดนิ่งอยู่เสมอโดยสร้างความแตกต่างและ / หรือทำให้เสียโฉมก่อนใช้ ARIMA (X)

5
จะทำการใส่ค่าในจุดข้อมูลจำนวนมากได้อย่างไร?
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากและมีค่าสุ่มประมาณ 5% หายไป ตัวแปรเหล่านี้มีความสัมพันธ์ซึ่งกันและกัน ตัวอย่างชุดข้อมูล R ต่อไปนี้เป็นเพียงตัวอย่างของเล่นที่มีข้อมูลที่สัมพันธ์กันจำลอง set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.