คำถามติดแท็ก econometrics

เศรษฐมิติเป็นสาขาสถิติที่เกี่ยวข้องกับการใช้งานด้านเศรษฐศาสตร์

9
อะไรคือความแตกต่างทางปรัชญาที่สำคัญวิธีการและคำศัพท์ระหว่างสาขาเศรษฐศาสตร์และสาขาสถิติอื่น ๆ
เศรษฐมิติซ้อนทับกันอย่างมากกับสถิติแบบดั้งเดิม แต่มักใช้ศัพท์แสงของตนเองเกี่ยวกับหัวข้อที่หลากหลาย ("การระบุ" "ภายนอก" ฯลฯ ) ฉันเคยได้ยินอาจารย์สถิติที่นำไปใช้ในการแสดงความคิดเห็นในฟิลด์อื่นว่าบ่อยครั้งคำศัพท์ที่แตกต่างกัน แต่แนวคิดเหมือนกัน แต่มันก็มีวิธีการของตัวเองและความแตกต่างทางปรัชญา (เรียงความที่โด่งดังของ Heckman อยู่ในใจ) คำศัพท์ใดที่มีความแตกต่างระหว่างเศรษฐมิติและสถิติกระแสหลักและสาขาต่าง ๆ แตกต่างกันมากไปกว่าคำศัพท์เพียงใด?

8
ภาษา R น่าเชื่อถือสำหรับสาขาเศรษฐศาสตร์หรือไม่?
ฉันเป็นนักศึกษาระดับบัณฑิตศึกษาในสาขาเศรษฐศาสตร์ซึ่งเพิ่งเปลี่ยนมาใช้ R จากแพ็คเกจทางสถิติที่รู้จักกันดีอื่น ๆ (ฉันใช้ SPSS เป็นหลัก) ปัญหาเล็ก ๆ ของฉันในตอนนี้คือฉันเป็นผู้ใช้ R คนเดียวในชั้นเรียนของฉัน เพื่อนร่วมชั้นของฉันใช้ Stata และ Gauss และอาจารย์คนหนึ่งของฉันบอกว่า R เหมาะสำหรับงานวิศวกรรม แต่ไม่ใช่เพื่อเศรษฐศาสตร์ เขากล่าวว่าแพ็คเกจจำนวนมากถูกสร้างขึ้นโดยผู้ที่มีความรู้เกี่ยวกับการเขียนโปรแกรมมาก แต่ไม่มากนักเกี่ยวกับเศรษฐศาสตร์และดังนั้นจึงไม่น่าเชื่อถือ นอกจากนี้เขายังกล่าวถึงความจริงที่ว่าเนื่องจากไม่มีเงินเกี่ยวข้องกับการสร้างแพ็คเกจ R ดังนั้นจึงไม่มีแรงจูงใจที่จะทำอย่างถูกต้อง (ต่างจาก Stata เช่น) และเขาใช้ R เป็นเวลาและได้ผลลัพธ์ที่ "ไร้สาระ" ใน เขาพยายามประเมินบางสิ่ง ยิ่งไปกว่านั้นเขาบ่นว่าเขาสร้างตัวเลขสุ่มใน R ซึ่งเขาบอกว่า " ฉันใช้ R มานานกว่าหนึ่งเดือนและต้องบอกว่าฉันตกหลุมรักมันแล้ว ทุกสิ่งที่ฉันได้ยินจากอาจารย์ของฉันมันทำให้ฉันท้อใจ ดังนั้นคำถามของฉันคือ: "R เชื่อถือได้สำหรับสาขาเศรษฐศาสตร์หรือไม่"

5
“ แบบจำลองลักษณะพิเศษแบบสุ่ม” ในแบบเศรษฐมิติสัมพันธ์อย่างไรกับแบบจำลองแบบผสมนอกเศรษฐมิติ
ฉันเคยคิดว่า "แบบจำลองเอฟเฟกต์แบบสุ่ม" ในเศรษฐมิติสอดคล้องกับ "โมเดลผสมกับการสกัดกั้นแบบสุ่ม" นอกเศรษฐมิติ แต่ตอนนี้ฉันไม่แน่ใจ ทำมัน? เศรษฐมิติใช้คำเช่น "เอฟเฟ็กต์คงที่" และ "เอฟเฟ็กต์แบบสุ่ม" ค่อนข้างแตกต่างจากวรรณกรรมในโมเดลผสมและสิ่งนี้ทำให้เกิดความสับสนฉาวโฉ่ ให้เราพิจารณาสถานการณ์ง่าย ๆ ที่เชิงเส้นขึ้นอยู่กับแต่ด้วยการสกัดกั้นที่แตกต่างกันในการวัดกลุ่มต่างๆ:yYyxxx yit=βxit+ui+ϵit.Yผมเสื้อ=βxผมเสื้อ+ยูผม+εผมเสื้อ.y_{it} = \beta x_{it} + u_i + \epsilon_{it}. นี่แต่ละหน่วย / กลุ่มเป็นที่สังเกตที่แตกต่างกัน timepoints ทีนักเศรษฐศาสตร์เรียกมันว่า "ข้อมูลแผง"iผมitเสื้อt ในคำศัพท์แบบผสมเราสามารถถือว่าเป็นเอฟเฟกต์คงที่หรือเป็นเอฟเฟกต์แบบสุ่ม (ในกรณีนี้คือการสกัดกั้นแบบสุ่ม) การดำเนินการตามที่ได้รับการแก้ไขหมายถึงการติดตั้งและเพื่อลดข้อผิดพลาดกำลังสอง (เช่นการเรียกใช้ OLS regression พร้อมกับตัวแปรกลุ่มจำลอง) การปฏิบัติเป็นแบบสุ่มหมายความว่าเรายังสมมติว่าและใช้โอกาสสูงสุดเพื่อให้พอดีกับและแทนการปรับแต่ละด้วยตนเอง นี้นำไปสู่ผล "บางส่วนร่วมกัน" ซึ่งประมาณการได้รับการหดตัวที่มีต่อค่าเฉลี่ยของพวกเขาu_0เบต้าuiยูผมu_iUฉันU ฉัน ~ N ( U 0 , σ 2 U …

3
การแปลความหมายของตัวทำนายการแปลงสภาพบันทึกและ / หรือการตอบสนอง
ฉันสงสัยว่ามันจะสร้างความแตกต่างในการตีความไม่ว่าจะเป็นเพียงขึ้นอยู่กับทั้งขึ้นอยู่กับและเป็นอิสระหรือตัวแปรอิสระเท่านั้นที่ถูกเปลี่ยนเข้าสู่ระบบ พิจารณากรณีของ log(DV) = Intercept + B1*IV + Error ฉันสามารถตีความ IV เป็นเปอร์เซ็นต์เพิ่มขึ้น แต่จะเปลี่ยนแปลงได้อย่างไรเมื่อฉันมี log(DV) = Intercept + B1*log(IV) + Error หรือเมื่อฉันมี DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

4
ความแตกต่างในความแตกต่างคืออะไร?
ความแตกต่างในความแตกต่างได้รับความนิยมในฐานะเครื่องมือที่ไม่ได้ทดลองโดยเฉพาะอย่างยิ่งในด้านเศรษฐศาสตร์ ใครช่วยกรุณาให้คำตอบที่ชัดเจนและไม่ใช่เทคนิคคำถามต่อไปนี้เกี่ยวกับความแตกต่างในความแตกต่าง ตัวประมาณความแตกต่างคืออะไร เหตุใดเครื่องมือประมาณการความแตกต่างในการใช้งานจึงเป็นสิ่งใด เราสามารถเชื่อถือการประมาณการที่แตกต่างกันได้หรือไม่?

5
การเรียนรู้ของเครื่องมีประโยชน์น้อยกว่าสำหรับการทำความเข้าใจถึงเวรกรรมซึ่งน่าสนใจน้อยกว่าสำหรับสังคมศาสตร์หรือไม่?
ความเข้าใจของฉันเกี่ยวกับความแตกต่างระหว่างการเรียนรู้ด้วยเครื่อง / เทคนิคการทำนายเชิงสถิติอื่น ๆ กับชนิดของสถิติที่นักวิทยาศาสตร์สังคม (เช่นนักเศรษฐศาสตร์) ใช้คือนักเศรษฐศาสตร์ดูเหมือนจะสนใจอย่างมากในการทำความเข้าใจผลของตัวแปรเดี่ยวหรือตัวแปรหลายตัว ขนาดและการตรวจสอบว่าความสัมพันธ์เป็นสาเหตุ สำหรับเรื่องนี้คุณจะต้องเกี่ยวข้องกับตัวเองด้วยวิธีการทดลองและกึ่งทดลอง ฯลฯ การเรียนรู้ด้วยเครื่องหรือการสร้างแบบจำลองทางสถิติที่สามารถคาดการณ์ได้มักจะมองข้ามแง่มุมนี้และในหลายกรณีไม่ได้ให้ระดับที่เฉพาะเจาะจงซึ่งตัวแปรหนึ่งมีผลต่อผลลัพธ์ (logit และ probit ดูเหมือนจะทำทั้งสองอย่าง) คำถามที่เกี่ยวข้องคือตัวแบบทางเศรษฐศาสตร์หรือแบบจำลองพฤติกรรมที่ได้รับแรงบันดาลใจทางทฤษฎีในระดับใดมีข้อได้เปรียบมากกว่าตัวแบบแบบไม่เชื่อเรื่องพระเจ้าเมื่อคาดการณ์โดเมนใหม่? การเรียนรู้ด้วยเครื่องหรือนักสถิติเชิงพยากรณ์จะพูดอย่างไรกับการวิพากษ์วิจารณ์ว่าหากไม่มีแบบจำลองทางเศรษฐกิจคุณจะไม่สามารถคาดการณ์ตัวอย่างใหม่ได้อย่างถูกต้องที่ผู้แปรสภาพมีความแตกต่างกันมาก ฉันมีความสุขจริงๆที่ได้ยินว่าผู้คนรับสิ่งนี้จากทุกมุมมอง

4
ตัวแปรเครื่องมือคืออะไร?
ตัวแปรเครื่องมือกำลังกลายเป็นเรื่องธรรมดามากขึ้นในเศรษฐศาสตร์ประยุกต์และสถิติ สำหรับผู้เริ่มต้นเราสามารถมีคำตอบที่ไม่ใช่ด้านเทคนิคสำหรับคำถามต่อไปนี้: ตัวแปรเครื่องมือคืออะไร? เมื่อไหร่ที่จะต้องการใช้ตัวแปรเครื่องมือ? เราจะค้นหาหรือเลือกตัวแปรเครื่องมือได้อย่างไร

7
อะไรคือเหตุผลที่เราใช้ลอการิทึมธรรมชาติ (ln) แทนที่จะล็อกฐาน 10 ในการระบุฟังก์ชันในเศรษฐมิติ
อะไรคือเหตุผลที่เราใช้ลอการิทึมธรรมชาติ (ln) แทนที่จะล็อกฐาน 10 ในการระบุฟังก์ชันในเศรษฐมิติ

4
ผลรวมของกระบวนการเสียงสีขาวสองกระบวนการจำเป็นต้องเป็นสัญญาณรบกวนสีขาวหรือไม่
ให้และเป็นกระบวนการประมวลเสียงสีขาว เราสามารถพูดได้หรือไม่ว่านั้นเป็นกระบวนการที่มีเสียงรบกวนสีขาว?b t c t = a t + b tatata_tbtbtb_tct=at+btct=at+bเสื้อc_t=a_t+b_t

1
การคำนวณซ้ำของเอฟเฟกต์จากโมเดล lmer
ฉันเพิ่งอ่านบทความนี้ซึ่งอธิบายถึงวิธีการคำนวณความสามารถในการทำซ้ำ (ความน่าเชื่อถือหรือความสัมพันธ์ภายในอินทราเน็ต) ของการวัดผ่านการสร้างแบบจำลองเอฟเฟกต์ผสม รหัส R จะเป็น: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

1
องศาอิสระเป็นหมายเลขที่ไม่ใช่จำนวนเต็มหรือไม่
เมื่อฉันใช้ GAM มันให้ DF ที่เหลือกับฉันคือ (บรรทัดสุดท้ายในรหัส) นั่นหมายความว่าอย่างไร? นอกเหนือไปจากตัวอย่างของ GAM โดยทั่วไปแล้วจำนวนองศาความเป็นอิสระจะเป็นจำนวนที่ไม่ใช่จำนวนเต็มหรือไม่26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

13
ตำราเศรษฐมิติ?
คุณอยากจะแนะนำตำราเศรษฐศาสตร์แบบไหนที่ดี? แก้ไข: มีหนังสือไม่กี่เล่มที่นั่นพร้อมด้วยระดับความซับซ้อนทางคณิตศาสตร์ที่แตกต่างกัน มันเป็นการดีที่จะได้แนวคิดว่าหนังสือที่คุณแนะนำทางเทคนิคนั้นเป็นอย่างไร

6
ทำไมเราถึงเลือกที่จะลดผลรวมของข้อผิดพลาดแบบสี่เหลี่ยม (SSE) ให้น้อยที่สุดเมื่อทำการประกอบโมเดล?
คำถามนั้นง่ายมาก: ทำไมเมื่อเราพยายามปรับตัวแบบให้เข้ากับข้อมูลเชิงเส้นหรือไม่เชิงเส้นเรามักจะพยายามลดผลรวมของกำลังสองของข้อผิดพลาดเพื่อให้ได้ตัวประมาณแบบพารามิเตอร์? ทำไมไม่เลือกฟังก์ชั่นวัตถุประสงค์อื่นเพื่อลดขนาด ฉันเข้าใจว่าด้วยเหตุผลทางเทคนิคฟังก์ชั่นสมการกำลังสองนั้นดีกว่าฟังก์ชั่นอื่น ๆ เช่นผลรวมของส่วนเบี่ยงเบนสัมบูรณ์ แต่นี่ยังไม่เป็นคำตอบที่น่าเชื่อมาก นอกจากเหตุผลทางเทคนิคแล้วทำไมผู้คนถึงชอบฟังก์ชั่น 'Euclidean' ระยะทางนี้ มีความหมายเฉพาะหรือการตีความสำหรับสิ่งนั้นหรือไม่? ตรรกะที่อยู่เบื้องหลังความคิดของฉันคือ: เมื่อคุณมีชุดข้อมูลคุณต้องตั้งค่าแบบจำลองของคุณเป็นอันดับแรกโดยสร้างชุดของสมมติฐานการทำงานหรือการแจกแจง ในแบบจำลองของคุณมีพารามิเตอร์บางตัว (สมมติว่าเป็นแบบจำลองพารามิเตอร์) จากนั้นคุณต้องหาวิธีประมาณค่าพารามิเตอร์เหล่านี้อย่างสม่ำเสมอและหวังว่าตัวประมาณของคุณจะมีความแปรปรวนต่ำและคุณสมบัติที่ดีอื่น ๆ ไม่ว่าคุณจะลด SSE หรือ LAD หรือฟังก์ชั่นวัตถุประสงค์อื่น ๆ ฉันคิดว่ามันเป็นเพียงวิธีการที่แตกต่างกันในการรับตัวประมาณค่า ตามตรรกะนี้ฉันคิดว่าคนใช้กำลังสองน้อยที่สุดต้องเป็น 1) มันสร้างตัวประมาณที่สอดคล้องกันของตัวแบบ 2) อย่างอื่นที่ฉันไม่รู้ ในเศรษฐมิติเรารู้ว่าในตัวแบบการถดถอยเชิงเส้นถ้าคุณคิดว่าข้อผิดพลาดมี 0 หมายถึงการปรับสภาพของตัวทำนายและความเหมือนกันและข้อผิดพลาดจะไม่เกี่ยวข้องกันจากนั้นการลดผลรวมของความคลาดเคลื่อนกำลังสอง พารามิเตอร์และตามทฤษฎีบทเกาส์ - มาร์คอฟตัวประมาณนี้คือสีน้ำเงิน ดังนั้นสิ่งนี้จะแนะนำว่าถ้าคุณเลือกที่จะลดฟังก์ชั่นวัตถุประสงค์อื่น ๆ ที่ไม่ใช่ SSE ดังนั้นจึงไม่มีการรับประกันว่าคุณจะได้รับการประมาณค่าพารามิเตอร์โมเดล ความเข้าใจของฉันถูกต้องหรือไม่ ถ้ามันถูกต้องการลด SSE ให้น้อยกว่าฟังก์ชั่นวัตถุประสงค์อื่น ๆ สามารถพิสูจน์ได้ด้วยความมั่นคงซึ่งเป็นที่ยอมรับในความเป็นจริงดีกว่าการพูดว่าฟังก์ชั่นสมการกำลังสองนั้นดีกว่า ในบทสนทนาฉันเห็นหลายกรณีที่ผู้คนลดจำนวนผลรวมของความผิดพลาดแบบสแควร์โดยตรงโดยไม่ได้ระบุรูปแบบที่สมบูรณ์ก่อนเช่นการตั้งสมมติฐานแบบกระจาย จากนั้นสิ่งนี้ดูเหมือนว่าผู้ใช้วิธีการนี้ต้องการดูว่าข้อมูลใกล้เคียงกับ 'รุ่น' มากแค่ไหน …

2
PCA และ asymptotic PCA ต่างกันอย่างไร
ในบทความสองฉบับในปี 1986และ1988คอนเนอร์และ Korajczyk เสนอวิธีการสร้างแบบจำลองผลตอบแทนของสินทรัพย์ เนื่องจากอนุกรมเวลาเหล่านี้มักจะมีสินทรัพย์มากกว่าการสังเกตระยะเวลาพวกเขาเสนอให้ดำเนินการ PCA เกี่ยวกับความแปรปรวนร่วมแบบตัดขวางของผลตอบแทนสินทรัพย์ พวกเขาเรียกวิธีนี้ว่า Asymptotic Principal Component Analysis (APCA ซึ่งค่อนข้างสับสนเนื่องจากผู้ชมคิดทันทีถึงคุณสมบัติของ asymptotic ของ PCA) ฉันได้ผลสมการมาแล้วและวิธีการทั้งสองนั้นดูเหมือนจะเป็นตัวเลข asymptotics ของหลักสูตรที่แตกต่างกันตั้งแต่บรรจบพิสูจน์สำหรับมากกว่าT →การ ∞ คำถามของฉันคือ: มีใครใช้ APCA และเปรียบเทียบกับ PCA หรือไม่ มีความแตกต่างที่เป็นรูปธรรมหรือไม่ ถ้าเป็นเช่นนั้นN→∞N→∞N \rightarrow \inftyT→∞T→∞T \rightarrow \infty
23 pca  econometrics 

5
การถดถอยเชิงปริมาณเมื่อใดที่แย่กว่า OLS
นอกเหนือจากสถานการณ์เฉพาะบางอย่างที่เราต้องเข้าใจความสัมพันธ์ที่มีเงื่อนไขอย่างมีเงื่อนไขแล้วสถานการณ์ใดที่นักวิจัยควรเลือก OLS เหนือ Quantile Regression ฉันไม่ต้องการคำตอบว่า "ถ้าไม่มีประโยชน์ในการทำความเข้าใจความสัมพันธ์ท้าย" เพราะเราสามารถใช้การถดถอยแบบมัธยฐานแทน OLS

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.