คำถามติดแท็ก econometrics

เศรษฐมิติเป็นสาขาสถิติที่เกี่ยวข้องกับการใช้งานด้านเศรษฐศาสตร์

1
จัดทำเป็นเอกสาร / ตัวอย่างที่จำลองได้ของการประยุกต์ใช้วิธีเศรษฐมิติที่ประสบความสำเร็จในโลกแห่งความจริง?
คำถามนี้อาจฟังดูกว้างมาก แต่นี่คือสิ่งที่ฉันกำลังมองหา ฉันรู้ว่ามีหนังสือที่ยอดเยี่ยมมากมายเกี่ยวกับวิธีเศรษฐมิติและบทความเกี่ยวกับเทคนิคเศรษฐมิติที่ยอดเยี่ยมมากมาย นอกจากนี้ที่ดีเยี่ยมแม้ทำซ้ำตัวอย่างของเศรษฐที่อธิบายไว้ใน CrossValidated นี้คำถาม อันที่จริงตัวอย่างในคำถามนี้มาใกล้กับสิ่งที่ฉันกำลังมองหา สิ่งเดียวที่ขาดหายไปในตัวอย่างเหล่านั้นคือการที่พวกเขาเป็นเพียงการวิจัยรายงานโดยไม่ต้องเอ่ยถึงว่าผลของการศึกษาที่มีอาการในใด ๆการประยุกต์ใช้จริงในโลก สิ่งที่ฉันกำลังมองหาคือเอกสาร / ตัวอย่างที่สามารถจำลองได้ของการประยุกต์ใช้ทฤษฎีทางเศรษฐมิติในโลกแห่งความเป็นจริงซึ่งมีลักษณะดังต่อไปนี้: พวกเขาควรจะทำซ้ำเช่นมีคำอธิบายรายละเอียดของ (และตัวชี้ไปยัง) ข้อมูลเทคนิคทางเศรษฐมิติและรหัส นึกคิดรหัสจะเป็นภาษา R ควรมีเอกสารรายละเอียดแสดงให้เห็นว่าเทคนิคที่ประสบความสำเร็จในโลกแห่งความเป็นจริงตามการวัดที่ดีของความสำเร็จ (เช่น "เทคนิคที่ช่วยเพิ่มรายได้เพราะมันเปิดใช้การคาดการณ์ความต้องการที่ดีขึ้นและนี่คือตัวเลขที่เกี่ยวข้อง") ฉันใช้ระยะทางเศรษฐมิติค่อนข้างกว้างที่นี่ - ผมหมายถึงใด ๆ เรียงลำดับของการทำเหมืองข้อมูล , สถิติวิเคราะห์ข้อมูล , predictiion , การคาดการณ์หรือเครื่องเรียนรู้เทคนิค ปัญหาหนึ่งในการค้นหาตัวอย่างเช่น: การประยุกต์ใช้เศรษฐมิติที่ประสบความสำเร็จในการตั้งค่าเพื่อผลกำไรและเป็นกรรมสิทธิ์ดังนั้นหากเทคนิคทำงานได้ดีมันอาจจะไม่ถูกเผยแพร่ (นี่เป็นเรื่องจริงโดยเฉพาะอย่างยิ่งในกรณีของการซื้อขายแบบกรรมสิทธิ์ กลยุทธ์) แต่ฉันหวังว่าจะมีตัวอย่างที่เผยแพร่ซึ่งมีคุณสมบัติอย่างน้อย (2) ข้างต้นหากไม่ใช่ทั้ง (1) และ (2)


4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
ข้อผิดพลาดที่กระจายตามปกติและทฤษฎีขีด จำกัด กลาง
ในเศรษฐศาสตรเบื้องต้นของ Wooldridge มีข้อความอ้างอิง: ข้อโต้แย้งที่แสดงให้เห็นถึงการแจกแจงปกติสำหรับข้อผิดพลาดมักจะทำสิ่งนี้: เพราะเป็นผลรวมของปัจจัยที่ไม่ได้สังเกตเห็นหลายอย่างที่มีผลต่อเราจึงสามารถเรียกทฤษฎีบทขีด จำกัด กลางเพื่อสรุปว่ามีการแจกแจงแบบปกติโดยประมาณuuuyyyuuu คำพูดนี้เกี่ยวข้องกับหนึ่งในสมมติฐานโมเดลเชิงเส้นคือ: u∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2) โดยที่uuuคือคำผิดพลาดในตัวแบบประชากร ทีนี้เท่าที่ฉันรู้ทฤษฎีขีด จำกัด กลางระบุว่าการกระจายตัวของ Zi=(Yi¯¯¯¯¯−μ)/(σ/√n)Zi=(Yi¯−μ)/(σ/√n)Z_i=(\overline{Y_i}-μ)/(σ/√n) (โดยที่Yi¯¯¯¯¯Yi¯\overline{Y_i} เป็นค่าเฉลี่ยของกลุ่มตัวอย่างสุ่มจากประชากรใด ๆ ที่มีค่าเฉลี่ยμμμและความแปรปรวนσ2σ2σ^2 ) วิธีการที่ของตัวแปรปกติมาตรฐานn→∞n→∞n \rightarrow \infty\ คำถาม: ช่วยฉันเข้าใจว่ามาตรฐานความเป็นซีมโทติคของZiZiZ_iหมายถึงu∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2)

2
ทำไมยอดรวมยกกำลังสองที่ไม่เพิ่มเมื่อเพิ่มตัวแปรอธิบาย?
ในหนังสือเรียนเศรษฐมิติของฉัน (เศรษฐมิติเบื้องต้น) ครอบคลุม OLS ผู้เขียนเขียนว่า "SSR จะต้องล้มลงเมื่อมีการเพิ่มตัวแปรอธิบายอื่น" ทำไมล่ะ

1
ทำไมรูปแบบการทำงานของระยะที่ 1 ใน 2SLS จึงไม่สำคัญ
ในการนำเสนอวันนี้ผู้พูดได้อ้างสิทธิ์ข้างต้น เขากล่าวว่าแม้ว่าขั้นตอนแรกจะระบุผิด แต่การประมาณค่าสัมประสิทธิ์ของระยะที่สองจะยังคงใช้ได้ ในฐานะนักศึกษาปริญญาโทที่ต่ำต้อยฉันไม่สามารถขอคำอธิบายได้ดังนั้นตอนนี้ฉันขอความช่วยเหลือจากคุณ!

1
การตั้งค่าข้อมูลสำหรับความแตกต่าง
การตั้งค่าใดถูกต้องสำหรับความแตกต่างของรูปแบบการถดถอยที่ใช้ Yฉันs T= α +γs* T+ λdเสื้อ+ δ* ( T* * * *dเสื้อ) +εฉันs TYผมsเสื้อ=α+γs* * * *T+λdเสื้อ+δ* * * *(T* * * *dเสื้อ)+εผมsเสื้อY_{ist} = \alpha +\gamma_s*T + \lambda d_t + \delta*(T*d_t)+ \epsilon_{ist} โดยที่ T คือดัมมี่ที่มีค่าเท่ากับ 1 ถ้าการสังเกตมาจากกลุ่มการรักษาและ d คือดัมมีที่เท่ากับ 1 ในช่วงเวลาหลังจากการรักษาเกิดขึ้น 1) สุ่มตัวอย่างจากแต่ละกลุ่มและเวลา (เช่น 4 ตัวอย่างสุ่ม) หรือ 2) ข้อมูลพาเนลที่มีการติดตามหน่วยเดียวกันตลอดช่วงเวลาทั้งสองหรือไม่ …

6
วิธีประมาณฟังก์ชั่นการตอบกลับอัตโนมัติของเวกเตอร์ & การตอบสนองต่อแรงกระตุ้นด้วยข้อมูลพาเนล
ฉันกำลังทำงานกับการประมาณเวกเตอร์การถดถอยอัตโนมัติ (VARs) และการประมาณค่าฟังก์ชันตอบสนองต่อแรงกระตุ้น (IRF) ตามข้อมูลพาเนลกับบุคคล 33 คนใน 77 ไตรมาส สถานการณ์ประเภทนี้ควรวิเคราะห์อย่างไร มีอัลกอริทึมอะไรอยู่สำหรับจุดประสงค์นี้ ฉันต้องการดำเนินการวิเคราะห์เหล่านี้ใน R ดังนั้นหากใครคุ้นเคยกับรหัส R หรือแพ็คเกจที่ออกแบบมาเพื่อจุดประสงค์นี้ที่พวกเขาสามารถแนะนำได้นั่นจะเป็นประโยชน์อย่างยิ่ง

1
แนวคิดที่ไม่ซ้ำ (?) สำหรับการคาดการณ์ยอดขาย
ฉันกำลังพัฒนาโมเดลเพื่อทำนายยอดขายรวมของผลิตภัณฑ์ ฉันมีข้อมูลการจองประมาณปีครึ่งดังนั้นฉันสามารถทำการวิเคราะห์อนุกรมเวลาได้ อย่างไรก็ตามฉันยังมีข้อมูลจำนวนมากเกี่ยวกับ 'โอกาส' (การขายที่เป็นไปได้) ที่ปิดหรือสูญหาย 'โอกาส' จะถูกดำเนินการไปตามขั้นตอนต่างๆของไปป์ไลน์จนกว่าจะปิดหรือสูญหาย พวกเขายังมีข้อมูลที่เกี่ยวข้องเกี่ยวกับผู้ซื้อที่คาดหวังพนักงานขายประวัติปฏิสัมพันธ์อุตสาหกรรมขนาดการจองโดยประมาณเป็นต้น เป้าหมายของฉันคือการทำนายการจองทั้งหมดในที่สุด แต่ฉันต้องการข้อมูลทั้งหมดเกี่ยวกับ 'โอกาส' ปัจจุบันซึ่งเป็น 'สาเหตุที่แท้จริง' ของการจอง หนึ่งความคิดที่ฉันมีคือการใช้สองรุ่นที่แตกต่างกันดังนี้: ใช้ 'โอกาส' ทางประวัติศาสตร์เพื่อสร้างแบบจำลองที่ทำนายการจองที่เกิดขึ้นจาก 'โอกาส' ของแต่ละบุคคล (ฉันอาจใช้ฟอเรสต์แบบสุ่มหรือแม้แต่การถดถอยเชิงเส้นแบบเก่าธรรมดาสำหรับขั้นตอนนี้) ใช้แบบจำลองจาก 1 เพื่อทำนายการจอง 'โอกาส' โดยประมาณทั้งหมดในขณะนี้จากนั้นรวมการประมาณการเหล่านั้นตามเดือน 'โอกาส' ที่ถูกสร้างขึ้น ใช้โมเดลอนุกรมเวลา (อาจเป็น ARIMA) โดยใช้ข้อมูลอนุกรมเวลาย้อนหลังรายเดือน 1.5 ปีและทำนาย (โดยใช้โมเดลจาก 1) การจองทั้งหมดสำหรับ 'โอกาส' ทั้งหมดที่สร้างขึ้นในเดือนนั้น ได้รับจะมีความล่าช้าในโอกาสเหล่านั้นที่เปลี่ยนไปเป็นการจองจริง แต่โมเดลอนุกรมเวลาควรสามารถจัดการกับความล่าช้าได้ เสียงนี้เป็นอย่างไร ฉันได้อ่านหนังสือตามเวลาและทำนายยอดขายเป็นจำนวนมากและจากสิ่งที่ฉันสามารถบอกได้ว่านี่เป็นวิธีที่ไม่เหมือนใคร ดังนั้นฉันขอขอบคุณข้อเสนอแนะใด ๆ จริงๆ!

1
การใช้เครื่องมือการประมวลผลข้อความ / ภาษาธรรมชาติสำหรับเศรษฐมิติ
ฉันไม่แน่ใจว่าคำถามนี้เหมาะสมอย่างยิ่งหรือไม่โปรดลบ ฉันเป็นนักเรียนที่จบการศึกษาด้านเศรษฐศาสตร์ สำหรับโครงการที่ตรวจสอบปัญหาในการประกันสังคมฉันสามารถเข้าถึงรายงานกรณีการบริหาร (> 200k) จำนวนมากซึ่งจัดการกับการประเมินสิทธิ์ รายงานเหล่านี้อาจเชื่อมโยงกับข้อมูลการดูแลส่วนบุคคล ฉันต้องการดึงข้อมูลจากรายงานเหล่านี้ที่สามารถนำมาใช้ในการวิเคราะห์เชิงปริมาณและการค้นหาคำหลัก / regex ง่าย ๆ โดยใช้grep/ awketc การประมวลผลภาษาธรรมชาติมีประโยชน์อย่างไรสำหรับสิ่งนี้ อะไรคือวิธีการขุดข้อความที่มีประโยชน์อื่น ๆ จากสิ่งที่ฉันเข้าใจว่านี่เป็นเขตข้อมูลขนาดใหญ่และส่วนใหญ่มีรายงานบางส่วนที่จะต้องถูกเปลี่ยนเป็นใช้เป็นคลังข้อมูล มันคุ้มค่าที่จะลงทุนสักระยะเพื่อทำความคุ้นเคยกับวรรณกรรมและวิธีการหรือไม่? มันจะมีประโยชน์และมีสิ่งที่คล้ายกันเคยทำมาก่อนหรือไม่ มันคุ้มค่าหรือไม่ในแง่ของรางวัลเช่นฉันสามารถดึงข้อมูลที่เป็นประโยชน์โดยใช้ NLP สำหรับการศึกษาเชิงประจักษ์ทางเศรษฐศาสตร์ได้หรือไม่? อาจมีการระดมทุนเพื่อจ้างคนอ่านและเตรียมรายงานบางส่วน นี่เป็นโครงการขนาดใหญ่และมีความเป็นไปได้ที่จะใช้เงินทุนเพิ่มเติม ฉันสามารถให้รายละเอียดเพิ่มเติมเกี่ยวกับหัวข้อหากจำเป็นอย่างเคร่งครัด ความซับซ้อนที่อาจเกิดขึ้นคือภาษาเยอรมันไม่ใช่ภาษาอังกฤษ เกี่ยวกับคุณวุฒิส่วนใหญ่ฉันได้รับการฝึกฝนด้านเศรษฐมิติและมีความรู้เกี่ยวกับสถิติการคำนวณในระดับHastie et al หนังสือ ฉันรู้จัก Python, R, Stata และอาจคุ้นเคยกับ Matlab อย่างรวดเร็ว ให้ห้องสมุดฉันคิดว่าหลามเป็นเครื่องมือของการเลือกนี้ ไม่มีการฝึกอบรมในวิธีการเชิงคุณภาพถ้ามันเกี่ยวข้อง แต่ฉันรู้ว่ามีบางคนที่ฉันสามารถติดต่อได้ ฉันดีใจที่ได้รับข้อมูลใด ๆ เกี่ยวกับเรื่องนี้เช่นถ้านี่อาจเป็นประโยชน์ถ้าเป็นเช่นนั้นสถานที่ที่จะเริ่มอ่านและเครื่องมือใดที่ควรให้ความสำคัญเป็นพิเศษ

3
การมอบหมายแบบสุ่ม: ทำไมต้องกังวล
การมอบหมายแบบสุ่มมีค่าเพราะช่วยให้มั่นใจได้ถึงความเป็นอิสระในการรักษาจากผลลัพธ์ที่อาจเกิดขึ้น นั่นคือวิธีที่จะนำไปสู่การประมาณการแบบไม่เอนเอียงของผลการรักษาโดยเฉลี่ย แต่รูปแบบการมอบหมายอื่น ๆ สามารถมั่นใจได้อย่างเป็นระบบในการรักษาจากผลลัพธ์ที่เป็นไปได้อย่างเป็นระบบ แล้วทำไมเราต้องสุ่มมอบหมาย? กล่าวอีกนัยหนึ่งอะไรคือข้อดีของการมอบหมายแบบสุ่มเหนือแผนการมอบหมายที่ไม่ใช่การสุ่มที่นำไปสู่การอนุมานที่ไม่เอนเอียง? ให้เป็นเวกเตอร์ของการกำหนดการรักษาซึ่งแต่ละองค์ประกอบคือ 0 (หน่วยที่ไม่ได้รับมอบหมายให้ทำการรักษา) หรือ 1 (หน่วยที่กำหนดให้การรักษา) ในบทความ JASA, Angrist, Imbens และ Rubin (1996, 446-47)บอกว่าการมอบหมายการรักษานั้นเป็นการสุ่มถ้าสำหรับ\ mathbf {c}และ\ mathbf {c'} ทุกอย่างที่\ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '}โดยที่\ iotaเป็น เวกเตอร์คอลัมน์ที่มีองค์ประกอบทั้งหมดเท่ากับ 1ZZ\mathbf{Z}ZiZiZ_iPr(Z=c)=Pr(Z=c′)Pr(Z=c)=Pr(Z=c′)\Pr(\mathbf{Z} = \mathbf{c}) = \Pr(\mathbf{Z} = \mathbf{c'})cc\mathbf{c}c′c′\mathbf{c'}ιTc=ιTc′ιTc=ιTc′\iota^T\mathbf{c} …

1
จะรวมการพยากรณ์ได้อย่างไรเมื่อตัวแปรตอบสนองในตัวแบบการพยากรณ์แตกต่างกันอย่างไร
บทนำ ในการรวมการคาดการณ์หนึ่งในโซลูชั่นยอดนิยมขึ้นอยู่กับการประยุกต์ใช้เกณฑ์ข้อมูลบางอย่าง การยกตัวอย่างเช่น Akaike เกณฑ์โดยประมาณสำหรับรุ่นหนึ่งสามารถคำนวณความแตกต่างของจากแล้วRP_j = E ^ {(AIC ^ * - AIC_j) / 2}อาจจะตีความว่าเป็น ความน่าจะเป็นแบบสัมพัทธ์ของ model jเป็นค่าจริง น้ำหนักนั้นถูกกำหนดเป็นAICjAICjAIC_jjjjAICjAICjAIC_jAIC∗=minjAICjAIC∗=minjAICjAIC^* = \min_j{AIC_j}RPj=e(AIC∗−AICj)/2RPj=e(AIC∗−AICj)/2RP_j = e^{(AIC^*-AIC_j)/2}jjj wj=RPj∑jRPjwj=RPj∑jRPjw_j = \frac{RP_j}{\sum_j RP_j} ปัญหา ความยากลำบากที่ฉันพยายามเอาชนะคือแบบจำลองนั้นประมาณจากตัวแปรตอบสนอง (ภายนอก) ที่แปรเปลี่ยนไป ตัวอย่างเช่นบางรุ่นขึ้นอยู่กับอัตราการเติบโตประจำปีและอีกรุ่น - จากอัตราการเติบโตรายไตรมาส ดังนั้นค่าAIC_j ที่แยกออกมาAICjAICjAIC_jจะไม่สามารถเปรียบเทียบกันได้โดยตรง พยายามแก้ปัญหา เนื่องจากสิ่งที่สำคัญคือความแตกต่างของAICAICAICที่สามารถใช้AICของโมเดลพื้นฐานAICAICAIC(ตัวอย่างเช่นฉันพยายามแยกlm(y~-1)โมเดลโดยไม่มีพารามิเตอร์ใด ๆ ) ที่ไม่แปรเปลี่ยนไปจากการตอบสนองการแปลงตัวแปรการตอบสนองแล้วเปรียบเทียบความแตกต่างระหว่างโมเดลjjj th และ ฐานรูปแบบAICAICAICAICนี่ แต่มันดูเหมือนว่ายังคงเป็นจุดที่อ่อนแอ - ความแตกต่างเป็นผลกระทบจากการเปลี่ยนแปลงของตัวแปรการตอบสนอง สรุปข้อสังเกต หมายเหตุตัวเลือกเช่น "ประมาณโมเดลทั้งหมดในตัวแปรตอบกลับเดียวกัน" …

3
ความแตกต่างระหว่างการพึ่งพาเชิงพื้นที่และความแตกต่างเชิงพื้นที่คืออะไร?
ความแตกต่างระหว่างการพึ่งพาเชิงพื้นที่และความแตกต่างเชิงพื้นที่คืออะไร? คำถามของฉันคือแรงบันดาลใจจากการอ่านในรูปแบบสเปปัญหาในเศรษฐมิติเชิงพื้นที่โดยเฉพาะอย่างยิ่งAnselin (2010)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.