คำถามติดแท็ก econometrics

เศรษฐมิติเป็นสาขาสถิติที่เกี่ยวข้องกับการใช้งานด้านเศรษฐศาสตร์

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
มันสมเหตุสมผลที่จะทำ OLS หลังจากการเลือกตัวแปร LASSO อย่างไร
เมื่อเร็ว ๆ นี้ฉันได้พบว่าในวรรณคดีเศรษฐศาสตร์ประยุกต์ที่ใช้เมื่อจัดการกับปัญหาการเลือกคุณสมบัติมันไม่แปลกที่จะทำ LASSO ตามด้วย OLS ถดถอยโดยใช้ตัวแปรที่เลือก ฉันสงสัยว่าเราจะมีคุณสมบัติที่ถูกต้องของกระบวนการดังกล่าวได้อย่างไร มันจะทำให้เกิดปัญหาเช่นตัวแปรที่ละเว้นหรือไม่ หลักฐานใด ๆ ที่แสดงว่ามีประสิทธิภาพมากขึ้นหรือผลลัพธ์สามารถตีความได้มากกว่านี้? นี่คือการสนทนาที่เกี่ยวข้อง: การเลือกตัวแปรกับ LASSO การใช้ต้นไม้หลังจากการเลือกตัวแปรโดยใช้ Lasso / Random ถ้าตามที่ระบุไว้ขั้นตอนดังกล่าวไม่ถูกต้องโดยทั่วไปแล้วทำไมยังมีงานวิจัยมากมายที่ทำเช่นนั้น? ฉันสามารถพูดได้ไหมว่ามันเป็นเพียงแค่กฎของหัวแม่มือวิธีการประนีประนอมเนื่องจากคุณสมบัติที่ไม่สบาย ๆ ของเครื่องประมาณ LASSO และความชื่นชอบของผู้คนที่มีต่อ OLS?

2
การระบุรูปแบบความแตกต่างของความแตกต่างที่มีช่วงเวลาหลายช่วงเวลา
เมื่อฉันประมาณความแตกต่างของแบบจำลองความแตกต่างกับสองช่วงเวลารูปแบบการถดถอยที่เท่าเทียมกันจะเป็น Yฉันเป็นคนที= α + γs* Tr e a t m e n t + λ dเสื้อ+ δ* ( Tr e a t m e n t ∗ dเสื้อ) + ϵฉันเป็นคนทีYผมsเสื้อ=α+γs* * * *TRอีaเสื้อม.อีnเสื้อ+λdเสื้อ+δ* * * *(TRอีaเสื้อม.อีnเสื้อ* * * *dเสื้อ)+εผมsเสื้อY_{ist} = \alpha +\gamma_s*Treatment + \lambda d_t + \delta*(Treatment*d_t)+ \epsilon_{ist} ที่ไหน Tr …

2
การทำให้เป็นมาตรฐานจะมีประโยชน์หรือไม่ถ้าเราสนใจเฉพาะการสร้างแบบจำลองไม่ใช่ในการคาดการณ์?
การทำให้เป็นมาตรฐานจะมีประโยชน์ถ้าเราสนใจเพียงการประมาณ (และการตีความ) พารามิเตอร์โมเดลไม่ใช่การพยากรณ์หรือการทำนาย? ฉันเห็นว่าการทำให้เป็นปกติ / การตรวจสอบข้ามมีประโยชน์มากเพียงใดหากเป้าหมายของคุณคือการคาดการณ์ที่ดีเกี่ยวกับข้อมูลใหม่ แต่ถ้าคุณทำเศรษฐศาสตร์แบบดั้งเดิมและสิ่งที่คุณสนใจก็คือการประมาณ ? การตรวจสอบข้ามจะมีประโยชน์ในบริบทนั้นได้หรือไม่ ความยากลำบากทางแนวคิดที่ฉันต่อสู้คือเราสามารถคำนวณจากข้อมูลการทดสอบ แต่เราไม่สามารถคำนวณเพราะจริง\ betaเป็นไปตามคำนิยามที่ไม่เคยสังเกต (รับตามข้อสันนิษฐานที่ว่าแม้จะมีจริง\ betaนั่นคือเรารู้ว่าครอบครัวของแบบจำลองที่สร้างข้อมูล)ββ\betaL(Y,Y^)L(Y,Y^)\mathcal{L}\left(Y, \hat{Y}\right)L(β,β^)L(β,β^)\mathcal{L}\left(\beta, \hat{\beta}\right)ββ\betaββ\beta สมมติว่าสูญเสียของคุณคือL(β,β^)=∥β−β^∥L(β,β^)=‖β−β^‖\mathcal{L}\left(\beta, \hat{\beta}\right) = \lVert \beta - \hat{\beta} \rVert\ คุณเผชิญกับการแลกเปลี่ยนอคติแปรปรวนใช่ไหม? ดังนั้นในทางทฤษฎีคุณน่าจะใช้การปรับให้เป็นมาตรฐานได้ดีกว่า แต่คุณจะเลือกพารามิเตอร์การทำให้เป็นมาตรฐานได้อย่างไร? ฉันยินดีที่จะเห็นตัวอย่างเชิงตัวเลขอย่างง่ายของตัวแบบการถดถอยเชิงเส้นพร้อมค่าสัมประสิทธิ์β≡(β1,β2,…,βk)β≡(β1,β2,…,βk)\beta \equiv (\beta_1, \beta_2, \ldots, \beta_k)ซึ่งฟังก์ชันการสูญเสียของนักวิจัยคือ∥β−β^∥‖β−β^‖\lVert \beta - \hat{\beta} \rVertหรือแม้เพียงแค่(β1−β^1)2(β1−β^1)2(\beta_1 - \hat{\beta}_1)^2 2 ในทางปฏิบัติเราสามารถใช้การตรวจสอบข้ามเพื่อปรับปรุงการสูญเสียที่คาดหวังในตัวอย่างเหล่านั้นได้อย่างไร แก้ไข : DJohnson ชี้ให้ฉันเห็นhttps://www.cs.cornell.edu/home/kleinber/aer15-prediction.pdfซึ่งเกี่ยวข้องกับคำถามนี้ ผู้เขียนเขียนว่า เทคนิคการเรียนรู้ของเครื่อง ... เป็นวิธีที่มีระเบียบวินัยในการทำนาย Y^Y^\hat{Y}ซึ่ง …


4
ปัญหาต้นไม้เงินวิเศษ
ฉันคิดว่าปัญหานี้ในห้องอาบน้ำมันเป็นแรงบันดาลใจจากกลยุทธ์การลงทุน สมมติว่ามีต้นไม้เงินวิเศษ ทุกวันคุณสามารถเสนอเงินจำนวนหนึ่งให้กับต้นไม้เงินและมันจะเพิ่มขึ้นเป็นสามเท่าหรือทำลายมันด้วยความน่าจะเป็น 50/50 คุณสังเกตเห็นทันทีว่าโดยเฉลี่ยคุณจะได้รับเงินจากการทำเช่นนี้และกระตือรือร้นที่จะใช้ประโยชน์จากต้นไม้เงิน อย่างไรก็ตามหากคุณเสนอเงินทั้งหมดในครั้งเดียวคุณจะได้ 50% ของการสูญเสียเงินทั้งหมด ยอมรับไม่ได้! คุณเป็นคนที่ไม่ชอบความเสี่ยงดังนั้นคุณตัดสินใจที่จะคิดกลยุทธ์ คุณต้องการลดอัตราต่อรองของการสูญเสียทุกสิ่งทุกอย่าง แต่คุณต้องการทำเงินให้ได้มากที่สุด! คุณคิดสิ่งต่อไปนี้ทุกวันคุณเสนอ 20% ของเงินทุนปัจจุบันให้กับต้นไม้เงิน สมมติว่าราคาต่ำสุดที่คุณสามารถเสนอได้คือ 1 เซ็นต์, มันจะใช้เวลาขาดทุน 31 ครั้งในการสูญเสียเงินทั้งหมดของคุณถ้าคุณเริ่มต้นด้วย 10 ดอลลาร์ มีอะไรอีก, ยิ่งคุณมีรายได้มากเท่าไหร่การสูญเสียทุกอย่างก็จะยิ่งมากขึ้นเท่านั้น คุณเริ่มต้นรับเงินสดจำนวนมากอย่างรวดเร็ว แต่ความคิดปรากฏขึ้นในหัวของคุณ: คุณสามารถเสนอ 30% ในแต่ละวันและหารายได้เพิ่ม! แต่เดี๋ยวก่อนทำไมไม่เสนอ 35% 50%? อยู่มาวันหนึ่งด้วยสัญลักษณ์ดอลลาร์ขนาดใหญ่ในดวงตาของคุณคุณวิ่งไปที่ต้นไม้เงินกับเงินล้านของคุณและเสนอเงินสด 100% ซึ่งต้นไม้เงินจะเผาไหม้ทันที วันรุ่งขึ้นคุณจะได้งานที่ McDonalds ซึ่งต้นไม้เงินเผาไหม้ทันที วันรุ่งขึ้นคุณจะได้งานที่ McDonalds ซึ่งต้นไม้เงินเผาไหม้ทันที วันรุ่งขึ้นคุณจะได้งานที่ McDonalds มีเปอร์เซ็นต์ที่เหมาะสมของเงินสดที่คุณสามารถเสนอได้โดยไม่สูญเสียทั้งหมดหรือไม่? (ย่อย) คำถาม: หากมีอัตราร้อยละที่เหมาะสมที่คุณควรเสนอให้คงที่นี้ (เช่น 20% …

3
ควรใช้เอฟเฟกต์คงที่เมื่อใดกับการใช้คลัสเตอร์ SE
สมมติว่าคุณมีข้อมูลข้ามส่วนเดียวที่บุคคลตั้งอยู่ภายในกลุ่ม (เช่นนักเรียนในโรงเรียน) และคุณต้องการประเมินแบบจำลองของแบบฟอร์มY_i = a + B*X_iที่Xเป็นเวกเตอร์ของลักษณะระดับบุคคลและaค่าคงที่ ในกรณีนี้สมมติว่าไม่มีความแตกต่างระหว่างกลุ่มที่แตกต่างกันทำให้ลำเอียงประเมินจุดของคุณBและ SEs ของพวกเขาเนื่องจากมีความสัมพันธ์กับตัวแปรอิสระที่คุณสนใจ ทางเลือกหนึ่งคือการจัดกลุ่ม SE ของคุณตามกลุ่ม (โรงเรียน) อีกประการหนึ่งคือการรวมกลุ่ม FE อีกอย่างคือให้ใช้ทั้ง สิ่งที่ควรพิจารณาเมื่อเลือกระหว่างตัวเลือกเหล่านี้ ไม่ชัดเจนว่าทำไมกลุ่มหนึ่งอาจรวมกลุ่ม SE ตามกลุ่มและใช้กลุ่ม FE ในกรณีเฉพาะของฉันฉันมี 35 กลุ่มและ 5,000 คนซ้อนกันภายในแต่ละกลุ่ม ฉันได้ติดตามการสนทนาในไฟล์ PDF นี้แต่ไม่ชัดเจนว่าทำไมและเมื่อใดจึงอาจใช้ทั้ง SEs แบบคลัสเตอร์และเอฟเฟกต์คงที่ (โปรดอภิปรายข้อดีและข้อเสียของ SEs เทียบกับ FE แทนการแนะนำฉันพอดีกับโมเดลหลายระดับ)


3
ตำราเบื้องต้นเกี่ยวกับเศรษฐมิติเชิงโครงสร้าง
ในปีที่ผ่านมาวิธีการเชิงโครงสร้างเพื่อเศรษฐมิติเมื่อเทียบกับเศรษฐมิติแบบฟอร์มที่ลดลงได้กลายเป็นที่นิยมมากขึ้น สิ่งนี้เกี่ยวข้องกับการรวมกันอย่างแน่นหนาของแบบจำลองทางเศรษฐศาสตร์เชิงทฤษฎีและสถิติเพื่อประเมินพารามิเตอร์ที่น่าสนใจ การนำเสนอโครงสร้างเชิงทฤษฎีมากขึ้นในวิธีที่เราใช้ข้อมูลและวิธีการทางสถิติมีไว้เพื่อให้คำแนะนำและบางครั้งก็สามารถเปิดเผยพารามิเตอร์ที่ไม่สามารถประเมินได้อย่างง่ายดายด้วยวิธีการลดรูปแบบ แม้แต่ผู้ที่ไม่ใช่นักเศรษฐศาสตร์ก็อาจมีความน่าสนใจเพราะการจำลองและการสุ่มตัวอย่างสามารถเป็นส่วนสำคัญในการประมาณโครงสร้างและเทคนิคต่างๆที่ใช้ในสังคมศาสตร์อื่น ๆ สาขาวิชาเศรษฐศาสตร์ในสาขาวิชาสถิตินี้ดูเหมือนจะไม่มีตำราแบบเกริ่นนำมาก่อน ฉันได้พบเพียงวัสดุที่ทันสมัยมากขึ้นเช่นโครงสร้างทางเศรษฐมิติรุ่นโดย Choo และชุม (2013) หรือบทสำรวจโดยไดอานาและ WOLAK ใครช่วยชี้ให้ฉันดูชุดของการบรรยายหรือบางทีหนังสือ (ที่ฉันเพิ่งยังไม่พบ) ซึ่งจะให้คำแนะนำเกี่ยวกับเศรษฐศาสตร์เชิงโครงสร้าง? ความนึกคิดนี้จะขึ้นอยู่กับตัวอย่างที่มีวิธีการต่าง ๆ รวมถึงรหัสหรือคำแนะนำเกี่ยวกับวิธีการทำซ้ำตัวอย่างเหล่านี้เพื่อความเข้าใจที่ดีขึ้น ฉันตระหนักถึงงานวิจัยหลายชิ้นโดยเฉพาะในองค์กรอุตสาหกรรม แบบจำลองการพึ่งพาของรัฐ (สนิม, 1987) การประมาณความต้องการ (Berry, 1994; Berry, Levinson, และ Pakes, 1995) การประมาณผลผลิต (Olley and Pakes, 1996) การประมาณค่าอำนาจตลาด (Nevo, 2005; Sovinsky, 2008) แต่ส่วนใหญ่ยากที่จะติดตาม ดังนั้นหากมีคนรู้เกี่ยวกับการแนะนำที่อ่อนโยนกว่านี้จะเป็นความช่วยเหลือที่ดี

5
ทำไมค่า R-squared ต่ำมากเมื่อสถิติ t ของฉันใหญ่มาก
ฉันทำการถดถอยด้วยตัวแปร 4 ตัวและทั้งหมดมีความสำคัญทางสถิติโดยมีค่า Tและ31 (ฉันพูดว่า≈เพราะดูเหมือนว่าไม่เกี่ยวข้องกับการรวมทศนิยม) ซึ่งสูงมากและมีความสำคัญอย่างชัดเจน แต่R 2นั้นเป็นเพียง. 2284 ฉันตีความตีความค่า t ที่นี่เพื่อหมายถึงบางสิ่งที่ไม่ได้ใช่หรือไม่ ปฏิกิริยาแรกของฉันเมื่อเห็นค่า t คือว่าR 2จะค่อนข้างสูง แต่อาจจะสูงR 2หรือไม่?≈7,9,26≈7,9,26\approx 7,9,26313131≈≈\approxR2R2R^2R2R2R^2R2R2R^2

3
วรรณกรรมเกี่ยวกับการถดถอยแบบควอนไทล์ IV
ในช่วงหลายเดือนที่ผ่านมาฉันได้อ่านอย่างละเอียดเกี่ยวกับการถดถอยเชิงปริมาณเพื่อเตรียมสำหรับวิทยานิพนธ์ปริญญาโทของฉันในฤดูร้อนนี้ โดยเฉพาะฉันได้อ่านหนังสือของ Roger Koenker 2005 ส่วนใหญ่ในหัวข้อ ตอนนี้ฉันต้องการที่จะขยายความรู้ที่มีอยู่นี้เพื่อเทคนิคการถดถอยเชิงปริมาณที่อนุญาตให้ตัวแปรเครื่องมือ (IV) นี่ดูเหมือนจะเป็นงานวิจัยที่กำลังเติบโตอย่างรวดเร็ว อาจมีคนแนะนำให้ฉัน: เอกสารหรือวรรณกรรมอื่น ๆ เกี่ยวกับการถดถอยเชิงปริมาณ IV ภาพรวมสั้น ๆ ของเทคนิคทางสถิติที่แตกต่างกันเหล่านี้ ข้อดีข้อเสียของเทคนิคต่าง ๆ ฉันกำลังมองหาวรรณกรรมเพื่อให้ฉันเริ่มต้นและมีภาพรวมที่ดีของสิ่งที่มีอยู่ ดังนั้นประเด็นแรกคือสิ่งที่สำคัญ ที่สองและสามจะดีที่มี! ความสนใจของฉันยังอยู่ที่วิธีการแบบตัดขวางเป็นหลัก แต่ก็ยินดีต้อนรับวิธีการแบบแผง ขอบคุณล่วงหน้า.


3
เมื่อใดที่ควรพิจารณาใช้ GMM
หนึ่งในสิ่งที่ทำให้เศรษฐมิติมีเอกลักษณ์คือการใช้เทคนิควิธีการทั่วไปในช่วงเวลา ปัญหาประเภทใดที่ทำให้ GMM เหมาะสมกว่าเทคนิคการประมาณแบบอื่น ๆ การใช้ GMM ซื้อคุณในแง่ของประสิทธิภาพหรือลดอคติหรือการประมาณค่าพารามิเตอร์ที่เฉพาะเจาะจงมากขึ้นคืออะไร ในทางกลับกันคุณสูญเสียอะไรจากการใช้ GMM ผ่าน MLE เป็นต้น

5
Hessian เชิงประจักษ์ของ M-estimator สามารถไม่มีกำหนดได้หรือไม่?
Jeffrey Wooldridge ในการวิเคราะห์เศรษฐมิติของเขาเกี่ยวกับการตัดขวางและข้อมูลพาเนล (หน้า 357) กล่าวว่า Hessian เชิงประจักษ์ "ไม่รับประกันว่าจะแน่นอนแน่นอนหรือแม้กระทั่ง semidefinite บวกสำหรับตัวอย่างเฉพาะที่เรากำลังทำงานอยู่" นี่ดูเหมือนว่าผิดสำหรับฉัน (ปัญหาเชิงตัวเลขแยกกัน) Hessian จะต้องเป็น semidefinite เชิงบวกอันเป็นผลมาจากคำจำกัดความของ M-estimator ว่าเป็นค่าของพารามิเตอร์ที่ลดฟังก์ชั่นวัตถุประสงค์สำหรับตัวอย่างที่ได้รับและความจริงที่รู้จักกันดีว่า อย่างน้อยที่สุด (ในพื้นที่) Hessian นั้นเป็น semidefinite ที่เป็นบวก ข้อโต้แย้งของฉันถูกต้องหรือไม่ [แก้ไข: คำสั่งถูกลบในฉบับที่ 2 ของหนังสือ ดูความคิดเห็น] ภูมิหลังสมมติว่าθ Nเป็นประมาณการที่ได้รับโดยการลด 1θˆNθ^N\widehat \theta_N1N∑i=1Nq(wi,θ),1N∑i=1Nq(wi,θ),{1 \over N}\sum_{i=1}^N q(w_i,\theta), ที่wiwiw_iหมายถึงiiiสังเกต -th เรามาแทน Hessian ของด้วย , qqqHHHH(q,θ)ij=∂2q∂θi∂θjH(q,θ)ij=∂2q∂θi∂θjH(q,\theta)_{ij}=\frac{\partial^2 q}{\partial \theta_i \partial \theta_j} ความแปรปรวนร่วมซีมโทติคของเกี่ยวข้องกับโดยที่เป็นค่าพารามิเตอร์ที่แท้จริง …

5
วิธีสร้างแบบจำลองราคา
ฉันถามคำถามนี้ในเว็บไซต์ matemathics stackexchange และแนะนำให้ถามที่นี่ ฉันกำลังทำงานในโครงการงานอดิเรกและต้องการความช่วยเหลือเกี่ยวกับปัญหาต่อไปนี้ บริบทนิดหน่อย สมมติว่ามีชุดของรายการพร้อมคำอธิบายคุณสมบัติและราคา ลองนึกภาพรายการรถยนต์และราคา รถยนต์ทุกคันมีรายการคุณสมบัติเช่นขนาดเครื่องยนต์สีพลังม้ารุ่นปี ฯลฯ สำหรับแต่ละยี่ห้อมีดังนี้: Ford: V8, green, manual, 200hp, 2007, $200 V6, red, automatic, 140hp, 2010, $300 V6, blue, manual, 140hp, 2005, $100 ... ยิ่งไปกว่านั้นรายการรถยนต์ที่มีราคาจะถูกเผยแพร่พร้อมช่วงเวลาหนึ่งซึ่งหมายความว่าเราสามารถเข้าถึงข้อมูลราคาในอดีตได้ อาจไม่รวมถึงรถยนต์คันเดียวกันทุกประการ ปัญหา ฉันต้องการที่จะเข้าใจวิธีการกำหนดราคาสำหรับรถใด ๆ ตามข้อมูลฐานนี้ที่สำคัญที่สุดคือรถยนต์ที่ไม่ได้อยู่ในรายการเริ่มต้น Ford, v6, red, automatic, 130hp, 2009 สำหรับรถด้านบนมันเกือบจะเหมือนกันกับหนึ่งในรายการเพียงเล็กน้อยแตกต่างกันในพลังม้าและปี ราคานี้สิ่งที่จำเป็น? สิ่งที่ฉันกำลังมองหาคือสิ่งที่ใช้งานได้จริงและเรียบง่าย แต่ฉันอยากจะได้ยินเกี่ยวกับวิธีการที่ซับซ้อนมากขึ้นในการสร้างแบบจำลองเช่นนี้ สิ่งที่ฉันได้ลอง นี่คือสิ่งที่ฉันกำลังทดลองด้วย: 1) …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.