คำถามติดแท็ก fixed-effects-model

ในทางชีวสถิติผลคงที่อาจหมายถึงผลกระทบโดยเฉลี่ยของประชากร ในเศรษฐมิติผลคงที่อาจแสดงถึงปริมาณที่สังเกตได้ในรูปแบบของตัวแปรอธิบายที่ถือว่าเป็นปริมาณที่ไม่สุ่ม

3
การลบปัจจัยออกจากตาราง ANOVA 3 ทาง
ในบทความล่าสุดฉันติดตั้งโมเดลเอฟเฟกต์คงที่สามทาง เนื่องจากหนึ่งในปัจจัยไม่สำคัญ (p> 0.1) ฉันจึงลบออกและประกอบโมเดลที่มีเอฟเฟกต์คงที่สองรายการและการโต้ตอบ ฉันเพิ่งมีความคิดเห็นกลับไปอ้าง: เวลานั้นไม่ได้เป็นปัจจัยสำคัญในการวิเคราะห์ความแปรปรวน 3 ทางของตัวเองไม่ได้เป็นเกณฑ์ที่เพียงพอสำหรับการรวมปัจจัยเวลา: ข้อความมาตรฐานในเรื่องนี้ Underwood 1997 ระบุว่าค่า p สำหรับค่าที่ไม่มีนัยสำคัญจะต้องเป็น มากกว่า 0.25 ก่อนระดับการรักษาของปัจจัยสามารถรวมกลุ่มกันได้ ผู้เขียนควรให้ค่า p ที่เกี่ยวข้องที่นี่และปรับการรวมกำไรของพวกเขาด้วยการอ้างอิงถึง Underwood 1997 คำถามของฉันคือ: ฉันไม่เคยได้ยินเกี่ยวกับกฎ 0.25 มีใครอีกบ้างไหม? ฉันสามารถเข้าใจได้ว่าไม่ได้ลบปัจจัยหากค่า p ใกล้เคียงกับการตัดออก แต่การมี "กฎ" ดูเหมือนจะสุดขั้ว ผู้ตัดสินรายนี้ระบุว่าUnderwood 1997เป็นข้อความมาตรฐาน มันจริงเหรอ? ฉันไม่เคยได้ยินเรื่องนี้เลย อะไรคือข้อความมาตรฐาน (สิ่งนั้นมีอยู่จริง)? น่าเสียดายที่ฉันไม่สามารถเข้าถึง Underwood นี้ได้ในปี 1997 คำแนะนำใด ๆ เมื่อตอบสนองต่อผู้ตัดสิน ความเป็นมา: บทความนี้ถูกส่งไปยังวารสารที่ไม่ใช่สถิติ เมื่อติดตั้งโมเดลสามทางฉันจะตรวจสอบเอฟเฟกต์การโต้ตอบ

1
ตัวแปรตามมาตรฐานภายในกลุ่มในโมเดลข้อมูลพาเนล?
การกำหนดมาตรฐานของตัวแปรตามภายในกลุ่มที่ระบุเหมาะสมหรือไม่? เอกสารการทำงานต่อไปนี้ (การชะลอการตัดไม้ทำลายป่าในกฎหมาย Amazon ราคาหรือนโยบาย, PDF ) ใช้ตัวแปรตามมาตรฐานเพื่อวิเคราะห์ผลของการเปลี่ยนแปลงนโยบายทั่วไปในบราซิลในการทำลายป่า การทำให้เป็นมาตรฐานมีดังนี้: Ynewit=Yit−Yi¯¯¯¯¯sd(Yit)Yitnew=Yit−Yi¯sd(Yit) Y^{new}_{it} = \frac{Y_{it} - \overline{Y_i}}{sd(Y_{it})} ผู้เขียนโต้เถียงสิ่งนี้ทำหน้าที่ "พิจารณาการเปลี่ยนแปลงที่สัมพันธ์กันในการเพิ่มขึ้นของการทำลายป่าในเขตเทศบาล" ผู้เขียนใช้การประมาณค่า FE (หน้า 12) สำหรับข้อมูลพาเนล รวมถึงการโพสต์นโยบายหลอกตาสำหรับแต่ละปีต่อไปนี้หลังจากที่กฎหมายใหม่ ควรตีความค่าสัมประสิทธิ์อย่างไรถ้าตัวแปรตามเป็นมาตรฐานในวิธีนี้ การสร้างมาตรฐานไม่ใช่การแหกคอกเนื่องจากมันให้คุณค่าสูงกว่าในการสังเกตที่กลุ่ม / เทศบาลมีประสบการณ์การเปลี่ยนแปลงที่ลดลงเมื่อเวลาผ่านไป?

3
เมื่อใดที่ผลกระทบคงที่คงที่อย่างแท้จริง?
พิจารณาเชิงเส้นแบบจำลองผลกระทบที่ไม่มีใครสังเกตประเภท: ที่คเป็นลักษณะสังเกต แต่เวลาคงที่และอีเป็นข้อผิดพลาดที่ผมและเสื้อดัชนีสังเกตของแต่ละบุคคลและเวลา ตามลำดับ วิธีการทั่วไปในการแก้ไขเอฟเฟ็กต์คงที่ (FE) คือการลบc iผ่านแต่ละ dummies (LSDV) / de-meaning หรือโดยสร้างความแตกต่างครั้งแรกyit=Xitβ+ci+eityit=Xitβ+ci+eity_{it} = X_{it}\beta + c_{i} + e_{it}ccceeeiiitttcicic_{i} สิ่งที่ฉันได้เคยสงสัยเมื่อเป็นอย่างแท้จริง "คงที่"?cicic_{i} นี่อาจเป็นคำถามที่ไม่สำคัญ แต่ขอให้ฉันยกตัวอย่างสองเหตุผลให้ฉันดู สมมติว่าเราสัมภาษณ์คนในวันนี้และขอให้รายได้ของเธอ, น้ำหนัก, ฯลฯ เราจึงได้รับของเราXในอีก 10 วันข้างหน้าเราจะไปหาคนคนนั้นและสัมภาษณ์เธออีกครั้งทุกวันอีกครั้งดังนั้นเราจึงมีข้อมูลแบบพาเนลสำหรับเธอ เราควรรักษาลักษณะที่ไม่มีใครสังเกตเห็นไว้เป็นระยะเวลา 10 วันซึ่งแน่นอนว่ามันจะเปลี่ยนไปในอนาคต ใน 10 วันความสามารถส่วนตัวของเธออาจไม่เปลี่ยนแปลง แต่จะเกิดขึ้นเมื่อเธออายุมากขึ้น หรือถามอย่างสุดขั้ว: ถ้าฉันสัมภาษณ์คนนี้ทุกชั่วโมงเป็นเวลา 10 ชั่วโมงในหนึ่งวันลักษณะที่ไม่ได้สังเกตของเธอน่าจะได้รับการแก้ไขใน "ตัวอย่าง" นี้ แต่สิ่งนี้มีประโยชน์อย่างไรXXX ทีนี้สมมติว่าเราสัมภาษณ์คนทุกเดือนตั้งแต่ต้นจนจบชีวิตของเธอเป็นเวลา 85 ปีหรือมากกว่านั้น สิ่งที่จะคงอยู่ในเวลานี้? สถานที่เกิดเพศและสีตามีแนวโน้มมากที่สุด แต่นอกเหนือจากนั้นฉันแทบจะไม่สามารถคิดสิ่งอื่นใด แต่ที่สำคัญยิ่งกว่า: …

3
Mundlak ใช้เอฟเฟกต์คงที่สำหรับการถดถอยโลจิสติกกับหุ่นหรือไม่
ฉันมีชุดข้อมูลที่มี 8000 คลัสเตอร์และการสังเกต 4 ล้านครั้ง น่าเสียดายที่ซอฟต์แวร์สถิติของฉัน Stata ทำงานค่อนข้างช้าเมื่อใช้ฟังก์ชันข้อมูลพาเนลสำหรับการถดถอยโลจิสติก: xtlogitแม้มีตัวอย่าง 10% อย่างไรก็ตามเมื่อใช้logitผลลัพธ์ฟังก์ชั่นที่ไม่ใช่แผงเซลล์ปรากฏเร็วกว่ามาก ดังนั้นฉันจึงอาจได้รับประโยชน์จากการใช้logitข้อมูลที่ถูกแก้ไขซึ่งมีผลกระทบคงที่ ฉันเชื่อว่ากระบวนการนี้มีชื่อว่า "Mundlak fixed effects procedure" (Mundlak, Y. 1978. การรวมกลุ่มของ Time-Series และข้อมูลข้ามส่วน Econometrica, 46 (1), 69-85) ฉันพบคำอธิบายที่เข้าใจง่ายของขั้นตอนนี้ในบทความโดยAntonakis, J. , Bendahan, S. , Jacquart, P. , & Lalive, R. (2010) ในการอ้างเหตุผล: การตรวจสอบและคำแนะนำ ความเป็นผู้นำรายไตรมาส, 21 (6) 1086-1120 ฉันพูด: วิธีหนึ่งในการแก้ไขปัญหาของเอฟเฟกต์ที่ถูกตัดออกและยังรวมถึงตัวแปรระดับ 2 คือการรวมวิธีการคลัสเตอร์ของทุกระดับ …

1
ความแตกต่างระหว่าง PROC Mixed และ lme / lmer ใน R - degree of freedom
หมายเหตุ: คำถามนี้เป็นคำถามใหม่เนื่องจากต้องลบคำถามก่อนหน้านี้ด้วยเหตุผลทางกฎหมาย ในขณะที่เปรียบเทียบ PROC MIXED จาก SAS กับฟังก์ชันlmeจากnlmeแพ็คเกจใน R ฉันพบความแตกต่างที่ค่อนข้างสับสน โดยเฉพาะอย่างยิ่งองศาอิสระในการทดสอบที่แตกต่างกันระหว่างPROC MIXEDและlmeและฉันสงสัยว่าทำไม เริ่มจากชุดข้อมูลต่อไปนี้ (รหัส R ระบุด้านล่าง): ind: ปัจจัยบ่งชี้บุคคลที่จะทำการวัด fac: อวัยวะที่ใช้ทำการวัด trt: ปัจจัยบ่งชี้การรักษา y: ตัวแปรตอบสนองต่อเนื่องบางอย่าง ความคิดคือการสร้างแบบจำลองง่ายๆดังต่อไปนี้: y ~ trt + (ind): indเป็นปัจจัยสุ่ม y ~ trt + (fac(ind)): facซ้อนกันindเป็นปัจจัยสุ่ม โปรดทราบว่ารุ่นสุดท้ายที่ควรทำให้เกิดเอกเป็นมีเพียง 1 ค่าของyสำหรับการรวมกันของทุกและindfac แบบจำลองแรก ใน SAS ฉันสร้างโมเดลต่อไปนี้: PROC MIXED data=Data; CLASS ind fac …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
ความแตกต่างในความแตกต่างกับข้อมูลแผงระดับบุคคล
วิธีที่ถูกต้องในการระบุความแตกต่างในรูปแบบที่แตกต่างกับข้อมูลแผงระดับบุคคลคืออะไร? นี่คือการตั้งค่า: สมมติว่าฉันมีข้อมูลแผงระดับบุคคลที่ฝังอยู่ในเมืองเป็นเวลาหลายปีและการรักษาแตกต่างกันไปในระดับเมืองปี อย่างเป็นทางการให้เป็นผลสำหรับแต่ละในเมืองและในปีและเป็นหุ่นสำหรับว่าแทรกแซงได้รับผลกระทบเมืองในปีทีตัวประมาณ DiD ทั่วไปเช่นที่ระบุไว้ใน Bertrand et al (2004, p. 250) ขึ้นอยู่กับแบบจำลอง OLS แบบง่าย ๆ ที่มีคำที่มีผลคงที่สำหรับเมืองและปี:ฉันs T D s T s TYฉันเป็นคนทีYผมsเสื้อy_{ist}ผมผมisssเสื้อเสื้อtDs TDsเสื้อD_{st}sssเสื้อเสื้อt Yฉันเป็นคนที= As+ Bเสื้อ+ c Xฉันเป็นคนที+ βDs T+ ϵฉันเป็นคนทีYผมsเสื้อ=As+Bเสื้อ+คXผมsเสื้อ+βDsเสื้อ+εผมsเสื้อ y_{ist} = A_{s} + B_t + cX_{ist} + \beta D_{st} + \epsilon_{ist} แต่ผู้ประมาณนั้นเพิกเฉยต่อโครงสร้างพาเนลระดับบุคคล (เช่นการสังเกตหลายอย่างสำหรับแต่ละคนในเมือง) หรือไม่? มันสมเหตุสมผลไหมที่จะขยายโมเดลนี้ด้วยเอฟเฟกต์คำคงที่แต่ละระดับ ? แอปพลิเคชั่น …

2
ทำไมโมเดลเอฟเฟกต์แบบสุ่มต้องการให้เอฟเฟ็กต์ไม่เกี่ยวข้องกับตัวแปรอินพุตในขณะที่โมเดลเอฟเฟกต์คงที่อนุญาตให้มีความสัมพันธ์กัน?
จากวิกิพีเดีย มีสมมติฐานทั่วไปสองข้อเกี่ยวกับเอฟเฟกต์เฉพาะของแต่ละบุคคล, สมมติฐานเอฟเฟกต์แบบสุ่มและสมมติฐานผลกระทบคงที่ สมมติฐานผลกระทบแบบสุ่ม (ทำในรูปแบบผลกระทบแบบสุ่ม) คือว่าผลกระทบเฉพาะบุคคลจะไม่เกี่ยวข้องกับตัวแปรอิสระ ข้อสันนิษฐานผลกระทบคงที่คือผลกระทบเฉพาะบุคคลมีความสัมพันธ์กับตัวแปรอิสระ หากการสันนิษฐานผลกระทบแบบสุ่มถือแบบจำลองผลกระทบแบบสุ่มมีประสิทธิภาพมากขึ้นกว่าแบบจำลองผลกระทบคงที่ อย่างไรก็ตามหากสมมติฐานนี้ไม่ได้เก็บไว้ (เช่นหากการทดสอบ Durbin – Watson ล้มเหลว) โมเดลเอฟเฟกต์แบบสุ่มจะไม่สอดคล้องกัน ฉันสงสัยว่าทำไมตัวแบบเอฟเฟกต์แบบสุ่มต้องการให้เอฟเฟกต์แบบสุ่มไม่เกี่ยวข้องกับตัวแปรอินพุตในขณะที่โมเดลเอฟเฟกต์แบบคงที่จะทำให้เอฟเฟกต์สัมพันธ์กับตัวแปรอินพุต ขอบคุณ!

1
วิธีจัดการกับตัวแปรดัมมี่ที่ถูกตัดในรูปแบบเอฟเฟกต์คงที่?
ฉันใช้รูปแบบคงมีผลสำหรับข้อมูลที่แผงของฉัน (9 ปี 1000 + OBS) ตั้งแต่การทดสอบ Hausman ของฉันแสดงให้เห็นค่า(PR&gt;เมื่อฉันเพิ่มตัวแปรดัมมี่สำหรับอุตสาหกรรมที่ บริษัท ของฉันรวมไว้พวกเขาจะถูกละไว้เสมอ ฉันรู้ว่ามีความแตกต่างใหญ่เมื่อมันมาถึง DV (ดัชนีการเปิดเผย) ในกลุ่มอุตสาหกรรมที่แตกต่างกัน แต่ฉันไม่สามารถรับมันในแบบจำลองของฉันเมื่อใช้ Stata(Pr&gt;χ2)&lt;0.05(Pr&gt;χ2)&lt;0.05(Pr>\chi^2)<0.05 ข้อเสนอแนะวิธีการแก้ปัญหานี้? และทำไมพวกเขามองข้าม?

2
วิธีที่ดีที่สุดในการประเมินผลการรักษาโดยเฉลี่ยในการศึกษาระยะยาวคืออะไร?
ในการศึกษาระยะยาวผลลัพธ์ของหน่วยที่ถูกวัดซ้ำ ๆ ณ จุดเวลาโดยมีโอกาสในการวัดคงที่ทั้งหมด (คงที่ = วัดที่หน่วยในเวลาเดียวกัน)YฉันทีYผมเสื้อY_{it}ผมผมiเสื้อเสื้อtม.ม.m หน่วยที่ได้รับมอบหมายสุ่มทั้งการรักษา,หรือกลุ่มควบคุม, 0 ฉันต้องการประเมินและทดสอบผลการรักษาโดยเฉลี่ยเช่นที่ความคาดหวังนั้นเกิดขึ้นข้ามเวลาและส่วนบุคคล ฉันพิจารณาใช้แบบจำลองหลายระดับ (เอฟเฟกต์ผสม) ในโอกาสคงที่เพื่อวัตถุประสงค์นี้G = 1G=1G=1G = 0G=0G=0TE= E( Y| G=1)-E( Y| G=0),ATE=E(Y|G=1)-E(Y|G=0),ATE=E(Y | G=1) - E(Y | G=0), Yฉันที= α + βGผม+ยู0 ฉัน+อีฉันทีYผมเสื้อ=α+βGผม+ยู0ผม+อีผมเสื้อY_{it} = \alpha + \beta G_i + u_{0i} + e_{it} ด้วย the intercept the ,จะถูกสกัดกั้นแบบสุ่มทั่วทั้งหน่วยและส่วนที่เหลือαα\alphaββ\betaTEATEATEยูยูuอีอีe ตอนนี้ฉันกำลังพิจารณารูปแบบทางเลือก Yฉันที=β~Gผม+Σj = …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.