คำถามติดแท็ก econometrics

เศรษฐมิติเป็นสาขาสถิติที่เกี่ยวข้องกับการใช้งานด้านเศรษฐศาสตร์

1
เงื่อนไข homoskedasticity เทียบกับ heteroskedasticity
จากเศรษฐมิติโดย Fumio Hayashi (Chpt 1): ไม่มีเงื่อนไข Homoskedasticity: ช่วงเวลาที่สองของข้อผิดพลาด E (εᵢ²) เป็นค่าคงที่ตลอดการสังเกต รูปแบบการทำงาน E (εᵢ² | xi) เป็นค่าคงที่ตลอดการสังเกต เงื่อนไข Homoskedasticity: ข้อ จำกัด ที่ช่วงเวลาที่สองของข้อผิดพลาด E (εᵢ²) เป็นค่าคงที่ตลอดการสังเกตถูกยกขึ้น ดังนั้นช่วงเวลาที่สองตามเงื่อนไข E (εᵢ² | xi) สามารถแตกต่างกันในการสังเกตผ่านการพึ่งพาที่เป็นไปได้ในxᵢ ดังนั้นคำถามของฉัน: เงื่อนไข Homoskedasticity แตกต่างจาก Heteroskedasticity อย่างไร ความเข้าใจของฉันคือว่ามี heteroskedasticity เมื่อช่วงเวลาที่สองแตกต่างจากการสังเกต (xᵢ)

1
การทดสอบที่แน่นอนของฟิชเชอร์และการกระจาย hypergeometric
ฉันต้องการที่จะเข้าใจการทดสอบที่แม่นยำของฟิชเชอร์มากขึ้นดังนั้นฉันจึงคิดค้นตัวอย่างของเล่นต่อไปนี้โดยที่ f และ m สอดคล้องกับเพศชายและเพศหญิงและ n และ y สอดคล้องกับ "การบริโภคโซดา" เช่นนี้: > soda_gender f m n 0 5 y 5 0 เห็นได้ชัดว่านี่คือการทำให้เข้าใจง่ายมาก แต่ฉันไม่ต้องการให้บริบทเข้ามาขวางทาง ที่นี่ฉันเพิ่งสันนิษฐานว่าผู้ชายไม่ดื่มโซดาและหญิงดื่มโซดาและต้องการดูว่าวิธีการทางสถิติมาถึงข้อสรุปเดียวกัน เมื่อฉันทำการทดสอบฟิชเชอร์ที่แน่นอนใน R ฉันจะได้ผลลัพธ์ต่อไปนี้: > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 …

1
การทำนาย logit สั่งใน R
ฉันพยายามทำการถดถอย logit สั่ง ฉันกำลังใช้รูปแบบเช่นนั้น (เพียงแบบจำลองโง่ ๆ ประมาณจำนวน บริษัท ในตลาดจากรายรับและมาตรการประชากร) คำถามของฉันเกี่ยวกับการทำนาย nfirm.opr<-polr(y~pop0+inc0, Hess = TRUE) pr_out<-predict(nfirm.opr) เมื่อฉันใช้ทำนาย (ซึ่งฉันพยายามใช้เพื่อให้ได้ค่า y ที่คาดการณ์) ผลลัพธ์จะเป็น 0, 3, หรือ 27 ซึ่งไม่มีทางที่จะสะท้อนให้เห็นถึงสิ่งที่ควรจะเป็นคำทำนายจากค่าสัมประสิทธิ์ของฉันเองจากค่าสัมประสิทธิ์ ประมาณการและดัก ไม่มีใครรู้ว่าจะได้รับการทำนาย "ถูกต้อง" สำหรับรุ่น logit ของฉันได้อย่างไร แก้ไข เพื่อชี้แจงข้อกังวลของฉันข้อมูลการตอบสนองของฉันมีการสังเกตในทุกระดับ >head(table(y)) y 0 1 2 3 4 5 29 21 19 27 15 16 ที่ซึ่งตัวแปรทำนายของฉันดูเหมือนจะพัวพัน > head(table(pr_out)) …

2
รุ่นอนุกรมเวลาของความแตกต่างของบันทึกดีกว่าอัตราการเติบโตหรือไม่
บ่อยครั้งที่ฉันเห็นผู้เขียนประเมินโมเดล "ความแตกต่างของบันทึก" เช่น log(yt)−log(yt−1)=log(yt/yt−1)=α+βxtlog⁡(yt)−log⁡(yt−1)=log⁡(yt/yt−1)=α+βxt\log (y_t)-\log(y_{t-1}) = \log(y_t/y_{t-1}) = \alpha + \beta x_t ฉันเห็นนี้มีความเหมาะสมที่จะเกี่ยวข้องกับไปสู่การเปลี่ยนแปลงในอัตราร้อยละขณะที่คือ(1)y t log ( y t ) I ( 1 )xtxtx_tytyty_tlog(yt)log⁡(yt)\log (y_t)I(1)I(1)I(1) แต่ความแตกต่างของบันทึกคือการประมาณและดูเหมือนว่าเราสามารถประมาณโมเดลได้โดยไม่ต้องมีการแปลงบันทึกเช่น yt/yt−1−1=(yt−yt−1)/yt−1=α+βxtyt/yt−1−1=(yt−yt−1)/yt−1=α+βxty_t/y_{t-1} -1 = (y_t - y_{t-1}) / y_{t-1}=\alpha+\beta x_t ยิ่งไปกว่านั้นอัตราการเติบโตจะอธิบายการเปลี่ยนแปลงเปอร์เซ็นต์อย่างแม่นยำในขณะที่ความแตกต่างของบันทึกจะประมาณการเปลี่ยนแปลงเปอร์เซ็นต์เท่านั้น อย่างไรก็ตามฉันพบว่าวิธีการบันทึกความแตกต่างถูกใช้บ่อยกว่ามาก ในความเป็นจริงแล้วการใช้อัตราการเติบโตดูเหมือนว่าเหมาะสมที่จะจัดการกับความคงที่ของความแตกต่างแรก ในความเป็นจริงฉันได้พบว่าการคาดการณ์กลายเป็นแบบเอนเอียง (บางครั้งเรียกว่าปัญหาการส่งข้อมูลย้อนกลับในวรรณกรรม) เมื่อเปลี่ยนตัวแปรบันทึกกลับไปเป็นข้อมูลระดับyt/yt−1yt/yt−1y_t/y_{t-1} ประโยชน์ของการใช้ความแตกต่างของบันทึกเปรียบเทียบกับอัตราการเติบโตคืออะไร มีปัญหาใด ๆ กับการเปลี่ยนแปลงอัตราการเติบโตหรือไม่? ฉันเดาว่าฉันขาดอะไรไปไม่งั้นก็ดูเหมือนว่าจะใช้วิธีนี้บ่อยขึ้น

2
ความแตกต่างในความแตกต่างกับข้อมูลแผงระดับบุคคล
วิธีที่ถูกต้องในการระบุความแตกต่างในรูปแบบที่แตกต่างกับข้อมูลแผงระดับบุคคลคืออะไร? นี่คือการตั้งค่า: สมมติว่าฉันมีข้อมูลแผงระดับบุคคลที่ฝังอยู่ในเมืองเป็นเวลาหลายปีและการรักษาแตกต่างกันไปในระดับเมืองปี อย่างเป็นทางการให้เป็นผลสำหรับแต่ละในเมืองและในปีและเป็นหุ่นสำหรับว่าแทรกแซงได้รับผลกระทบเมืองในปีทีตัวประมาณ DiD ทั่วไปเช่นที่ระบุไว้ใน Bertrand et al (2004, p. 250) ขึ้นอยู่กับแบบจำลอง OLS แบบง่าย ๆ ที่มีคำที่มีผลคงที่สำหรับเมืองและปี:ฉันs T D s T s TYฉันเป็นคนทีYผมsเสื้อy_{ist}ผมผมisssเสื้อเสื้อtDs TDsเสื้อD_{st}sssเสื้อเสื้อt Yฉันเป็นคนที= As+ Bเสื้อ+ c Xฉันเป็นคนที+ βDs T+ ϵฉันเป็นคนทีYผมsเสื้อ=As+Bเสื้อ+คXผมsเสื้อ+βDsเสื้อ+εผมsเสื้อ y_{ist} = A_{s} + B_t + cX_{ist} + \beta D_{st} + \epsilon_{ist} แต่ผู้ประมาณนั้นเพิกเฉยต่อโครงสร้างพาเนลระดับบุคคล (เช่นการสังเกตหลายอย่างสำหรับแต่ละคนในเมือง) หรือไม่? มันสมเหตุสมผลไหมที่จะขยายโมเดลนี้ด้วยเอฟเฟกต์คำคงที่แต่ละระดับ ? แอปพลิเคชั่น …

2
เศรษฐมิติของวิธีการแบบเบย์ต่อวิธีการศึกษาเหตุการณ์
การศึกษาเหตุการณ์นั้นเกิดขึ้นอย่างกว้างขวางในด้านเศรษฐศาสตร์และการเงินเพื่อกำหนดผลกระทบของเหตุการณ์ที่เกิดขึ้นกับราคาหุ้น การถดถอย OLS - ในช่วงเวลาการอ้างอิงซึ่งแตกต่างจากหน้าต่างเหตุการณ์ - มักจะใช้เพื่อกำหนดพารามิเตอร์ที่จำเป็นในการสร้างแบบจำลองผลตอบแทนปกติสำหรับสินทรัพย์ หนึ่งแล้วกำหนดนัยสำคัญทางสถิติของผลตอบแทนที่ผิดปกติสะสม ( ) ของสินทรัพย์ต่อไปนี้เหตุการณ์ในช่วงเหตุการณ์ที่ระบุหน้าต่างจากเพื่อT_2การทดสอบสมมติฐานใช้เพื่อกำหนดว่าผลตอบแทนเหล่านี้มีนัยสำคัญหรือไม่ดังนั้นจึงผิดปกติหรือไม่ ดังนั้น:i T 1 T 2CARCAR\text{CAR}iiiT1T1T_1T2T2T_2 H0:CARi=0H0:CARi=0H_0 : \text{CAR}_i = 0 , ที่ไหน CARi=∑T2t=T1ARi,t=∑T2t=T1(ri,t−E[ri,t])CARi=∑t=T1T2ARi,t=∑t=T1T2(ri,t−E[ri,t])\text{CAR}_i = \sum_{t=T_1}^{T_2} \text{AR}_{i,t} = \sum_{t=T_1}^{T_2} \left( r_{i,t} -\mathbb{E}[r_{i,t}] \right)และ E[ri,t]E[ri,t]\mathbb{E}[r_{i,t}]คือผลตอบแทนของสินทรัพย์ที่คาดการณ์โดยแบบจำลอง หากจำนวนการสังเกตของเรามีขนาดใหญ่พอเราสามารถสันนิษฐานว่าเป็นเรื่องปกติเชิงเส้นกำกับของการกระจายผลตอบแทนของสินทรัพย์ แต่สิ่งนี้อาจไม่ได้รับการตรวจสอบสำหรับขนาดตัวอย่างที่เล็กลง มันอาจจะเป็นที่ถกเถียงกันอยู่ว่าเพราะเหตุนี้ บริษัท เดียว - เหตุการณ์การศึกษาเดียว (ตามที่ต้องการเช่นในคดี) ควรทำตามวิธีการแบบเบส์เพราะข้อสันนิษฐานของการทำซ้ำหลายครั้งอย่างไม่มีที่สิ้นสุด "มากขึ้นจากการตรวจสอบ" มากกว่าในกรณี ของหลาย บริษัท แต่วิธีการของผู้ใช้บ่อยยังคงเป็นเรื่องธรรมดา เมื่อพิจารณาจากวรรณกรรมที่ขาดแคลนในเรื่องนี้คำถามของฉันคือทำอย่างไรจึงจะเข้าใกล้การศึกษาเหตุการณ์ได้ดีที่สุดซึ่งคล้ายกับวิธีการที่อธิบายไว้ข้างต้นและสรุปในMacKinlay, 1997โดยใช้วิธี …

1
ทดสอบว่าสัมประสิทธิ์การถดถอยสองตัวนั้นแตกต่างกันอย่างมีนัยสำคัญ (ในอุดมคติ R)
หากนี่เป็นคำถามที่ซ้ำกันโปรดชี้ไปที่วิธีที่ถูกต้อง แต่คำถามที่คล้ายกันที่ฉันพบที่นี่ยังไม่ได้คล้ายกันเพียงพอ สมมติว่าฉันประเมินโมเดลY= α + βX+ uY=α+βX+ยูY=\alpha + \beta X + u และพบว่า 0 แต่มันกลับกลายเป็นว่าX = X 1 + X 2และฉันสงสัยว่า∂ Y / ∂ X 1 ≠ ∂ Y / ∂ X 2และโดยเฉพาะอย่างยิ่งที่∂ Y / ∂ X 1 > ∂ Y / ∂ X 2 ดังนั้นฉันจึงประเมินโมเดลY = α + β …

1
ตัวแปรเครื่องมือจัดการกับอคติการเลือกอย่างไร
ฉันสงสัยว่าตัวแปรเครื่องมือจัดการอคติการเลือกอย่างไรในการถดถอย นี่คือตัวอย่างที่ฉันกำลังพูดถึง: ในเศรษฐมิติที่ไม่เป็นอันตรายส่วนใหญ่ผู้เขียนอภิปรายเกี่ยวกับการถดถอย IV ที่เกี่ยวข้องกับการรับราชการทหารและรายได้ในภายหลัง คำถามคือ "การรับราชการในกองทัพเพิ่มหรือลดรายได้ในอนาคตหรือไม่" พวกเขาสำรวจคำถามนี้ในบริบทของสงครามเวียดนาม ฉันเข้าใจว่าการรับราชการทหารไม่สามารถสุ่มมอบหมายได้และนี่เป็นปัญหาสำหรับการอนุมานเชิงสาเหตุ ในการแก้ไขปัญหานี้ผู้วิจัยใช้ร่างเกณฑ์ (เช่นใน "หมายเลขร่างของคุณเรียกว่า") เป็นเครื่องมือสำหรับการรับราชการทหารที่แท้จริง ที่ทำให้ความรู้สึก: ร่างเวียดนามสุ่มมอบหมายคนอเมริกันหนุ่มทหาร (ในทางทฤษฎี - ไม่ว่านาวิกเสิร์ฟจริงสัมผัสกับคำถามของฉัน) เงื่อนไข IV อื่น ๆ ของเราดูแข็งแกร่ง: การมีสิทธิ์เข้าร่วมร่างและการเกณฑ์ทหารที่แท้จริงนั้นมีความสัมพันธ์กันในทางบวก นี่คือคำถามของฉัน ดูเหมือนว่าคุณจะได้รับอคติในการเลือกตนเอง: บางทีเด็ก ๆ ที่ร่ำรวยขึ้นอาจออกจากการรับใช้ในเวียดนามแม้ว่าจะมีการเรียกหมายเลขร่าง (ถ้าไม่ใช่อย่างนั้นจริง ๆ ลองทำเพื่อคำถามของฉัน) หากการเลือกตนเองนี้สร้างอคติเชิงระบบภายในตัวอย่างของเราตัวแปรเครื่องมือของเราจะจัดการอคตินี้อย่างไร เราต้อง จำกัด ขอบเขตการอนุมานของเราให้แคบลงหรือไม่ "ประเภทของคนที่ไม่สามารถหลบหนีจากร่างได้" หรือ IV ก็กอบกู้บางส่วนของการอนุมานของเรา? หากใครสามารถอธิบายวิธีการทำงานนี้ฉันจะขอบคุณมาก

1
ค่าสัมประสิทธิ์จินีและขอบเขตข้อผิดพลาด
ฉันมีชุดข้อมูลเวลาที่มี N = 14 นับในแต่ละช่วงเวลาและฉันต้องการคำนวณค่าสัมประสิทธิ์ Gini และข้อผิดพลาดมาตรฐานสำหรับการประมาณนี้ในแต่ละช่วงเวลา เนื่องจากฉันมีเพียง N = 14 นับในแต่ละครั้งที่ฉันดำเนินการคำนวณความแปรปรวนของขนุนคือจากสม 7 ของ Tomson Ogwang 'วิธีการที่สะดวกในการคำนวณดัชนี Gini และ' ข้อผิดพลาดมาตรฐาน' ที่ไหนเป็นสัมประสิทธิ์จีนีของค่า N โดยไม่ต้ององค์ประกอบและเป็นค่าเฉลี่ยของk)var( G ) = n - 1n× ∑nk = 1( G ( n , k ) - G¯( n ) )2var⁡(G)=n-1n×Σk=1n(G(n,k)-G¯(n))2\operatorname{var}(G) = \frac{n-1}{n} \times \sum_{k=1}^n (G(n,k)-\bar{G}(n))^2G ( n …

1
วิธีการตีความสัมประสิทธิ์ระยะที่สองในการถดถอยตัวแปรเครื่องมือด้วยเครื่องมือไบนารีและตัวแปรภายนอกไบนารี?
(โพสต์ค่อนข้างยาวขออภัยมีข้อมูลพื้นหลังมากมายดังนั้นโปรดข้ามไปที่คำถามด้านล่าง) Intro:ฉันกำลังทำงานในโครงการที่เรากำลังพยายามที่จะระบุผลกระทบของตัวแปรภายนอกไบนารีบนผลอย่างต่อเนื่องปีเราได้สร้างเครื่องมือขึ้นมาซึ่งเราเชื่อมั่นอย่างยิ่งว่าจะได้รับการมอบหมายแบบสุ่มx1x1x_1YyyZ1z1z_1 ข้อมูล:ข้อมูลอยู่ในโครงสร้างแผงซึ่งมีการสังเกตการณ์ประมาณ 34,000 ครั้งกระจายไปทั่ว 1,000 หน่วยและประมาณ 56 ช่วงเวลา ใช้ค่า 1 สำหรับการสังเกตประมาณ 700 (2%) และทำประมาณ 3000 (9%) 111 (0.33%) สังเกตคะแนน 1 ทั้งและและมันก็เป็นสองเท่าแนวโน้มสำหรับข้อสังเกตที่จะทำคะแนน 1ถ้ามันยังคะแนน 1 z_1x1x1x_1Z1z1z_1Z1z1z_1x1x1x_1x1x1x_1Z1z1z_1 การประมาณ:เราประเมินโมเดล 2SLS ต่อไปนี้ผ่านขั้นตอน ivreg2 ของ Stata: x1=π0+π1Z1+ Z π+ vx1=π0+π1z1+Zπ+vx_1 = \pi_0 + \pi_1z_1 + \mathbf{Z}\mathbf{\pi} + v Y=β0+β1x* * * *1+ Z β+ uy=β0+β1x1∗+Zβ+uy …

3
สมมติฐานเชิงเส้นตรงในการถดถอยเชิงเส้นเป็นเพียงนิยามของหรือไม่?
ฉันกำลังแก้ไขการถดถอยเชิงเส้น หนังสือเรียนของ Greene กล่าวว่า: ตอนนี้แน่นอนจะมีสมมติฐานอื่น ๆ ในรูปแบบการถดถอยเชิงเส้นเช่น 0 สมมติฐานนี้รวมกับข้อสมมติเชิงเส้นตรง (ซึ่งมีผลบังคับใช้กำหนด ) วางโครงสร้างบนแบบจำลองϵE(ϵ|X)=0E(ϵ|X)=0E(\epsilon|X)=0ϵϵ\epsilon อย่างไรก็ตามการวางตัวเป็นเส้นตรงด้วยตัวมันเองไม่ได้วางโครงสร้างใด ๆ ไว้ในแบบจำลองของเราเนื่องจากสามารถทำได้โดยพลการอย่างสมบูรณ์ สำหรับตัวแปรใด ๆไม่ว่าอะไรก็ตามความสัมพันธ์ระหว่างเราสองคนนั้นสามารถกำหนดเช่นนั้นเพื่อให้สมมติฐานเชิงเส้นตรง ดังนั้นความเป็นเส้นตรง "สมมติฐาน" ควรเรียกว่านิยามของๆ แทนที่จะเป็นข้อสมมติX , y ϵ ϵϵϵ\epsilonX,yX,yX, yϵϵ\epsilonϵϵ\epsilon ดังนั้นฉันสงสัย : กรีนเป็นคนเลอะเทอะหรือเปล่า? จริง ๆ แล้วเขาควรจะเขียน: ? นี่คือ "สมมติฐานเชิงเส้นตรง" ที่วางโครงสร้างในแบบจำลองE(y|X)=XβE(y|X)=XβE(y|X)=X\beta หรือฉันต้องยอมรับว่าการวางตัวเป็นเส้นตรงไม่ได้วางโครงสร้างลงบนแบบจำลอง แต่จะกำหนดเท่านั้นโดยที่สมมติฐานอื่น ๆ จะใช้นิยามของเพื่อวางโครงสร้างบนแบบจำลองϵϵϵ\epsilonϵϵ\epsilon แก้ไข : เนื่องจากมีความสับสนรอบสมมติฐานอื่นให้ฉันเพิ่มชุดเต็มของสมมติฐานที่นี่: นี่คือจากกรีน, การวิเคราะห์ทางเศรษฐมิติ, 7 เอ็ด พี 16

2
ค่าเฉลี่ยความหมายแบบมีเงื่อนไขหมายถึงความเป็นกลางและความสอดคล้องของตัวประมาณค่า OLS
พิจารณาโมเดลการถดถอยหลายแบบต่อไปนี้:Y=Xβ+Zδ+U.(1)(1)Y=Xβ+Zδ+U.Y=X\beta+Z\delta+U.\tag{1} นี่คือคือคอลัมน์เวกเตอร์ aเมทริกซ์ ; aคอลัมน์เวกเตอร์ aเมทริกซ์; aเวกเตอร์คอลัมน์; และ , ข้อผิดพลาด, เวกเตอร์คอลัมน์YYYn×1n×1n\times 1XXXn×(k+1)n×(k+1)n\times (k+1)ββ\beta(k+1)×1(k+1)×1(k+1)\times 1ZZZn×ln×ln\times lδδ\deltal×1l×1l\times 1UUUn×1n×1n\times1 คำถาม อาจารย์ของฉันหนังสือแนะนำเศรษฐมิติฉบับที่ 3 โดย James H. Stock and Mark W. Watson, p. 281 และเศรษฐมิติ: Honor's Exam Review Session (PDF) , p. 7 ได้แสดงต่อไปนี้กับฉัน หากเราถือว่าสิ่งที่เรียกว่าความเป็นอิสระแบบมีเงื่อนไขซึ่งตามคำจำกัดความหมายความว่าE(U|X,Z)=E(U|Z),(2)(2)E(U|X,Z)=E(U|Z),E(U|X,Z)=E(U|Z),\tag{2} และถ้าการสันนิษฐานของสี่เหลี่ยมจัตุรัสน้อยที่สุดเป็นไปตามเงื่อนไขยกเว้นค่าศูนย์ที่เป็นเงื่อนไข (ดังนั้นเราจึงถือว่า ) (ดู 1 -3 ด้านล่าง),E(U|X,Z)=0E(U|X,Z)=0E(U|X,Z)=0E(U|X,Z)=E(U|Z)≠0E(U|X,Z)=E(U|Z)≠0E(U|X,Z)=E(U|Z) \neq 0 จากนั้นตัวประมาณ …

1
ฟังก์ชันความน่าจะเป็นที่ได้รับสำหรับ IV-probit
ดังนั้นฉันจึงมีรูปแบบไบนารี่โดยที่เป็นตัวแปรที่ไม่ซ่อนเร้นและข้อสังเกต กำหนดและจึงเป็นเครื่องมือของฉัน ดังนั้นในระยะสั้นรูปแบบคือ เนื่องจากข้อกำหนดข้อผิดพลาดไม่ขึ้นกับ แต่ ฉันใช้ประโยชน์จากรุ่น IV-probity∗1y1∗y_1^*y1∈{0,1}y1∈{0,1}y_1 \in \{0,1\}y2y2y_2y1y1y_1z2z2z_2y∗1y2y1===δ1z1+α1y2+u1δ21z1+δ22z2+v2=zδ+v21[y∗>0]y1∗=δ1z1+α1y2+u1y2=δ21z1+δ22z2+v2=zδ+v2y1=1[y∗>0]\begin{eqnarray} y_1^*&=& \delta_1 z_1 + \alpha_1 y_2 + u_1 \\ y_2 &=& \delta_{21} z_1 + \delta_{22}z_2 + v_2 = \textbf{z}\delta + v_2 \\ y_1 &=& \text{1}[y^*>0] \end{eqnarray}(u1v2)∼N(0,[1ηητ2]).(u1v2)∼N(0,[1ηητ2]).\begin{eqnarray} \begin{pmatrix} u_1 \\ v_2 \end{pmatrix} \sim \mathcal{N} \left(\textbf{0} \; , \begin{bmatrix} 1 &\eta \\ \eta …

2
ทำไมข้อผิดพลาดการวัดในตัวแปรตามไม่ทำให้เกิดผลลัพธ์
เมื่อมีข้อผิดพลาดในการวัดในตัวแปรอิสระฉันเข้าใจว่าผลลัพธ์นั้นจะเอนเอียงกับ 0 เมื่อตัวแปรที่ขึ้นอยู่กับการวัดที่มีข้อผิดพลาดพวกเขาบอกว่ามันมีผลต่อข้อผิดพลาดมาตรฐาน แต่สิ่งนี้ไม่สมเหตุสมผลสำหรับฉันเพราะเรา การประเมินผลของไม่ได้อยู่ในตัวแปรดั้งเดิมแต่มีผลต่ออื่น ๆรวมถึงข้อผิดพลาด ดังนั้นสิ่งนี้จะไม่ส่งผลกระทบต่อประมาณการ ในกรณีนี้ฉันสามารถใช้ตัวแปรเครื่องมือเพื่อลบปัญหานี้ได้หรือไม่XXXYYYYYY

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.