คุณไม่จำเป็นต้องมีข้อสมมติฐานในช่วงเวลาที่ 4 เพื่อความสอดคล้องของตัวประมาณค่า OLS แต่คุณจำเป็นต้องมีข้อสมมติฐานในช่วงเวลาที่สูงขึ้นของx และ ε สำหรับค่าปกติเชิงเส้นกำกับและประมาณค่าอย่างสม่ำเสมอว่าเมทริกซ์ความแปรปรวนร่วมซีโมติกเป็นอย่างไร
ในบางแง่มุมนั่นคือจุดทางคณิตศาสตร์และทางเทคนิคไม่ใช่จุดที่ใช้งานได้จริง สำหรับ OLS จะทำงานได้ดีในกลุ่มตัวอย่างที่ จำกัด ในบางแง่มุมต้องมากกว่าสมมติฐานขั้นต่ำที่จำเป็นในการบรรลุความมั่นคงเชิงเส้นหรือเชิงบรรทัดฐานเช่นn → ∞.
เงื่อนไขที่เพียงพอสำหรับความสอดคล้อง:
หากคุณมีสมการการถดถอย:
yi=x′iβ+ϵi
ตัวประมาณ OLSสามารถเขียนเป็น:
b^
b^=β+(X′Xn)−1(X′ϵn)
เพื่อความสอดคล้องคุณจะต้องสามารถใช้กฎของตัวเลขขนาดใหญ่ของ Kolmogorov หรือในกรณีของอนุกรมเวลาที่มีการพึ่งพาอนุกรมสิ่งที่คล้ายกับทฤษฎีบท Ergodic ของ Karlin และ Taylor เพื่อ:
1nX′X→pE[xix′i]1nX′ϵ→pE[x′iϵi]
สมมติฐานอื่น ๆ ที่จำเป็นคือ:
- E[xix′i]นั้นเต็มยศและเมทริกซ์นั้นกลับด้านได้
- regressors มีการกำหนดไว้อย่างเคร่งครัดหรือภายนอกเพื่อให้{0}E[xiϵi]=0
จากนั้นและคุณได้รับ(X′Xn)−1(X′ϵn)→p0b^→pβ
หากคุณต้องการทฤษฎีบทขีด จำกัด กลางเพื่อนำไปใช้แล้วคุณจะต้องตั้งสมมติฐานเกี่ยวกับช่วงเวลาที่สูงขึ้นเช่นที่\ ทฤษฎีขีด จำกัด กลางคือสิ่งที่ให้คุณเป็นค่าปกติเชิงเส้นกำกับของและช่วยให้คุณสามารถพูดคุยเกี่ยวกับข้อผิดพลาดมาตรฐาน สำหรับช่วงเวลาที่สองอยู่คุณจำเป็นต้องมีช่วงเวลาที่ 4 ของและอยู่ คุณต้องการยืนยันว่าที่ไหนE[gig′i]gi=xiϵib^E[gig′i]xϵn−−√(1n∑ix′iϵi)→dN(0,Σ)Σ=E[xix′iϵ2i]ขวา] เพื่อให้การทำงานต้องมีขอบเขตแน่นอนΣ
การอภิปรายที่ดี (ซึ่งมีแรงจูงใจในโพสต์นี้) จะได้รับในฮายาชิของเศรษฐ (ดูเพิ่มเติมที่ 149 สำหรับช่วงเวลาที่ 4 และการประมาณค่าความแปรปรวนร่วม)
อภิปรายผล:
ข้อกำหนดเหล่านี้ในช่วงเวลาที่ 4 อาจเป็นจุดทางเทคนิคมากกว่าจุดที่ใช้งานได้จริง คุณอาจจะไม่ได้พบกับการกระจายทางพยาธิวิทยาที่นี่เป็นปัญหาในข้อมูลทุกวัน? มันเป็นเรื่องธรรมดาสามัญหรือข้อสันนิษฐานอื่น ๆ ของ OLS ที่จะผิดไป
คำถามที่แตกต่างที่ไม่ต้องสงสัยตอบที่อื่นใน Stackexchange คือตัวอย่างที่คุณต้องการสำหรับกลุ่มตัวอย่างที่ จำกัด เพื่อให้ได้ผลลัพธ์ที่ใกล้เคียงที่สุด มีความรู้สึกที่ค่าผิดปกติที่ยอดเยี่ยมนำไปสู่การบรรจบกันช้า ตัวอย่างเช่นลองประเมินค่าเฉลี่ยของการแจกแจงแบบปกติที่มีความแปรปรวนสูงมาก ค่าเฉลี่ยตัวอย่างเป็นค่าประมาณค่าเฉลี่ยที่สอดคล้องกันของค่าเฉลี่ยของประชากร แต่ในกรณีบันทึกปกติที่มีความเคอร์ติสเกินบ้า ฯลฯ ... (ตามลิงค์) ผลลัพธ์ตัวอย่าง จำกัด มีค่าค่อนข้างมาก
อนันต์กับอนันต์เป็นความแตกต่างที่สำคัญอย่างมากในวิชาคณิตศาสตร์ นั่นไม่ใช่ปัญหาที่คุณพบในสถิติประจำวัน ปัญหาการปฏิบัติมีมากขึ้นในหมวดหมู่ขนาดเล็กและขนาดใหญ่ ความแปรปรวน, เคิร์ตซีอุสและอื่น ๆ ... เล็กพอที่จะทำให้ฉันสามารถประมาณค่าได้ตามขนาดตัวอย่างใช่หรือไม่
ตัวอย่างทางพยาธิวิทยาที่ตัวประมาณ OLS มีความสอดคล้อง แต่ไม่ปกติ
พิจารณา:
yi=bxi+ϵi
ไหนแต่ถูกดึงมาจากเสื้อกับการกระจาย 2 องศาอิสระจึง\ ประมาณการ OLS มาบรรจบกันน่าจะเป็นแต่การกระจายตัวอย่างสำหรับประมาณการ OLSไม่ได้กระจาย ด้านล่างคือการแจกแจงเชิงประจักษ์สำหรับจาก 10,000 การจำลองของการถดถอยโดยมีการสังเกต 10,000 ครั้ง
xi∼N(0,1)ϵiVar(ϵi)=∞bb^b^
การกระจายของไม่ปกติหางมีน้ำหนักมาก แต่ถ้าคุณเพิ่มระดับความอิสระเป็น 3 เพื่อให้ช่วงเวลาที่สองของมีอยู่แล้วขีด จำกัด กลางจะถูกนำมาใช้และคุณจะได้รับ:
b^ϵi
รหัสที่จะสร้างมัน:
beta = [-4; 3.7];
n = 1e5;
n_sim = 10000;
for s=1:n_sim
X = [ones(n, 1), randn(n, 1)];
u = trnd(2,n,1) / 100;
y = X * beta + u;
b(:,s) = X \ y;
end
b = b';
qqplot(b(:,2));