คำตอบนี้หวังที่จะให้ความหมายที่เข้าใจง่ายของทฤษฎีบทขีด จำกัด กลางโดยใช้เทคนิคแคลคูลัสอย่างง่าย (เทย์เลอร์ส่วนขยายของลำดับ 3) นี่คือโครงร่าง:
- สิ่งที่ CLT พูด
- หลักฐานที่ใช้งานง่ายของ CLT โดยใช้แคลคูลัสอย่างง่าย
- ทำไมการกระจายปกติ?
เราจะพูดถึงการแจกแจงแบบปกติตอนท้ายสุด เพราะความจริงที่ว่าการแจกแจงแบบปกติในที่สุดก็เกิดขึ้นไม่ได้มีสัญชาตญาณมากนัก
1. ทฤษฎีบทขีด จำกัด กลางพูดว่าอะไร? CLT หลายรุ่น
มีรุ่น euivalent หลายรุ่นของ CLT คำสั่งในตำราเรียนของ CLT กล่าวว่าสำหรับจริงและลำดับของตัวแปรสุ่มอิสระใด ๆด้วยค่าศูนย์และค่าความแปรปรวน 1,
เพื่อให้เข้าใจถึงสิ่งที่เป็นสากลและใช้งานง่ายเกี่ยวกับ CLT ขอให้ลืมข้อ จำกัด สักครู่ ข้อความข้างต้นบอกว่าถ้า และเป็นสองลำดับของตัวแปรสุ่มอิสระแต่ละตัวมีค่าศูนย์และค่าแปรปรวน 1 แล้ว
xX1,⋯,Xn
P(X1+⋯+Xnn−−√≤x)→n→+∞∫x−∞e−t2/22π−−√dt.
X1.,…,XnZ1,…,ZnE[f(X1+⋯+Xnn√)]−E[f(Z1+⋯+Znn√)]→n→+∞0
สำหรับตัวบ่งชี้ฟังก์ชันของรูปแบบสำหรับการแก้ไขจริง ,
จอแสดงผลก่อนหน้านี้แสดงถึงความจริงที่ว่าขีด จำกัด นั้นเหมือนกันไม่ว่าจะมีการแจกแจงโดยเฉพาะของและโดยมีเงื่อนไขว่าตัวแปรสุ่มมีความเป็นอิสระด้วยค่าเฉลี่ยศูนย์ความแปรปรวนอย่างใดอย่างหนึ่ง
fxf(t)={1 if t<x0 if t≥x.
X1,…,XnZ1,…,Zn
CLT เวอร์ชันอื่นบางเวอร์ชันระบุถึงคลาสของฟังก์ชัน Lipschtiz ที่ล้อมรอบด้วย 1; บางรุ่นอื่น ๆ ของ CLT กล่าวถึงระดับของการทำงานที่ราบรื่นกับอนุพันธ์ขอบเขตของการสั่งซื้อkพิจารณาสองลำดับและข้างต้นและสำหรับบางฟังก์ชั่นผลลัพธ์การคอนเวอร์เจนซ์ (CONV)kX1,…,XnZ1,…,Znf
E[f(X1+⋯+Xnn√)]−E[f(Z1+⋯+Znn√)]→n→+∞0(CONV)
มันเป็นไปได้ที่จะสร้างความเท่าเทียมกัน ("ถ้าเพียง แต่ถ้า") ระหว่างคำสั่งต่อไปนี้:
- (CONV) ข้างต้นถือสำหรับทุกฟังก์ชั่นตัวบ่งชี้ของรูปแบบสำหรับและสำหรับบางจริงคงxff(t)=1t<xf(t)=0t≥xx
- (CONV) ถือหุ้นทุกฟังก์ชั่น Lipschitz boundedRf:R→R
- (CONV) สำหรับทุกฟังก์ชั่นที่ราบรื่น (เช่น ) พร้อมการรองรับที่กะทัดรัดC∞
- (CONV) เก็บไว้สำหรับทุกฟังก์ชั่นสามครั้งอย่างต่อเนื่อง differentiable กับ1fsupx∈R|f′′′(x)|≤1
คะแนนทั้งสี่ด้านบนบอกว่าการบรรจบกันนั้นมีไว้สำหรับฟังก์ชั่นใหญ่ ๆ เราสามารถอ่านผู้อ่านถึงบทที่ 7 หน้า 77 ของหนังสือเดวิดพอลลาร์ดคู่มือผู้ใช้ในการวัดความน่าจะเป็นเชิงทฤษฎีซึ่งคำตอบนี้ได้รับแรงบันดาลใจอย่างสูง
สมมติฐานของเราสำหรับคำตอบที่เหลืออยู่นี้ ...
เราจะสมมติว่าสำหรับค่าคงที่ซึ่งตรงกับจุดที่ 4 ด้านบน นอกจากนี้เรายังจะสมมติว่าตัวแปรสุ่มมีขอบเขต จำกัด ช่วงเวลาที่สาม:และ
มี จำกัดsupx∈R|f′′′(x)|≤CC>0E[|Xi|3]E[|Zi|3]
2. ค่าของเป็นสากล: ไม่ขึ้นอยู่กับการกระจายของE[f(X1+⋯+Xnn√)]X1,...,Xn
ขอให้เราแสดงให้เห็นว่าปริมาณนี้เป็นสากล (มากถึงข้อผิดพลาดเล็ก ๆ ) ในแง่ที่ว่ามันไม่ได้ขึ้นอยู่กับการรวบรวมตัวแปรสุ่มแบบอิสระที่มีให้ ใช้และสองลำดับของตัวแปรสุ่มอิสระโดยแต่ละค่าเฉลี่ย 0 และความแปรปรวน 1 และช่วงเวลาที่สามที่แน่นอนX1,…,XnZ1,…,Zn
แนวคิดคือการแทนที่ด้วยในปริมาณหนึ่งและควบคุมความแตกต่างด้วยแคลคูลัสพื้นฐาน (ฉันเชื่อว่าเป็นเพราะ Lindeberg) โดยการขยายตัวของเทย์เลอร์หากและดังนั้น
โดยที่และXiZiW=Z1+⋯+Zn−1h(x)=f(x/n−−√)h(Z1+⋯+Zn−1+Xn)h(Z1+⋯+Zn−1+Zn)=h(W)+Xnh′(W)+X2nh′′(W)2+X3n/h′′′(Mn)6=h(W)+Znh′(W)+Z2nh′′(W)2+Z3nh′′′(M′n)6
MnM′nเป็นจุดกึ่งกลางที่กำหนดโดยทฤษฎีบทค่าเฉลี่ย การรับความคาดหวังของทั้งสองบรรทัดคำสั่ง zeroth เหมือนกันเงื่อนไขการสั่งซื้อครั้งแรกมีค่าเท่ากันเพราะโดยความเป็นอิสระของและ ,และคล้ายกันสำหรับบรรทัดที่สอง คำสั่งที่สองนั้นเหมือนกันโดยอิสระ คำเดียวที่เหลืออยู่คือคำสั่งที่สามและโดยความคาดหวังความแตกต่างระหว่างสองบรรทัดนั้นมากที่สุด
นี่เป็นขอบเขตบนอนุพันธ์ที่สามของ''' ตัวส่วนปรากฏขึ้นเนื่องจากXnWE[Xnh′(W)]=E[Xn]E[h′(W)]=0
(C/6)E[|Xn|3+|Zn|3](n−−√)3.
Cf′′′(n−−√)3h′′′(t)=f′′′(t/n−−√)/(n−−√)3 3
โดยความเป็นอิสระการมีส่วนร่วมของในผลรวมนั้นไม่มีความหมายเพราะสามารถแทนที่ด้วยโดยไม่เกิดข้อผิดพลาดที่ใหญ่กว่าจอแสดงผลด้านบน!XnZn
ตอนนี้เรายังคงคำแนะนำเพื่อแทนที่โดย{n-1} ถ้าดังนั้น
โดยความเป็นอิสระของและและโดยความเป็นอิสระของและXn−1Zn−1W~=Z1+Z2+⋯+Zn−2+Xnh(Z1+⋯+Zn−2+Xn−1+Xn)h(Z1+⋯+Zn−2+Zn−1+Xn)=h(W~)+Xn−1h′(W~)+X2n−1h′′(W~)2+X3n−1/h′′′(M~n)6=h(W~)+Zn−1h′(W~)+Z2n−1h′′(W~)2+Z3n−1/h′′′(M~n)6.
Zn−1W~Xn−1W~ศูนย์อีกครั้ง, เงื่อนไขการสั่งซื้อครั้งแรกและครั้งที่สองมีค่าเท่ากันในทั้งคู่ ความแตกต่างของความคาดหวังระหว่างสองบรรทัดนั้นมากที่สุด
เราให้ทำซ้ำจนกว่าเราจะแทนที่ทั้งหมด 's กับ ' s โดยการเพิ่มข้อผิดพลาดที่ทำในแต่ละขั้นตอนเราได้รับ
ตาม
(C/6)E[|Xn−1|3+|Zn−1|3](n−−√)3.
ZiXin∣∣E[f(X1+⋯+Xnn√)]−E[f(Z1+⋯+Znn√)]∣∣≤n(C/6)maxi=1,…,nE[|Xi|3+|Zi|3](n−−√)3.
nเพิ่มขึ้นทางด้านขวามือจะมีขนาดเล็กตามอำเภอใจถ้าช่วงเวลาที่สามหรือตัวแปรสุ่มมี จำกัด (สมมติว่าเป็นกรณี) ซึ่งหมายความว่าการคาดการณ์ทางด้านซ้ายกลายเป็นพลใกล้ ๆ กันไม่ว่าหากการกระจายของอยู่ไกลจากที่Z_1
โดยเป็นอิสระมีส่วนร่วมของแต่ละในผลรวมเป็นความหมายเพราะมันจะถูกแทนที่ด้วยโดยไม่เกิดข้อผิดพลาดที่มีขนาดใหญ่กว่า3)
และแทนที่ทั้งหมด 's โดย ' s ไม่เปลี่ยนแปลงปริมาณมากกว่าn)
X1,…,XnZ1,…,ZnXiZiO(1/(n−−√)3)XiZiO(1/n−−√)
ความคาดหวังเป็นสากลจึงไม่ขึ้นอยู่กับการกระจายของX_1ในทางตรงกันข้ามความเป็นอิสระและมีความสำคัญสูงสุดสำหรับขอบเขตด้านบนE[f(X1+⋯+Xnn√)]X1,…,XnE[Xi]=E[Zi]=0,E[Z2i]=E[X2i]=1
3. ทำไมการกระจายปกติ?
เราได้เห็นแล้วว่าความคาดหวังจะเหมือนกันไม่ว่าการกระจายของจะเป็นเท่าข้อผิดพลาดเล็ก ๆ ของการสั่งซื้อn)E[f(X1+⋯+Xnn√)]XiO(1/n−−√)
แต่สำหรับการใช้งานมันจะมีประโยชน์ในการคำนวณปริมาณ นอกจากนี้ยังจะเป็นประโยชน์ที่จะได้รับการแสดงออกที่เรียบง่ายสำหรับปริมาณนี้ขวา]E[f(X1+⋯+Xnn√)]
เนื่องจากปริมาณนี้เท่ากันสำหรับคอลเลกชันใด ๆเราสามารถเลือกหนึ่งคอลเล็กชันที่เจาะจงเช่นการแจกจ่ายง่ายต่อการคำนวณหรือจดจำได้ง่ายX1,…,Xn(X1+⋯+Xn)/n−−√
สำหรับการแจกแจงปกติมันเกิดขึ้นว่าปริมาณนี้กลายเป็นเรื่องง่ายมาก แน่นอนถ้าคือ iidดังนั้นมีการกระจายและมันก็ไม่ได้ขึ้นอยู่กับ ! ดังนั้นถ้าดังนั้น
และด้วยเหตุผลข้างต้นสำหรับคอลเลกชันของตัวแปรสุ่มอิสระกับจากนั้นN(0,1)Z1,…,ZnN(0,1)Z1+⋯+Znn√N(0,1)nZ∼N(0,1)X1,
E[f(Z1+⋯+Znn−−√)]=E[f(Z)],
X1,…,XnE[Xi]=0,E[X2i]=1
∣∣∣E[f(X1+⋯+Xnn−−√)]−E[f(Z)∣∣∣≤supx∈R|f′′′(x)|maxi=1,…,nE[|Xi|3+|Z|3]6n−−√.