อยู่ที่ไหน


36

ทฤษฎีบทกลาง จำกัด แบบง่ายมาก ซึ่งก็คือ Lindeberg – Lévy CLT ฉันไม่เข้าใจว่าทำไมมีทางด้านซ้ายมือ และ Lyapunov CLT บอกว่า แต่ทำไม ไม่ใช่ ? ทุกคนจะบอกฉันว่าเป็นปัจจัยเหล่านี้เช่นและ ? เราจะรับพวกเขาในทฤษฎีบทได้อย่างไร

n((1ni=1nXi)μ) d N(0,σ2)
n
1sni=1n(Xiμi) d N(0,1)
snn1sn

3
นี่คือคำอธิบายที่stats.stackexchange.com/questions/3734 คำตอบนั้นยาวเพราะถามว่า "ปรีชา" มันสรุปว่า "การประมาณอย่างง่าย ๆ นี้แม้ว่าจะแสดงให้เห็นว่า de Moivre ในขั้นต้นอาจสงสัยว่ามีการ จำกัด การกระจายทั่วไปว่าลอการิทึมของมันนั้นเป็นฟังก์ชันกำลังสองและสเกลปัจจัยที่เหมาะสมต้องเป็นสัดส่วนกับ ... . " snn
whuber

1
โดยสังหรณ์ใจถ้าทั้งหมดดังนั้นและบรรทัดที่ 2 ต่อจากบรรทัดที่ 1: หารด้วย (แน่นอนว่าสภาพ Lyapunov รวมกัน ทั้งหมดเป็นคำถามอื่น)σi=σsn=σi2=nσσ = s n
n((1ni=1nXi)μ)=1ni=1n(Xiμ)d N(0,σ2)
1σ=snnσ i
1ni=1n(Xiμ)snn=1sni=1n(Xiμi)d N(0,1)
σi
Sextus Empiricus

คำตอบ:


33

เป็นคำถามที่ดี (+1) !!

คุณจะจำไว้ว่าสำหรับตัวแปรสุ่มอิสระและ ,และ(X) ดังนั้นความแปรปรวนของคือและความแปรปรวนของเป็น nY V a r ( X + Y ) = V a r ( X ) + V a r ( Y ) V a r ( a X ) = a 2V a r ( X ) n ฉัน= 1 X i n i = 1 σ 2 = n σ 2 ˉXYVar(X+Y)=Var(X)+Var(Y)VaR(aX)=a2VaR(X)Σผม=1nXผมΣผม=1nσ2=nσ2nσ2/n2=σ2/nX¯=1nΣผม=1nXผมnσ2/n2=σ2/n

นี้มีไว้สำหรับความแปรปรวน ในการสร้างมาตรฐานตัวแปรสุ่มคุณหารด้วยค่าเบี่ยงเบนมาตรฐาน อย่างที่คุณทราบค่าที่คาดหวังของคือดังนั้นตัวแปร μX¯μ

N(0,

X¯-E(X¯)VaR(X¯)=nX¯-μσ
ได้คาดว่าค่า 0 และ 1 แปรปรวนดังนั้นถ้ามันมีแนวโน้มไปสู่การเสียนก็จะต้องมีมาตรฐานแบบเกาส์1) สูตรของคุณในสมการแรกนั้นเทียบเท่ากัน โดยการคูณด้านซ้ายมือโดยคุณตั้งค่าความแปรปรวนไป 2σ σ 2ยังไม่มีข้อความ(0,1)σσ2

เกี่ยวกับประเด็นที่สองของคุณฉันเชื่อว่าสมการที่แสดงด้านบนแสดงให้เห็นว่าคุณต้องหารด้วยไม่ใช่เพื่อสร้างมาตรฐานของสมการอธิบายว่าทำไมคุณใช้ (ตัวประมาณของและไม่{s_n}σ snσ)σsnσ)sn

นอกจากนี้: @whuber แสดงให้เห็นเพื่อหารือเกี่ยวกับเหตุผลของการปรับขนาดโดย{n} เขาทำที่นั่นแต่เพราะคำตอบนั้นยาวมากฉันจะพยายามจับแก่นแท้ของการโต้เถียงของเขา (ซึ่งเป็นการสร้างความคิดของเดอโมเอฟร์ขึ้นมาใหม่)n

หากคุณเพิ่มจำนวนมากของ +1 และ -1 คุณสามารถประมาณความน่าจะเป็นที่ผลรวมจะเป็นโดยการนับเบื้องต้น บันทึกการนี้น่าจะเป็นสัดส่วนกับ n ดังนั้นถ้าเราต้องการความเป็นไปได้ดังกล่าวข้างต้นจะมาบรรจบกันที่จะคงเป็นไปขนาดใหญ่เราต้องใช้ปัจจัย normalizing ใน{n})j - j 2 / n n O ( nJ-J2/nnO(n)

การใช้เครื่องมือทางคณิตศาสตร์ที่ทันสมัย ​​(post de Moivre) คุณสามารถดูการประมาณดังกล่าวข้างต้นโดยสังเกตว่าความน่าจะเป็นที่ต้องการคือ

P(J)=(nn/2+J)2n=n!2n(n/2+J)!(n/2-J)!

ซึ่งเราประมาณโดยสูตรของสเตอร์ลิง

P(J)nnอีn/2+Jอีn/2-J2nอีn(n/2+J)n/2+J(n/2-J)n/2-J=(11+2J/n)n+J(11-2J/n)n-J.

เข้าสู่ระบบ(P(J))=-(n+J)เข้าสู่ระบบ(1+2J/n)-(n-J)เข้าสู่ระบบ(1-2J/n)~-2J(n+J)/n+2J(n-J)/nα-J2/n.

โปรดดูความคิดเห็นของฉันต่อคำตอบก่อนหน้าโดย Michael C. และผู้ชาย
whuber

ดูเหมือนว่าสมการแรก (LL CLT) s / b ? มันทำให้ฉันงงเหมือนกันดูเหมือนจะแปรปรวน σ 2n((1ni=1nXi)μ) d N(0,1)σ2
B_Miner

หากคุณเปรียบเทียบค่า Gaussian ด้วยค่าเฉลี่ยและความแปรปรวน (ไม่ใช่ค่าเบี่ยงเบนมาตรฐาน) ฉันเชื่อว่าสูตรของ OP นั้นถูกต้อง
gui11aume

1
อ๊ะ .. ได้รับถ้าเราคูณโดยเราได้สิ่งที่ OP (ยกเลิก) แสดง: คือBigg) แต่เรารู้ว่า VAR (aX) = a ^ 2Var (X) ซึ่งในกรณีนี้ a =และ Var (X) คือ 1 ดังนั้นการแจกแจงคือ . ˉ X - E ( ˉ X )X¯-E(X¯)VaR(X¯)=nX¯-μσd ยังไม่มีข้อความ(0,1) σσX¯-E(X¯)VaR(X¯)σσσ2N(0,n((1nΣผม=1nXผม)-μ)σ2ยังไม่มีข้อความ(0,σ2)
B_Miner

Gui, ถ้าไม่สายเกินไป, ฉันต้องการตรวจสอบให้แน่ใจว่าฉันถูกต้องแล้ว หากเราถือว่าและเราคูณด้วยค่าคงที่ ( ) ค่าที่คาดหวังของปริมาณนี้ (เช่น ) ซึ่งเป็นศูนย์ยังคงเป็นศูนย์เช่น E [aX] = a * E [X] => * 0 = 0 ถูกต้องหรือไม่ σ X¯-E(X¯)VaR(X¯)=n(X¯-μ)d ยังไม่มีข้อความ(0,1)σσn(X¯-μ)σ
B_Miner

8

มีทฤษฎีที่ดีว่าการแจกแจงแบบใดที่สามารถ จำกัด การกระจายของผลรวมของตัวแปรสุ่มได้ ทรัพยากรที่ดีคือหนังสือต่อไปนี้โดย Petrov ซึ่งฉันมีความสุขเป็นการส่วนตัว

ปรากฎว่าถ้าคุณกำลังตรวจสอบข้อ จำกัด ของประเภทนี้ โดยที่เป็นตัวแปรสุ่มอิสระการกระจายของข้อ จำกัด คือ การแจกแจงบางอย่างเท่านั้นX i

1anΣผม=1nXn-n,(1)
Xผม

ในตอนนั้นมีคณิตศาสตร์จำนวนมากที่หลั่งไหลไปสู่ทฤษฎีบทหลายอย่างซึ่งอธิบายลักษณะของสิ่งที่เกิดขึ้นอย่างสมบูรณ์ หนึ่งในทฤษฎีบทนี้เกิดจาก Feller:

ทฤษฎีบทให้เป็นลำดับของตัวแปรสุ่มอิสระเป็นฟังก์ชันการแจกแจงของและ เป็นลำดับของค่าคงที่บวก ในลำดับที่V n ( x ) X n a n{Xn;n=1,2,...}Vn(x)Xnan

max1knP(|Xk|εan)0, for every fixed ε>0

และ

supx|P(an1k=1nXk<x)-Φ(x)|0

มีความจำเป็นและเพียงพอ

Σk=1n|x|εandVk(x)0 สำหรับทุกคงที่ ε>0,

an-2Σk=1n(|x|<anx2dVk(x)-(|x|<anxdVk(x))2)1

และ

an-1Σk=1n|x|<anxdVk(x)0

ทฤษฎีนี้ทำให้คุณเข้าใจว่าควรมีลักษณะอย่างไรan

ทฤษฎีทั่วไปในหนังสือเล่มนี้ถูกสร้างขึ้นในลักษณะดังกล่าวว่า norming คงถูก จำกัด ในทางใด ๆ แต่ทฤษฎีบทสุดท้ายที่ให้ที่จำเป็นและเพียงพอเงื่อนไขไม่ได้ออกจากห้องใด ๆ สำหรับ norming คงที่อื่นที่ไม่ใช่{n}n


4

sแสดงถึงค่าเบี่ยงเบนมาตรฐานตัวอย่างสำหรับค่าเฉลี่ยตัวอย่าง sคือความแปรปรวนตัวอย่างสำหรับค่าเฉลี่ยตัวอย่างและมันเท่ากับ S / n โดยที่ Sเป็นค่าประมาณตัวอย่างของความแปรปรวนประชากร เนื่องจาก s = S / √nที่อธิบายถึงวิธีที่√nปรากฏในสูตรแรก โปรดทราบว่าจะมีσในตัวหารหากมีการ จำกัดn 2 n 2 n 2 n nnn2n2n2nn

N (0,1) แต่ขีด จำกัด ถูกกำหนดเป็น N (0, σ ) เนื่องจาก Sเป็นการประมาณที่สอดคล้องกันของσมันถูกใช้ในสมการที่สองเพื่อนำσออกจากขีด จำกัดn2n


ส่วนคำถามอื่น ๆ (พื้นฐานและสำคัญกว่า): ทำไมและไม่ใช่การกระจายตัวแบบอื่น sn
whuber

@whuber นั่นอาจเป็นการสนทนา แต่มันไม่ได้เป็นส่วนหนึ่งของคำถาม OP ต้องการทราบว่าเหตุใด sและ√nจึงปรากฏในสูตรสำหรับ CLT แน่นอนว่า Sอยู่ที่นั่นเพราะสอดคล้องกับσและในรูปแบบของ CLT σนั้นจะถูกลบออก nnn
Michael Chernick

1
สำหรับฉันมันไม่ชัดเจนเลยว่ามีอยู่เพราะมันเป็น "ความสอดคล้องสำหรับ " ทำไมจะไม่บอกเป็นนัยเช่นกันว่าควรใช้เพื่อทำให้สถิติมีค่ามากที่สุด (ซึ่งจะไม่ทำงาน) ฉันขาดอะไรที่เรียบง่ายและชัดเจนในตัวเองไปแล้วหรือเปล่า? และเพื่อที่จะสะท้อน OP ทำไมไม่ใช้หลังจากทั้งหมดนั่นสอดคล้องกับ ! σ s n snσsnsnσ
whuber

ทฤษฎีตามที่ระบุไว้มีการลู่เข้าสู่ N (0,1) ดังนั้นเพื่อให้บรรลุว่าคุณต้องรู้ use และใช้มันหรือใช้การประเมินที่สอดคล้องกันซึ่งทำงานโดยทฤษฎีบทของ Slutsky ที่ฉันคิด ฉันไม่ชัดเจนหรือ
Michael Chernick

ฉันไม่คิดว่าคุณไม่ชัดเจน ฉันแค่คิดว่าจุดสำคัญอาจหายไป ที่สุดสำหรับการแจกแจงจำนวนมากเราสามารถได้รับการแจกแจงปกติที่ จำกัด โดยใช้ IQR แทน - แต่แล้วผลลัพธ์นั้นไม่เป็นระเบียบ (SD ของการกระจายที่ จำกัด นั้นขึ้นอยู่กับการกระจายที่เราเริ่มต้นด้วย) ฉันแค่แนะนำว่าสิ่งนี้สมควรที่จะถูกเรียกออกมาและอธิบาย จะไม่เป็นที่ชัดเจนกับคนที่ไม่มีสัญชาตญาณที่พัฒนาโดย 40 ปีของการสร้างมาตรฐานการแจกแจงทั้งหมดที่พวกเขาพบ! sn
whuber

2

โดยสังหรณ์ใจถ้าสำหรับเราควรคาดหวังว่าเท่ากับคร่าวๆ ; ดูเหมือนว่าจะมีความคาดหวังที่สมเหตุสมผล แต่ฉันไม่คิดว่ามันจำเป็นโดยทั่วไป เหตุผลสำหรับในนิพจน์แรกคือความแปรปรวนของไปที่เช่นและดังนั้นกำลังขยายความแปรปรวนเพื่อให้นิพจน์มีความแปรปรวนเท่ากับ 2 ในนิพจน์ที่สองคำว่าถูกกำหนดให้เป็นσ 2 Var ( Z n ) σ 2 Znยังไม่มีข้อความ(0,σ2)σ2var(Zn)σ2ˉ X n-μ0 1nX¯n-μ01n σ2snnσ2sn n i = 1 Var(Xi)1Σผม=1nvar(Xผม)ในขณะที่ความแปรปรวนของตัวเศษเพิ่มขึ้นเช่นดังนั้นเราจึงมีความแปรปรวนของนิพจน์ทั้งหมดเป็นค่าคงที่ (ในกรณีนี้)Σผม=1nvar(Xผม)1

โดยพื้นฐานแล้วเรารู้ว่ามีบางสิ่งที่ "น่าสนใจ" กำลังเกิดขึ้นกับการกระจายของแต่ถ้าเราไม่จัดกึ่งกลางและปรับขนาดอย่างเหมาะสมเราจะไม่สามารถมองเห็นได้ ฉันเคยได้ยินสิ่งนี้อธิบายบางครั้งว่าจำเป็นต้องปรับกล้องจุลทรรศน์ ถ้าเราไม่ระเบิด (เช่น)โดยจากนั้นเราก็มีการกระจายโดยกฎหมายที่อ่อนแอ ผลลัพธ์ที่น่าสนใจคือเป็นสิทธิ์ของตัวเอง แต่ไม่ได้ให้ข้อมูลเท่า CLT หากเราขยายปัจจัยซึ่งครอบงำโดยเรายังคงได้รับในขณะที่ปัจจัยซึ่งปกครอง ˉ X -μX¯n=1nΣผมXผมX¯-μˉ X n-μ0annX¯n-μ0annan(X¯n-μ)0annให้\ ปรากฎว่าเป็นเพียงการขยายที่ถูกต้องเพื่อให้สามารถมองเห็นสิ่งที่เกิดขึ้นในกรณีนี้ (หมายเหตุ: การบรรจบทั้งหมดที่นี่เป็นการแจกแจงมีอีกระดับของการขยายที่น่าสนใจสำหรับการลู่เข้าที่แน่นอน กฎหมายของลอการิทึมซ้ำแล้วซ้ำอีก)an(X¯n-μ)n


4
คำถามพื้นฐานที่ควรให้ความสำคัญเป็นอันดับแรกคือสาเหตุที่ใช้ SD เพื่อวัดการกระจายตัว ทำไมไม่วินาทีกลางสำหรับค่าอื่น ๆ ของ ? หรือทำไมไม่ IQR หรือญาติของมัน? เมื่อตอบแล้วคุณสมบัติที่เรียบง่ายของความแปรปรวนร่วมจะให้การพึ่งพา (เนื่องจาก @ Gui11aume ได้อธิบายเมื่อเร็ว ๆ นี้)kthkn
whuber

1
@ เมื่อฉันเห็นด้วยซึ่งเป็นเหตุผลว่าทำไมฉันจึงนำเสนอนี้เป็นแบบแก้ปัญหา ฉันไม่แน่ใจว่ามันจะเป็นคำอธิบายง่ายๆ แต่ฉันก็ชอบที่จะได้ยิน สำหรับฉันฉันไม่แน่ใจว่าฉันมีเหตุผลที่เรียบง่ายและสามารถอธิบายได้ในอดีต "เนื่องจากคำว่าสแควร์เป็นคำศัพท์ที่เกี่ยวข้องในการขยายตัวของลักษณะฟังก์ชั่นเทย์เลอร์เมื่อคุณลบค่าเฉลี่ยออก"
ผู้ชาย
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.