คำถามติดแท็ก central-limit-theorem

สำหรับคำถามเกี่ยวกับทฤษฎีบทขีด จำกัด กลางซึ่งกล่าวว่า: "ให้เงื่อนไขบางประการความหมายของจำนวนตัวแปรสุ่มอิสระที่มากพอที่ทำซ้ำแต่ละค่าที่มีการกำหนดค่าเฉลี่ยที่ดี (วิกิพีเดีย)

1
การประเมินผลของ“ ประมาณปกติ” สำหรับการทดสอบที
ฉันกำลังทดสอบวิธีการที่เท่าเทียมกันโดยใช้การทดสอบ t ของ Welch การแจกแจงพื้นฐานอยู่ไกลจากปกติ (บิดเบือนมากกว่าตัวอย่างในการสนทนาที่เกี่ยวข้องที่นี่ ) ฉันสามารถรับข้อมูลเพิ่มเติมได้ แต่ต้องการวิธีที่มีหลักการในการพิจารณาว่าจะทำเช่นไร มีฮิวริสติกที่ดีสำหรับการประเมินว่าการแจกตัวอย่างเป็นที่ยอมรับหรือไม่? การเบี่ยงเบนใด ๆ จากภาวะปกติที่เกี่ยวข้องกับอะไรมากที่สุด มีวิธีการอื่น ๆ - เช่นอาศัยช่วงความเชื่อมั่นบูตสำหรับสถิติตัวอย่าง - ซึ่งจะทำให้รู้สึกมากขึ้น?

1
ทำไมทฤษฎีบทขีด จำกัด กลางทำงานกับตัวอย่างเดี่ยว
ฉันได้รับการสอนเสมอว่า CLT ทำงานได้เมื่อคุณสุ่มตัวอย่างซ้ำโดยแต่ละตัวอย่างมีขนาดใหญ่พอ ตัวอย่างเช่นสมมติว่าฉันมีประเทศที่มีประชากร 1,000,000 คน ความเข้าใจของฉันเกี่ยวกับ CLT คือแม้ว่าการแจกแจงความสูงของพวกเขาไม่ปกติถ้าฉันเอาตัวอย่าง 1,000 คนจาก 50 คน (เช่นทำการสำรวจ 1,000 คนจาก 50 คนต่อคน) จากนั้นคำนวณความสูงเฉลี่ยของพวกเขาสำหรับตัวอย่างแต่ละตัวอย่าง หมายถึงจะเป็นเรื่องปกติ อย่างไรก็ตามฉันไม่เคยเห็นกรณีโลกแห่งความจริงที่นักวิจัยได้ทำการสุ่มตัวอย่างซ้ำ แต่พวกเขาใช้ตัวอย่างใหญ่หนึ่งตัวอย่าง (เช่นสำรวจประชากร 50,000 คนเกี่ยวกับความสูงของพวกเขา) และทำงานจากนั้น เพราะเหตุใดหนังสือสถิติสอนการสุ่มตัวอย่างซ้ำ ๆ และในนักวิจัยในโลกแห่งความเป็นจริงจึงทำการสุ่มตัวอย่างเพียงครั้งเดียว แก้ไข: กรณีโลกแห่งความจริงที่ฉันกำลังคิดจะทำสถิติในชุดข้อมูลของผู้ใช้ twitter 50,000 คน ชุดข้อมูลนั้นไม่ได้เป็นตัวอย่างซ้ำ ๆ แต่เป็นเพียงตัวอย่างใหญ่หนึ่ง 50,000

2
มีตัวอย่างของตัวแปรที่กระจายตามปกติที่ * ไม่ * เนื่องจากทฤษฎีบทกลาง จำกัด หรือไม่
การแจกแจงแบบปกติดูเหมือนจะไม่ง่ายจนกว่าคุณจะเรียนรู้ CLT ซึ่งจะอธิบายว่าทำไมมันจึงแพร่หลายในชีวิตจริง แต่มันไม่เคยเกิดขึ้นในฐานะการกระจาย "ธรรมชาติ" สำหรับปริมาณบางอย่าง?

1
มีการแจกแจงอื่นที่ไม่ใช่ Cauchy ซึ่งค่าเฉลี่ยเลขคณิตของตัวอย่างตามการแจกแจงเดียวกันหรือไม่?
ถ้าเป็นไปตามการแจกแจงแบบ Cauchy ดังนั้นยังตามด้วยการกระจายตัวแบบเดียวกับ ; ดูกระทู้นี้Y = ˉ X = 1XXXXY=X¯=1n∑ni=1XiY=X¯=1nΣผม=1nXผมY = \bar{X} = \frac{1}{n} \sum_{i=1}^n X_iXXX สถานที่ให้บริการนี้มีชื่อหรือไม่? มีการแจกแจงอื่น ๆ ซึ่งสิ่งนี้เป็นจริงหรือไม่? แก้ไข วิธีถามคำถามนี้อีกวิธี: ให้เป็นตัวแปรสุ่มที่มีความหนาแน่นของความน่าจะเป็น(x)f ( x )XXXf(x)ฉ(x)f(x) ให้ที่หมายถึงการสังเกต ith ของXXฉันXY=1n∑ni=1XiY=1nΣผม=1nXผมY=\frac 1 n\sum_{i=1} ^n X_iXiXผมX_iXXX YYYตัวเองถือได้ว่าเป็นตัวแปรสุ่มโดยไม่ต้องเครื่องกับค่าที่เฉพาะเจาะจงใด ๆ ของXXXX ถ้าตามการกระจาย Cauchy ดังนั้นฟังก์ชันความหนาแน่นของความน่าจะเป็นของคือY f ( x )XXXYYYf(x)ฉ(x)f(x) มีฟังก์ชั่นความหนาแน่นของความน่าจะเป็นแบบอื่น ๆ (ไม่ใช่เล็กน้อย) สำหรับที่ส่งผลให้มีฟังก์ชันความหนาแน่นของความน่าจะเป็นหรือไม่?Y f ( x …

1
Asymptotic normality ของรูปแบบสมการกำลังสอง
Letเป็นเวกเตอร์สุ่มมาจากPพิจารณาตัวอย่างP กำหนดและ^ ปล่อย\ boldsymbol {\ mu}: = \ mathbb {E} _ {\ mathbf {x} \ sim P} [\ mathbf {x}]และC: = \ mathrm {cov} _ {\ mathbf {x} \ sim P} [\ mathbf {x} \ mathbf {x}]xx\mathbf{x}PPP{xi}ni=1∼i.i.d.P{xi}i=1n∼i.i.d.P\{ \mathbf{x}_i \}_{i=1}^n \stackrel{i.i.d.}{\sim} Px¯n:=1n∑ni=1xix¯n:=1n∑i=1nxi\bar{\mathbf{x}}_n := \frac{1}{n} \sum_{i=1}^n \mathbf{x}_iC^:=1n∑ni=1(xi−x¯n)(xi−x¯n)⊤C^:=1n∑i=1n(xi−x¯n)(xi−x¯n)⊤\hat{C} := \frac{1}{n} \sum_{i=1}^n (\mathbf{x}_i - …

2
การพิสูจน์ทฤษฎีบทขีด จำกัด กลางไม่ได้ใช้ฟังก์ชันลักษณะพิเศษ
มีข้อพิสูจน์ใด ๆ เกี่ยวกับ CLT ที่ไม่ได้ใช้ฟังก์ชั่นคุณสมบัติเป็นวิธีที่ง่ายกว่าหรือไม่ อาจจะเป็นวิธี Tikhomirov หรือสไตน์? มีบางอย่างในตัวที่คุณสามารถอธิบายให้นักศึกษามหาวิทยาลัย (ปีแรกของคณิตศาสตร์หรือฟิสิกส์) และใช้เวลาน้อยกว่าหนึ่งหน้า

3
อีกคำถามหนึ่งในทฤษฎีบทขีด จำกัด กลาง
ปล่อยเป็นลำดับของตัวแปรสุ่มแบบอิสระของ Bernoulli ด้วย ตั้ง แสดงให้เห็นว่าลู่เข้าสู่การกระจายไปยังตัวแปรปกติมาตรฐานเมื่อมีแนวโน้มที่จะไม่มีที่สิ้นสุดP { X k = 1 } = 1 - P { X k = 0 } = 1{Xn:n≥1}{Xn:n≥1}\{X_n:n\ge1\}Sn= n ∑ k=1(Xk-1P{Xk=1}=1−P{Xk=0}=1k.P{Xk=1}=1−P{Xk=0}=1k.P\{X_k=1\}=1-P\{X_k=0\}=\frac{1}{k}. SnSn=∑k=1n(Xk−1k), B2n=∑k=1nk−1k2Sn=∑k=1n(Xk−1k), Bn2=∑k=1nk−1k2S_n=\sum^{n}_{k=1}\left(X_k-\frac{1}{k}\right), \ B_n^2=\sum^{n}_{k=1}\frac{k-1}{k^2} ZnSnBnSnBn\frac{S_n}{B_n}ZZZnnn ความพยายามของฉันคือใช้ Lyapunov CLT ดังนั้นเราต้องแสดงให้เห็นว่ามีเช่นนั้น δ>0δ>0\delta>0limn→∞1B2+δn∑k=1nE[|Xk−1k|2+δ]=0.limn→∞1Bn2+δ∑k=1nE[|Xk−1k|2+δ]=0.\lim_{n\rightarrow \infty}\frac{1}{B_n^{2+\delta}}\sum_{k=1}^{n}E[|X_k-\frac{1}{k}|^{2+\delta}]=0. ดังนั้นตั้งค่าδ=1δ=1\delta=1∑k=1nE∣∣Xk−k−1∣∣3=∑k=1n(1k−3k2+4k3−2k4)∑k=1nE|Xk−k−1|3=∑k=1n(1k−3k2+4k3−2k4) \sum_{k=1}^{n}E\left|X_k-k^{-1}\right|^{3}=\sum_{k=1}^{n} \left(\frac{1}{k}-\frac{3}{k^2}+\frac{4}{k^3}-\frac{2}{k^4}\right) และ B3n=(∑k=1n1k−1k2)(∑k=1n1k−1k2)−−−−−−−−−−−−⎷Bn3=(∑k=1n1k−1k2)(∑k=1n1k−1k2) B_n^3=\left( \sum_{k=1}^n \frac{1}{k}-\frac{1}{k^2} \right) \sqrt{\left( \sum_{k=1}^n \frac{1}{k}-\frac{1}{k^2} …

3
จำนวนคำศัพท์ที่ใหญ่ที่สุดในเพิ่มขึ้นรวมครึ่งหนึ่งหรือไม่
พิจารณา โดยที่X_1, \ ldots, X_Nคือ iid และ CLT ถือ จำนวนคำศัพท์ที่ใหญ่ที่สุดนั้นรวมกันได้ทั้งหมดครึ่งหนึ่งหรือไม่ ตัวอย่างเช่น 10 + 9 + 8 \ ประมาณ (10 + 9 + 8 \ จุด + 1) / 2: 30% ของคำศัพท์เข้าถึงประมาณครึ่งหนึ่งของทั้งหมด∑Ni=1|Xi|∑i=1N|Xi|\sum_{i=1}^N |X_i|X1,…,XNX1,…,XNX_1, \ldots, X_N≈≈\approx……\dots กำหนด sumbiggest( j;X1…XN)≡sum of the j biggest of |X1|…|XN|sumbiggest( j;X1…XN)≡sum of the j biggest of |X1|…|XN| …

1
ทฤษฎีขีด จำกัด กลางสำหรับรากที่สองของผลรวมของตัวแปรสุ่ม iid
ทึ่งกับคำถามที่ math.stackexchangeและตรวจสอบมันสังเกตุฉันสงสัยเกี่ยวกับคำสั่งต่อไปนี้ในรากที่สองของจำนวนสุ่มตัวแปร iid สมมติว่าX1,X2,…,XnX1,X2,…,XnX_1, X_2, \ldots, X_nเป็นตัวแปรสุ่ม IID ด้วยแน่นอนไม่ใช่ศูนย์หมายถึงและความแปรปรวนและx_i ทฤษฎีขีด จำกัด กลางบอกว่าเมื่อเพิ่มขึ้นσ 2 Y = n Σฉัน= 1 X ฉันY - n μμμ\muσ2σ2\sigma^2Y=∑i=1nXiY=∑i=1nXผม\displaystyle Y=\sum_{i=1}^n X_inY-nμnσ2−−-√ →d N( 0 , 1 )Y−nμnσ2 →d ยังไม่มีข้อความ(0,1)\displaystyle \dfrac{Y - n\mu}{\sqrt{n\sigma^2}} \ \xrightarrow{d}\ N(0,1)nnn ถ้าฉันสามารถพูดได้เช่นเมื่อเพิ่มขึ้น?Z - √Z= | Y|---√Z=|Y|Z=\sqrt{|Y|}nZ−n|μ|−σ24|μ|−−−−−−−−√σ24|μ|−−−√ →d N(0,1)Z−n|μ|−σ24|μ|σ24|μ| →d N(0,1)\displaystyle \dfrac{Z - …

3
ทฤษฎีข้อมูล จำกัด ทฤษฎีบทกลาง
รูปแบบที่ง่ายที่สุดของ CLT เชิงทฤษฎีข้อมูล ได้แก่ : ให้จะ IID ที่มีค่าเฉลี่ยและความแปรปรวน1 ปล่อยให้f_nเป็นความหนาแน่นของผลรวม\ frac {\ sum_ {i = 1} ^ n X_i} {\ sqrt {n}}และ\ phiเป็นความหนาแน่นแบบเกาส์มาตรฐาน จากนั้นข้อมูลเชิงทฤษฎี CLT ระบุว่าถ้าD (f_n \ | \ phi) = \ int f_n \ log (f_n / \ phi) dxมีขอบเขตสำหรับnบางตัวดังนั้นD (f_n \ | \ phi) \ to 0เป็นn \ …

1
MLE ของ
สมมติว่ามี pdf(X,Y)(X,Y)(X,Y) fθ(x,y)=e−(x/θ+θy)1x>0,y>0,θ>0fθ(x,y)=e−(x/θ+θy)1x>0,y>0,θ>0f_{\theta}(x,y)=e^{-(x/\theta+\theta y)}\mathbf1_{x>0,y>0}\quad,\,\theta>0 ความหนาแน่นของตัวอย่างดึงมาจากประชากรนี้จึงเป็น(X,Y)=(Xi,Yi)1≤i≤n(X,Y)=(Xi,Yi)1≤i≤n(\mathbf X,\mathbf Y)=(X_i,Y_i)_{1\le i\le n} gθ(x,y)=∏i=1nfθ(xi,yi)=exp[−∑i=1n(xiθ+θyi)]1x1,…,xn,y1,…,yn>0=exp[−nx¯θ−θny¯]1x(1),y(1)>0,θ>0gθ(x,y)=∏i=1nfθ(xi,yi)=exp⁡[−∑i=1n(xiθ+θyi)]1x1,…,xn,y1,…,yn>0=exp⁡[−nx¯θ−θny¯]1x(1),y(1)>0,θ>0\begin{align} g_{\theta}(\mathbf x,\mathbf y)&=\prod_{i=1}^n f_{\theta}(x_i,y_i) \\&=\exp\left[{-\sum_{i=1}^n\left(\frac{x_i}{\theta}+\theta y_i\right)}\right]\mathbf1_{x_1,\ldots,x_n,y_1,\ldots,y_n>0} \\&=\exp\left[-\frac{n\bar x}{\theta}-\theta n\bar y\right]\mathbf1_{x_{(1)},y_{(1)}>0}\quad,\,\theta>0 \end{align} ตัวประมาณโอกาสสูงสุดของสามารถได้รับเป็นθθ\theta θ^(X,Y)=X¯¯¯¯Y¯¯¯¯−−−√θ^(X,Y)=X¯Y¯\hat\theta(\mathbf X,\mathbf Y)=\sqrt\frac{\overline X}{\overline Y} ฉันต้องการทราบว่าการ จำกัด การกระจายของ MLE นี้เป็นปกติหรือไม่ เป็นที่ชัดเจนว่าเป็นสถิติที่เพียงพอสำหรับตามกลุ่มตัวอย่างคือY)θθ\theta(X¯¯¯¯,Y¯¯¯¯)(X¯,Y¯)(\overline X,\overline Y) ตอนนี้ฉันจะได้กล่าวว่า MLE เป็นอาการปกติโดยไม่ต้องสงสัยถ้ามันเป็นสมาชิกของตระกูลเลขชี้กำลังหนึ่งพารามิเตอร์แบบปกติ ฉันไม่คิดว่าเป็นเช่นนั้นส่วนหนึ่งเป็นเพราะเรามีสถิติเพียงพอสองมิติสำหรับพารามิเตอร์หนึ่งมิติ (เช่นในการแจกแจง )N(θ,θ2)N(θ,θ2)N(\theta,\theta^2) การใช้ความจริงที่ว่าและเป็นตัวแปรเอกซ์โปเนนเชียลที่เป็นอิสระฉันสามารถแสดงให้เห็นว่าการกระจายที่แน่นอนของเป็นเช่นนั้นXXXYYYθθ^θ^\hat\theta θ^θ=dF−−√, where F∼F2n,2nθ^θ=dF, where F∼F2n,2n\frac{\hat\theta}{\theta}\stackrel{d}{=} \sqrt F\quad,\text{ where …

3
ใน CLT ทำไม
Let X1,...,XnX1,...,XnX_1,...,X_nเป็นข้อสังเกตอิสระจากการแจกแจงที่มีค่าเฉลี่ยμμ\muและความแปรปรวนσ2&lt;∞σ2&lt;∞\sigma^2 < \infty , เมื่อn→∞n→∞n \rightarrow \inftyจากนั้น n−−√X¯n−μσ→N(0,1).nX¯n−μσ→N(0,1).\sqrt{n}\frac{\bar{X}_n-\mu}{\sigma} \rightarrow N(0,1). ทำไมสิ่งนี้ถึงบอกว่า X¯n∼N(μ,σ2n)?X¯n∼N(μ,σ2n)?\bar{X}_n \sim N\left(\mu, \frac{\sigma^2}{n}\right)?

1
ตัวอย่างการทดสอบไคสองกำลังสอง
คำถามนี้มาจากหนังสือ Asymptotic Statistics, pg. ของ Van Van Vaart 253 # 3: สมมติว่าและเวกเตอร์พหุนามอิสระที่มีพารามิเตอร์และb_k) ภายใต้สมมติฐานว่างที่แสดงให้เห็นว่าXmXm\mathbf{X}_mYnYn\mathbf{Y}_n(m,a1,…,ak)(m,a1,…,ak)(m,a_1,\ldots,a_k)(n,b1,…,bk)(n,b1,…,bk)(n,b_1,\ldots,b_k)ai=biai=bia_i=b_i ∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i\sum_{i=1}^k \dfrac{(X_{m,i} - m\hat{c}_i)^2}{m\hat{c}_i} + \sum_{i=1}^k \dfrac{(Y_{n,i} - n\hat{c}_i)^2}{n\hat{c}_i}มีการจัดจำหน่าย ที่n)χ2k−1χk−12\chi^2_{k-1}c^i=(Xm,i+Yn,i)/(m+n)c^i=(Xm,i+Yn,i)/(m+n)\hat{c}_i = (X_{m,i} + Y_{n,i})/(m+n) ฉันต้องการความช่วยเหลือในการเริ่มต้น กลยุทธ์ที่นี่คืออะไร? ฉันสามารถรวมการเรียกทั้งสองเข้าด้วยกันเป็น: ∑i=1k(mYn,i−nXm,i)2mn(m+n)c^i∑i=1k(mYn,i−nXm,i)2mn(m+n)c^i\sum_{i=1}^k \dfrac{(mY_{n,i} - nX_{m,i})^2}{mn(m+n)\hat{c}_i} แต่งานนี้เคยชินกับ CLT เพราะการรวมกันถ่วงน้ำหนักของและy_nไม่แน่ใจว่านี่เป็นเส้นทางที่ถูกต้องหรือไม่ ข้อเสนอแนะใด ๆXmXmX_mYnYnY_n แก้ไข: ถ้ามันค่อนข้างง่ายเพราะเราได้รับm=nm=nm=n mYn−nXmmn(m+n)−−−−−−−−−√=Yn−Xm(m+n)−−−−−−−√mYn−nXmmn(m+n)=Yn−Xm(m+n)\begin{align*} \dfrac{mY_{n} - nX_{m}}{\sqrt{mn(m+n)}} &= \dfrac{Y_{n} - X_{m}}{\sqrt{(m+n)}} \end{align*} …

1
มีทฤษฎีบทหนึ่งที่บอกว่าลู่เข้าหากันอย่างเป็นปกติเมื่อไปถึงอินฟินิตี้หรือไม่?
Let XXXจะกระจายใด ๆ กับการกำหนดค่าเฉลี่ยμμ\muและส่วนเบี่ยงเบนมาตรฐาน\σσ\sigmaทฤษฎีขีด จำกัด กลางบอกว่า n−−√X¯−μσnX¯−μσ \sqrt{n}\frac{\bar{X} - \mu}{\sigma} ลู่เข้าสู่การแจกแจงแบบปกติ ถ้าเราแทนที่σσ\sigmaด้วยค่าเบี่ยงเบนมาตรฐานตัวอย่างSSSมีทฤษฎีที่ระบุว่า n−−√X¯−μSnX¯−μS \sqrt{n}\frac{\bar{X} - \mu}{S} ลู่เข้าหากันเพื่อการกระจายตัวหรือไม่? ตั้งแต่ขนาดใหญ่nnnการแจกแจงแบบ t ใกล้ถึงระดับปกติทฤษฏีถ้ามีอยู่อาจระบุว่าขีด จำกัด เป็นการแจกแจงแบบปกติมาตรฐาน ดังนั้นฉันจึงเห็นว่าการแจกแจงแบบทีไม่มีประโยชน์อย่างมาก - พวกมันมีประโยชน์เฉพาะเมื่อXXXเป็นปกติโดยประมาณ เป็นกรณีนี้หรือไม่? หากเป็นไปได้คุณจะระบุการอ้างอิงที่มีหลักฐานของ CLT นี้เมื่อσσ\sigmaถูกแทนที่โดยSSSหรือไม่ การอ้างอิงเช่นนี้ควรใช้แนวคิดทฤษฎีการวัด แต่จะมีอะไรดีสำหรับฉัน ณ จุดนี้

2
Multivariate Central Limit Theorem (CLT) มีไว้เมื่อตัวแปรมีการพึ่งพาอาศัยกันอย่างสมบูรณ์แบบหรือไม่?
ชื่อสรุปคำถามของฉัน แต่เพื่อความชัดเจนลองพิจารณาตัวอย่างง่ายๆดังต่อไปนี้ ให้ , i = 1, ... , n กำหนด: \ start {สมการ} S_n = \ frac {1} {n} \ sum_ {i = 1} ^ n X_i \ end {สมการ} และ \ start {สมการ} T_n = \ frac {1} {n} \ sum_ {i = 1} ^ n (X_i ^ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.