คำถามติดแท็ก central-limit-theorem

สำหรับคำถามเกี่ยวกับทฤษฎีบทขีด จำกัด กลางซึ่งกล่าวว่า: "ให้เงื่อนไขบางประการความหมายของจำนวนตัวแปรสุ่มอิสระที่มากพอที่ทำซ้ำแต่ละค่าที่มีการกำหนดค่าเฉลี่ยที่ดี (วิกิพีเดีย)

1
“ ทฤษฎีขีด จำกัด กลาง” สำหรับผลรวมถ่วงน้ำหนักของตัวแปรสุ่มที่สัมพันธ์กัน
ฉันกำลังอ่านกระดาษซึ่งอ้างว่า (เช่นการแปลงฟูริเยร์แบบไม่ต่อเนื่อง, DFT) โดย CLT มีแนวโน้มที่จะเป็นตัวแปรสุ่ม (ซับซ้อน) gaussian อย่างไรก็ตามฉันรู้ว่านี่ไม่เป็นความจริงโดยทั่วไป หลังจากอ่านอาร์กิวเมนต์ (ผิดพลาด) นี้ฉันค้นหาผ่านเน็ตและพบบทความนี้โดย Peligrad & Wu ปี 2010ที่พวกเขาพิสูจน์ว่าสำหรับกระบวนการคงที่บางคนสามารถพบ "ทฤษฎีบท CLT"X^k= 1ยังไม่มีข้อความ--√Σj = 0ยังไม่มีข้อความ- 1XJอี- ฉัน2 πk j / N,X^k=1ยังไม่มีข้อความΣJ=0ยังไม่มีข้อความ-1XJอี-ผม2πkJ/ยังไม่มีข้อความ,\hat{X}_k=\frac{1}{\sqrt{N}}\sum_{j=0}^{N-1}X_je^{-i2\pi kj/N}, คำถามของฉันคือ: คุณมีการอ้างอิงอื่น ๆ ที่พยายามแก้ไขปัญหาในการค้นหาการ จำกัด การกระจายของ DFT ของลำดับดัชนีที่กำหนด (ทั้งโดยการจำลองหรือทฤษฎี) หรือไม่? ฉันสนใจโดยเฉพาะอย่างยิ่งในอัตราการบรรจบกัน (เช่นความรวดเร็วของ DFT ที่มาบรรจบกัน) เนื่องจากโครงสร้างความแปรปรวนร่วมของในบริบทของการวิเคราะห์อนุกรมเวลาXJXJX_j

2
ทฤษฎีการ จำกัด ศูนย์กลางสำหรับโซ่มาร์คอฟ
\newcommand{\E}{\mathbb{E}}\newcommand{\P}{\mathbb{P}}ทฤษฎีการ จำกัด ศูนย์กลาง (CLT) ระบุว่าสำหรับX1,X2, ...X1,X2,…X_1,X_2,\dotsอิสระและกระจายแบบเดียวกัน (iid) ด้วยE [Xผม] = 0E[Xi]=0\E[X_i]=0และvar(Xผม) &lt; ∞Var⁡(Xi)&lt;∞\operatorname{ Var} (X_i)<\inftyผลรวมจะรวมกับการแจกแจงแบบปกติเป็นn → ∞n→∞n\to\infty : Σi = 1nXผม→ N( 0 ,n--√) .∑i=1nXi→N(0,n). \sum_{i=1}^n X_i \to N\left(0, \sqrt{n}\right). สมมติว่าX1,X2, ...X1,X2,…X_1,X_2,\dotsเป็นโซ่มาร์คอฟสถานะ จำกัด ที่มีการแจกแจงแบบคงที่P∞P∞\P_\inftyด้วยความคาดหวังที่ 0 และความแปรปรวนที่มีขอบเขต มีการขยาย CLT อย่างง่ายสำหรับกรณีนี้หรือไม่ เอกสารที่ฉันได้พบใน CLT สำหรับ Markov Chains มักจะรักษากรณีทั่วไปมากขึ้น ฉันจะขอบคุณมากสำหรับตัวชี้ไปยังผลลัพธ์ทั่วไปที่เกี่ยวข้องและคำอธิบายเกี่ยวกับวิธีการใช้

3
ทฤษฎีขีด จำกัด กลางและการแจกแจงพาเรโต
ใครบางคนสามารถให้คำอธิบายง่ายๆ (บุคคลทั่วไป) เกี่ยวกับความสัมพันธ์ระหว่างการแจกแจงแบบพาเรโตกับทฤษฎีการ จำกัด ศูนย์กลาง (เช่นนำมาประยุกต์ใช้ได้หรือไม่ทำไม / เพราะเหตุใด) ฉันพยายามที่จะเข้าใจคำสั่งต่อไปนี้: "ทฤษฎีบทขีด จำกัด กลางนั้นใช้ไม่ได้กับการแจกแจงทุกครั้งนี่เป็นเพราะความจริงที่น่าสะพรึงกลัว - ค่าเฉลี่ยตัวอย่างจะถูกจัดกลุ่มรอบค่าเฉลี่ยของการแจกแจงต้นแบบถ้ามีอยู่ แต่การแจกแจงจะไม่มีความหมายได้อย่างไร นั่นไม่ได้หมายความว่าการแจกแจงแบบพาเรโตถ้าคุณพยายามคำนวณโดยใช้วิธีการปกติมันจะเปลี่ยนไปเป็นอนันต์ "

2
ความคาดหวังของสแควร์รูทของผลรวมของตัวแปรสุ่มชุดกำลังสองอิสระ
ให้เป็นอิสระและตัวแปรสุ่มชุดมาตรฐานแบบกระจายเหมือนกันX1, … ,Xn∼ คุณ( 0 , 1 )X1,…,Xn∼U(0,1)X_1,\dots,X_n \sim U(0,1) ปล่อย Yn=ΣผมnX2ผมฉันค้นหา: E [Yn--√]ปล่อย Yn=ΣผมnXผม2ฉันค้นหา: E[Yn]\text{Let }\quad Y_n=\sum_i^nX_i^2 \quad \quad \text{I seek: } \quad \mathbb{E}\big[\sqrt{Y_n } \big] ความคาดหวังของนั้นง่าย:YnYnY_n E [X2]E [Yn]=∫10Y2Y√=13= E [ΣผมnX2ผม] =ΣผมnE [X2ผม] =n3E[X2]=∫01Y2Y=13E[Yn]=E[ΣผมnXผม2]=ΣผมnE[Xผม2]=n3\begin{align} \mathbb{E}\left[X^2\right] &=\int_0^1\frac{y}{2\sqrt{y}}=\frac{1}{3}\\ \mathbb{E}\left[Y_n\right] &=\mathbb{E}\left[\sum_i^nX_i^2\right] = \sum_i^n\mathbb{E}\left[X_i^2\right]=\frac{n}{3} \end{align} ตอนนี้ส่วนที่น่าเบื่อ เมื่อต้องการใช้ LOTUS, ฉันจะต้องไฟล์ PDF ของy_nแน่นอนว่าไฟล์ PDF …

1
ข้อผิดพลาดที่กระจายตามปกติและทฤษฎีขีด จำกัด กลาง
ในเศรษฐศาสตรเบื้องต้นของ Wooldridge มีข้อความอ้างอิง: ข้อโต้แย้งที่แสดงให้เห็นถึงการแจกแจงปกติสำหรับข้อผิดพลาดมักจะทำสิ่งนี้: เพราะเป็นผลรวมของปัจจัยที่ไม่ได้สังเกตเห็นหลายอย่างที่มีผลต่อเราจึงสามารถเรียกทฤษฎีบทขีด จำกัด กลางเพื่อสรุปว่ามีการแจกแจงแบบปกติโดยประมาณuuuyyyuuu คำพูดนี้เกี่ยวข้องกับหนึ่งในสมมติฐานโมเดลเชิงเส้นคือ: u∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2) โดยที่uuuคือคำผิดพลาดในตัวแบบประชากร ทีนี้เท่าที่ฉันรู้ทฤษฎีขีด จำกัด กลางระบุว่าการกระจายตัวของ Zi=(Yi¯¯¯¯¯−μ)/(σ/√n)Zi=(Yi¯−μ)/(σ/√n)Z_i=(\overline{Y_i}-μ)/(σ/√n) (โดยที่Yi¯¯¯¯¯Yi¯\overline{Y_i} เป็นค่าเฉลี่ยของกลุ่มตัวอย่างสุ่มจากประชากรใด ๆ ที่มีค่าเฉลี่ยμμμและความแปรปรวนσ2σ2σ^2 ) วิธีการที่ของตัวแปรปกติมาตรฐานn→∞n→∞n \rightarrow \infty\ คำถาม: ช่วยฉันเข้าใจว่ามาตรฐานความเป็นซีมโทติคของZiZiZ_iหมายถึงu∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2)

1
ผลรวมของตัวแปรสุ่ม Cauchy อิสระจำนวนมากปกติหรือไม่
ตามทฤษฎีบทขีด จำกัด กลางฟังก์ชันความหนาแน่นของความน่าจะเป็นของผลรวมของตัวแปรสุ่มอิสระขนาดใหญ่มีแนวโน้มที่จะเป็นปกติ ดังนั้นเราสามารถพูดได้ว่าผลรวมของตัวแปรสุ่ม Cauchy อิสระจำนวนมากนั้นเป็นปกติหรือไม่

1
ทอพอโลยีที่ชุดการแจกแจงความน่าจะเป็นเสร็จสมบูรณ์
ฉันได้รับการดิ้นรนค่อนข้างน้อยด้วยการปรับความเข้าใจที่เข้าใจง่ายของการแจกแจงความน่าจะเป็นกับคุณสมบัติแปลก ๆ ที่ทอพอโลยีเกือบทั้งหมดเกี่ยวกับการแจกแจงความน่าจะเป็นมี ตัวอย่างเช่นลองพิจารณาตัวแปรสุ่มแบบผสม : เลือกแบบเกาส์ที่กึ่งกลางที่ 0 ด้วยความแปรปรวน 1 และด้วยความน่าจะเป็นเพิ่มในผลลัพธ์ ลำดับของตัวแปรสุ่มดังกล่าวจะมาบรรจบกัน (อย่างอ่อนและในรูปแบบทั้งหมด) ไปยังเกาส์เป็นศูนย์กลางที่ 0 กับความแปรปรวน 1 แต่ค่าเฉลี่ยของเสมอและผลต่างมาบรรจบกันที่จะ+ฉันไม่ชอบบอกว่าลำดับนี้มาบรรจบกันเพราะสิ่งนั้นXnXnX_n1n1n\frac{1}{n}nnnXnXnX_n111+ ∞+∞+\infty ฉันใช้เวลาพอสมควรที่จะจำทุกสิ่งที่ฉันลืมเกี่ยวกับทอพอโลยี แต่ในที่สุดฉันก็พบว่าอะไรที่ทำให้ฉันไม่พอใจกับตัวอย่างเช่น: ขีด จำกัด ของลำดับไม่ใช่การแจกแจงแบบเดิม ในตัวอย่างข้างต้นขีด จำกัด คือ "Gaussian ของค่าเฉลี่ย 1 และค่าความแปรปรวนอนันต์" แปลก ในแง่ทอพอโลยีชุดการแจกแจงความน่าจะเป็นยังไม่สมบูรณ์ภายใต้จุดอ่อน (และทีวีและทอพอโลยีอื่น ๆ ทั้งหมดที่ฉันเคยดู) จากนั้นฉันก็พบกับคำถามต่อไปนี้: โทโพโลยีมีอยู่ไหมว่าชุดการกระจายความน่าจะเป็นเสร็จสมบูรณ์หรือไม่ ถ้าไม่การขาดนั้นสะท้อนถึงคุณสมบัติที่น่าสนใจของการแจกแจงความน่าจะเป็นทั้งหมดหรือไม่? หรือมันน่าเบื่อ? หมายเหตุ: ฉันได้เขียนคำถามเกี่ยวกับ "การแจกแจงความน่าจะเป็น" แล้ว สิ่งเหล่านี้ไม่สามารถปิดได้เพราะพวกเขาสามารถรวมเข้ากับ Dirac และสิ่งต่าง ๆ เช่นที่ไม่มี pdf แต่มาตรการยังไม่ปิดภายใต้ทอพอโลยีที่อ่อนแอดังนั้นคำถามของฉันยังคงอยู่ …

1
คำถามเกี่ยวกับสมมติฐานทั่วไปของ t-test
สำหรับการทดสอบ t ตามข้อความส่วนใหญ่มีข้อสันนิษฐานว่าโดยทั่วไปข้อมูลประชากรจะถูกกระจายออกไป ฉันไม่เห็นว่าทำไม t-test ไม่เพียงต้องการให้การกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างแจกจ่ายตามปกติไม่ใช่ประชากรใช่หรือไม่ หากเป็นกรณีที่การทดสอบ t ในที่สุดต้องการความเป็นมาตรฐานในการแจกแจงตัวอย่างประชากรก็จะมีลักษณะเหมือนการกระจายตัวใช่ไหม? ตราบใดที่มีขนาดตัวอย่างที่เหมาะสม นั่นไม่ใช่ทฤษฎีบทขีด จำกัด กลางหรือไม่? (ฉันหมายถึงที่นี่เพื่อทดสอบตัวอย่างหนึ่งตัวอย่างหรือเป็นอิสระ)

3
ถ้า ,
สมมติต่อไปนี้การตั้งค่า: Let Zi=min{ki,Xi},i=1,...,nZi=min{ki,Xi},i=1,...,nZ_i = \min\{k_i, X_i\}, i=1,...,n n นอกจากนี้Xi∼U[ai,bi],ai,bi&gt;0Xi∼U[ai,bi],ai,bi&gt;0X_i \sim U[a_i, b_i], \; a_i, b_i >0 0 นอกจากนี้ki=cai+(1−c)bi,0&lt;c&lt;1ki=cai+(1−c)bi,0&lt;c&lt;1k_i = ca_i + (1-c)b_i,\;\; 0 k_i) = 1- \Pr(X_i \le k_i) =1−ki−aibi−ai=1−(1−c)(bi−ai)bi−ai=c=1−ki−aibi−ai=1−(1−c)(bi−ai)bi−ai=c= 1- \frac {k_i - a_i}{b_i-a_i} = 1-\frac {(1-c)(b_i-a_i)}{b_i-a_i} =c ดังนั้นใน FZi(zi)=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪0zi&lt;aizi−aibi−aiai≤zi&lt;ki1ki≤ziFZi(zi)={0zi&lt;aizi−aibi−aiai≤zi&lt;ki1ki≤ziF_{Z_i}(z_i) = \begin{cases} 0\qquad z_i0ที่zi=kizi=kiz_i = k_ik_i โดยรวมแล้วจะรวมกันเป็นหนึ่งเดียวกับ reals ฉันต้องการที่จะสามารถที่จะได้รับหรือพูดอะไรเกี่ยวกับการจัดจำหน่ายและ …

2
การบรรจบกันในการกระจาย \ CLT
ระบุว่า , distr แบบมีเงื่อนไข ของเป็น\ ไค ^ 2 (2n) Nมีความแตกต่างเล็กน้อย ของปัวซอง ( \ theta ), \ thetaเป็นค่าคงที่เป็นบวกN=nN=nN = nYYYχ2(2n)χ2(2n)\chi ^2(2n)NNNθθ\thetaθθ\theta แสดงว่าในขณะที่θ→∞θ→∞\theta \rightarrow \infty , (Y−E(Y))/Var(Y)−−−−−−√→N(0,1) (Y−E(Y))/Var⁡(Y)→N(0,1)\space \space (Y - E(Y))/ \sqrt{\operatorname{Var}(Y)} \rightarrow N(0,1)ในการกระจาย ใครสามารถแนะนำกลยุทธ์ในการแก้ปัญหานี้ ดูเหมือนว่าเราจำเป็นต้องใช้ CLT (Central Limit Theorem) แต่มันดูยากที่จะรับข้อมูลใด ๆ เกี่ยวกับYYYด้วยตัวเอง มี rv ที่สามารถแนะนำให้ใช้ตัวอย่างเพื่อสร้างYYYหรือไม่? นี่คือการบ้านดังนั้นคำแนะนำชื่นชม

1
ตัวอย่างของ CLT เมื่อไม่มีช่วงเวลา
พิจารณา Xn=⎧⎩⎨1−12kw.p. (1−2−n)/2w.p. (1−2−n)/2w.p. 2−k for k&gt;nXn={1w.p. (1−2−n)/2−1w.p. (1−2−n)/22kw.p. 2−k for k&gt;nX_n = \begin{cases} 1 & \text{w.p. } (1 - 2^{-n})/2\\ -1 & \text{w.p. } (1 - 2^{-n})/2\\ 2^k & \text{w.p. } 2^{-k} \text{ for } k > n\\ \end{cases} ฉันต้องแสดงให้เห็นว่าถึงแม้จะมีช่วงเวลาไม่สิ้นสุด n−−√(X¯n)→dN(0,1)n(X¯n)→dN(0,1)\sqrt{n}(\bar{X}_n) \overset{d}{\to} N(0,1) ฉันได้ลองแสดงสิ่งนี้โดยใช้ทฤษฎีความต่อเนื่องของเลวีคือพยายามแสดงให้เห็นว่าฟังก์ชั่นลักษณะของด้านซ้ายบรรจบกับฟังก์ชั่นลักษณะของมาตรฐานปกติ อย่างไรก็ตามเรื่องนี้ดูเหมือนจะเป็นไปไม่ได้ที่จะแสดง คำแนะนำที่มีให้สำหรับปัญหานี้คือการตัดส่วนแต่ละส่วนออก XiXiX_iคือปล่อยให้และใช้สภาพ Lindeberg เพื่อแสดงว่า …

2
พารามิเตอร์การบูตแบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับรุ่นผสม
ตัดต่อไปนี้จะนำมาจากบทความนี้ ฉันเป็นมือใหม่ในการบู๊ตสแตรปและพยายามที่จะใช้การบู๊ตสแปปปิ้งแบบกึ่งพารามิเตอร์แบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับแบบจำลองเชิงเส้นผสมกับR bootแพ็คเกจ รหัส R นี่คือRรหัสของฉัน: library(SASmixed) library(lme4) library(boot) fm1Cult &lt;- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn &lt;- function(data, indices){ data &lt;- data[indices, ] mod &lt;- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out &lt;- boot(data=Cultivation, statistic=boot.fn, R=99) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.