คำถามติดแท็ก self-study

แบบฝึกหัดประจำจากตำราหลักสูตรหรือแบบทดสอบที่ใช้สำหรับชั้นเรียนหรือเรียนด้วยตนเอง นโยบายของชุมชนนี้คือ "ให้คำแนะนำที่เป็นประโยชน์" สำหรับคำถามดังกล่าวแทนที่จะตอบเต็ม

2
EM ปัญหาการปฏิบัติอัลกอริทึม
นี่เป็นปัญหาการปฏิบัติสำหรับการสอบกลางภาค ปัญหาคือตัวอย่างอัลกอริทึม EM ฉันกำลังมีปัญหากับส่วน (f) ฉันแสดงรายการชิ้นส่วน (a) - (e) เพื่อความสมบูรณ์และในกรณีที่ฉันทำผิดพลาดก่อนหน้านี้ ให้เป็นอิสระตัวแปรสุ่มชี้แจงที่มีอัตราการ\น่าเสียดายที่ไม่มีการตรวจสอบค่าแท้จริงและเราจะสังเกตว่าค่าอยู่ในช่วงเวลาที่กำหนดหรือไม่ ให้ ,และ สำหรับ n ข้อมูลที่สังเกตประกอบด้วย{3j})X1,…,XnX1,…,XnX_1,\ldots,X_nθθ\thetaXXXXXXG1j=1{Xj&lt;1}G1j=1{Xj&lt;1}G_{1j} = \mathbb{1}\left\{X_j < 1\right\}G2j=1{1&lt;Xj&lt;2}G2j=1{1&lt;Xj&lt;2}G_{2j} = \mathbb{1}\left\{1< X_j<2\right\}G3j=1{Xj&gt;2}G3j=1{Xj&gt;2}G_{3j} = \mathbb{1}\left\{X_j > 2\right\}j=1,…,nj=1,…,nj=1,\ldots,n(G1j,G2j,G3j)(G1j,G2j,G3j)(G_{1j},G_{2j},G_{3j}) (a) ให้โอกาสในการสังเกตข้อมูล: L(θ|G)=∏j=1nPr{Xj&lt;1}G1jPr{1&lt;Xj&lt;2}G2jPr{Xj&gt;2}G3j=∏j=1n(1−e−θ)G1j(e−θ−e−2θ)G2j(e−2θ)G3jL(θ|G)=∏j=1nPr{Xj&lt;1}G1jPr{1&lt;Xj&lt;2}G2jPr{Xj&gt;2}G3j=∏j=1n(1−e−θ)G1j(e−θ−e−2θ)G2j(e−2θ)G3j\begin{align*} L(\theta | G) &= \prod_{j=1}^n \text{Pr}\left\{X_j < 1\right\}^{G_{1j}}\text{Pr}\left\{12\right\}^{G_{3j}}\\ &= \prod_{j=1}^n \left(1-e^{-\theta}\right)^{G_{1j}}\left(e^{-\theta}-e^{-2\theta}\right)^{G_{2j}}\left(e^{-2\theta}\right)^{G_{3j}} \end{align*} (b) ให้โอกาสในการเก็บข้อมูลอย่างสมบูรณ์ L(θ|X,G)=∏j=1n(θe−θxj)G1j(θe−θxj)G2j(θe−θxj)G3jL(θ|X,G)=∏j=1n(θe−θxj)G1j(θe−θxj)G2j(θe−θxj)G3j\begin{align*} L(\theta | X,G) &= \prod_{j=1}^n …

4
“ การกระจายตัวที่เป็นบวกอย่างเคร่งครัด” คืออะไร?
ฉันกำลังอ่าน "Causality" ของ Judea Pearl (รุ่นที่สอง 2009) และในส่วนที่ 1.1.5 ความเป็นอิสระและเงื่อนไขแบบกราสด์เขากล่าวว่า: ต่อไปนี้เป็นรายการ (บางส่วน) ของคุณสมบัติที่พึงพอใจโดยความสัมพันธ์ที่เป็นอิสระตามเงื่อนไข (X_ || _Y | Z) สมมาตร: (X_ || _ Y | Z) ==&gt; (Y_ || _X | Z) การสลายตัว: (X_ || _ YW | Z) ==&gt; (X_ || _Y | Z) การรวมที่อ่อนแอ: (X_ || _ YW | …

2
การบรรจบกันในการกระจาย \ CLT
ระบุว่า , distr แบบมีเงื่อนไข ของเป็น\ ไค ^ 2 (2n) Nมีความแตกต่างเล็กน้อย ของปัวซอง ( \ theta ), \ thetaเป็นค่าคงที่เป็นบวกN=nN=nN = nYYYχ2(2n)χ2(2n)\chi ^2(2n)NNNθθ\thetaθθ\theta แสดงว่าในขณะที่θ→∞θ→∞\theta \rightarrow \infty , (Y−E(Y))/Var(Y)−−−−−−√→N(0,1) (Y−E(Y))/Var⁡(Y)→N(0,1)\space \space (Y - E(Y))/ \sqrt{\operatorname{Var}(Y)} \rightarrow N(0,1)ในการกระจาย ใครสามารถแนะนำกลยุทธ์ในการแก้ปัญหานี้ ดูเหมือนว่าเราจำเป็นต้องใช้ CLT (Central Limit Theorem) แต่มันดูยากที่จะรับข้อมูลใด ๆ เกี่ยวกับYYYด้วยตัวเอง มี rv ที่สามารถแนะนำให้ใช้ตัวอย่างเพื่อสร้างYYYหรือไม่? นี่คือการบ้านดังนั้นคำแนะนำชื่นชม

1
ตัวอย่างของ CLT เมื่อไม่มีช่วงเวลา
พิจารณา Xn=⎧⎩⎨1−12kw.p. (1−2−n)/2w.p. (1−2−n)/2w.p. 2−k for k&gt;nXn={1w.p. (1−2−n)/2−1w.p. (1−2−n)/22kw.p. 2−k for k&gt;nX_n = \begin{cases} 1 & \text{w.p. } (1 - 2^{-n})/2\\ -1 & \text{w.p. } (1 - 2^{-n})/2\\ 2^k & \text{w.p. } 2^{-k} \text{ for } k > n\\ \end{cases} ฉันต้องแสดงให้เห็นว่าถึงแม้จะมีช่วงเวลาไม่สิ้นสุด n−−√(X¯n)→dN(0,1)n(X¯n)→dN(0,1)\sqrt{n}(\bar{X}_n) \overset{d}{\to} N(0,1) ฉันได้ลองแสดงสิ่งนี้โดยใช้ทฤษฎีความต่อเนื่องของเลวีคือพยายามแสดงให้เห็นว่าฟังก์ชั่นลักษณะของด้านซ้ายบรรจบกับฟังก์ชั่นลักษณะของมาตรฐานปกติ อย่างไรก็ตามเรื่องนี้ดูเหมือนจะเป็นไปไม่ได้ที่จะแสดง คำแนะนำที่มีให้สำหรับปัญหานี้คือการตัดส่วนแต่ละส่วนออก XiXiX_iคือปล่อยให้และใช้สภาพ Lindeberg เพื่อแสดงว่า …

2
ความแปรปรวนของค่าเฉลี่ยตัวอย่างของตัวอย่างบู๊ตสแตรป
ให้เป็นข้อสังเกตที่ชัดเจน (ไม่มีความสัมพันธ์) ให้แสดงตัวอย่าง bootstrap (ตัวอย่างจาก CDF เชิงประจักษ์) และให้{*} ค้นหาและ{*})X1,...,XnX1,...,XnX_{1},...,X_{n}X∗1,...,X∗nX1∗,...,Xn∗X_{1}^{*},...,X_{n}^{*}X¯* * * *n=1nΣni = 1X* * * *ผมX¯n∗=1n∑i=1nXi∗\bar{X}_{n}^{*}=\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*}E(X¯* * * *n)E(X¯n∗)E(\bar{X}_{n}^{*})V a r (X¯* * * *n)Var(X¯n∗)\mathrm{Var}(\bar{X}_{n}^{*}) สิ่งที่ฉันมีอยู่คือคือแต่ละอันมีความน่าจะเป็นดังนั้น and ซึ่งให้ X* * * *ผมXi∗X_{i}^{*}X1, . . . ,XnX1,...,XnX_{1},...,X_{n}1n1n\frac{1}{n}E(X* * * *ผม) =1nE(X1) + . . . +1nE(Xn) =n μn= μE(Xi∗)=1nE(X1)+...+1nE(Xn)=nμn=μ E(X_{i}^{*})=\frac{1}{n}E(X_{1})+...+\frac{1}{n}E(X_{n})=\frac{n\mu}{n}=\mu …

2
ความคาดหวังของความฉลาดทางของผลรวมของตัวแปรสุ่ม IID (แผ่นงานมหาวิทยาลัยเคมบริดจ์)
ฉันกำลังเตรียมตัวสำหรับการสัมภาษณ์ที่ต้องมีความรู้เกี่ยวกับความน่าจะเป็นพื้นฐาน (อย่างน้อยก็ต้องผ่านการสัมภาษณ์ด้วยตัวเอง) ฉันกำลังทำงานผ่านแผ่นงานด้านล่างจากวันที่นักเรียนของฉันเป็นการแก้ไข ส่วนใหญ่แล้วจะตรงไปตรงมา แต่ฉันก็นิ่งงันกับคำถามที่ 12 http://www.trin.cam.ac.uk/dpk10/IA/exsheet2.pdf ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชม แก้ไข: คำถามคือ: สมมติว่า X1,X2,...X1,X2,...X_1, X_2, ... เป็นตัวแปรสุ่มที่เป็นค่าบวกเชิงบวกแบบกระจายแบบอิสระ E(X1)=μ&lt;∞E(X1)=μ&lt;∞\mathbb{E}(X_1) = \mu < \infty และ E(X−11)&lt;∞E(X1−1)&lt;∞\mathbb{E}(X_1^{-1}) < \infty. ปล่อยSn=Σni = 1XผมSn=∑i=1nXiS_n = \sum_{i=1}^n X_i. แสดงว่าE (Sม./Sn) = m / nE(Sm/Sn)=m/n\mathbb{E}(S_m/S_n) = m/n เมื่อไหร่ m &lt; = nm&lt;=nm<=nและ E (Sม./Sn) = 1 + …

3
หนังสือเกี่ยวกับนิเวศวิทยาทางสถิติ?
ฉันรู้ว่าคำถามนี้ถูกถามมาก่อน: หนังสืออ้างอิงสำหรับการศึกษาทางนิเวศวิทยาแต่ไม่ใช่สิ่งที่ฉันกำลังมองหา สิ่งที่ฉันกำลังมองหาคือถ้าใครสามารถแนะนำหนังสือที่ดี (หรืออ้างอิงที่เป็นที่ยอมรับ) เกี่ยวกับนิเวศวิทยาทางสถิติ? ฉันมีความเข้าใจเกี่ยวกับสถิติเป็นอย่างดีดังนั้นหนังสือเล่มนี้อาจอยู่ในระดับใดก็ได้ ฉันจะใช้หนังสือเล่มนี้เพื่อสอนตัวเองเกี่ยวกับการประยุกต์ใช้สถิติทางนิเวศวิทยามากกว่าสิ่งอื่นดังนั้นแม้แต่หนังสือเกริ่นนำที่มีตัวอย่างที่ดี / น่าสนใจก็จะได้รับการชื่นชมมาก นอกจากนี้งานวิจัยของฉันมีแนวโน้มที่จะมุ่งเน้นไปที่สถิติแบบเบย์ดังนั้นหนังสือที่รวมเอาสถิติแบบเบย์นั้นดียิ่งขึ้น!

1
ภายใต้สมมติฐานใดที่วิธีธรรมดากำลังสองน้อยที่สุดให้ตัวประมาณที่มีประสิทธิภาพและไม่เอนเอียง?
เป็นจริงหรือไม่ที่ภายใต้สมมติฐาน Gauss Markov วิธีการกำลังสองน้อยที่สุดแบบธรรมดาให้ตัวประมาณที่มีประสิทธิภาพและไม่เอนเอียง? ดังนั้น: E(ut)=0E(ut)=0E(u_t)=0 เพื่อทุกสิ่ง ttt E(utus)=σ2E(utus)=σ2E(u_tu_s)=\sigma^2 สำหรับt=st=st=s E(utus)=0E(utus)=0E(u_tu_s)=0 สำหรับt≠st≠st\neq s โดยที่เป็นคนตกค้างuuu

1
จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร
สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
การแพร่กระจายของข้อผิดพลาดโดยใช้ชุดลำดับที่ 2 ของ Taylor
ฉันกำลังอ่านข้อความ "สถิติคณิตศาสตร์และการวิเคราะห์ข้อมูล" โดย John Rice เรามีความกังวลกับการใกล้เคียงกับค่าที่คาดหวังและความแปรปรวนของตัวแปรสุ่มYเราสามารถที่จะคำนวณมูลค่าที่คาดหวังและความแปรปรวนของตัวแปรสุ่มและเรารู้ว่าความสัมพันธ์Y = กรัม (X) ดังนั้นจึงเป็นไปได้ที่จะใกล้เคียงกับค่าที่คาดหวังและความแปรปรวนของYโดยใช้การขยายตัวของซีรีส์เทย์เลอร์กรัมเกี่ยวกับ\ mu_XYYYXXXY=g(X)Y=g(X)Y = g(X)YYYgggμXμX\mu_X บนหน้า 162 เขารายการสมการ 3 ค่าที่คาดหวังของYYYโดยใช้การขยายอนุกรมลำดับที่ 1 ของเทย์เลอร์ มันเป็น: μY≈g(μX)μY≈g(μX)\mu_Y \approx g(\mu_X)mu_X) นี้จะเรียกว่าต่อมาในคำถามของฉันเป็นE(Y1)E(Y1)E(Y_1)(Y_1) ความแปรปรวนของYYYโดยใช้การขยายอนุกรมลำดับที่ 1 ของเทย์เลอร์ มันเป็น: σ2Y≈σ2X(g′(μX))2σY2≈σX2(g′(μX))2\sigma_Y^2 \approx \sigma_X^2 (g'(\mu_X))^2 2 นี้จะเรียกว่าต่อมาในคำถามของฉันเป็นVar(Y1)Var(Y1)Var(Y_1)(Y_1) ค่าที่คาดหวังของYYYโดยใช้การขยายอนุกรมลำดับที่ 2 ของเทย์เลอร์ มันเป็นμY≈g(μX)+12σ2Xg′′(μX)μY≈g(μX)+12σX2g″(μX)\mu_Y \approx g(\mu_X) + \frac12 \sigma_X^2 g''(\mu_X)mu_X) นี้จะเรียกว่าต่อมาในคำถามของฉันเป็นE(Y2)E(Y2)E(Y_2)(Y_2) โปรดทราบว่ามีการแสดงออกที่แตกต่างกันสองประการสำหรับYYYเพราะเราใช้คำสั่งที่แตกต่างกันสองคำในการขยายซีรี่ส์เทย์เลอร์ สมการที่ 1 และ …

1
การถดถอยมุมน้อยทำให้ค่าสหสัมพันธ์ลดลงและโยงกัน?
ฉันพยายามที่จะแก้ปัญหาอย่างน้อยการถดถอยมุม (LAR) นี่เป็นปัญหา3.23ในหน้า97ของHastie et al., องค์ประกอบของการเรียนรู้ทางสถิติ, อันดับที่ 2 เอ็ด (พิมพ์ครั้งที่ 5) พิจารณาปัญหาการถดถอยกับตัวแปรทั้งหมดและการตอบสนองที่มีค่าเฉลี่ยเป็นศูนย์และส่วนเบี่ยงเบนมาตรฐานหนึ่ง สมมติว่าตัวแปรแต่ละตัวมีความสัมพันธ์แบบสัมบูรณ์เหมือนกันกับการตอบสนอง: 1ยังไม่มีข้อความ| ⟨xJ, y ⟩ | = λ , J = 1 , . . , p1N|⟨xj,y⟩|=λ,j=1,...,p \frac{1}{N} | \left \langle \bf{x}_j, \bf{y} \right \rangle | = \lambda, j = 1, ..., p ปล่อยเป็นสัมประสิทธิ์กำลังสองน้อยที่สุดของใน\ mathbf {X}และปล่อยให้\ mathbf {u} …

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
การค้นหาความหนาแน่นส่วนต่างของ
ตามที่ชื่อบอกว่าฉันกำลังมองหาความหนาแน่นของ f(x,y)=c1−x2−y2−−−−−−−−−√,x2+y2≤1.f(x,y)=c1−x2−y2,x2+y2≤1.f (x,y) = c \sqrt{1 - x^2 - y^2}, x^2 + y^2 \leq 1. จนถึงตอนนี้ฉันได้พบ ccc เป็น 32π32π\frac{3}{2 \pi}. ฉันคิดออกว่าผ่านการแปลงf(x,y)f(x,y)f(x,y) เป็นพิกัดเชิงขั้วและรวมเข้าด้วยกัน drdθdrdθdrd\thetaซึ่งเป็นเหตุผลที่ฉันติดอยู่ในส่วนความหนาแน่นเล็กน้อย ฉันรู้แล้วฉx( x ) =∫∞- ∞ฉ( x , y) dYฉx(x)=∫-∞∞ฉ(x,Y)dYf_x(x) = \int_{-\infty}^\infty f(x,y)dyแต่ฉันไม่แน่ใจว่าจะแก้ปัญหาอย่างไรโดยไม่ได้รับอินทิกรัลยุ่งขนาดใหญ่และฉันรู้ว่าคำตอบนั้นไม่ควรจะเป็นอินทิกรัลยุ่งขนาดใหญ่ มันเป็นไปได้ที่จะหาแทนF( x , y)F(x,Y)F(x,y)แล้วจึงนำ dFdxdFdx\frac{dF}{dx} การค้นหา ฉx( x )ฉx(x)f_x(x)? ดูเหมือนจะเป็นวิธีที่ใช้งานง่าย แต่ฉันไม่สามารถหาอะไรในตำราเรียนของฉันที่ระบุความสัมพันธ์เหล่านั้นดังนั้นฉันจึงไม่ต้องการตั้งสมมติฐานที่ผิด

3
การแจกแจงแบบปกติ
มีปัญหาทางสถิติที่ฉันโชคไม่ดีที่ไม่รู้จะเริ่มต้นอย่างไร (ฉันกำลังศึกษาด้วยตัวเองดังนั้นจึงไม่มีใครถามได้ถ้าฉันไม่เข้าใจอะไร คำถามคือ X,YX,YX,Y iidN(a,b2);a=0;b2=6;var(X2+Y2)=?N(a,b2);a=0;b2=6;var(X2+Y2)=?N(a,b^2); a=0; b^2=6; var(X^2+Y^2)=?
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.