คำถามติดแท็ก mathematical-statistics

ทฤษฎีทางคณิตศาสตร์ของสถิติที่เกี่ยวข้องกับคำจำกัดความที่เป็นทางการและผลลัพธ์ทั่วไป

1
ฟังก์ชันการสร้างช่วงเวลาของผลิตภัณฑ์ภายในของเวกเตอร์สุ่มเกาส์สองตัว
ใครช่วยได้โปรดแนะนำว่าฉันจะคำนวณฟังก์ชันสร้างโมเมนต์ของผลิตภัณฑ์ภายในของเวกเตอร์สุ่มแบบเกาส์สองตัวได้อย่างไรแต่ละแบบกระจายเป็นเป็นอิสระจากกัน? มีผลลัพธ์มาตรฐานสำหรับสิ่งนี้ไหม ตัวชี้ใด ๆ ที่ชื่นชมอย่างมากยังไม่มีข้อความ( 0 ,σ2)N(0,σ2)\mathcal N(0,\sigma^2)

1
หนังสือที่แนะนำเกี่ยวกับสถิติเชิงพื้นที่
อะไรคือหนังสือที่ดีที่สุดสำหรับการศึกษา i) ความแปรปรวนของตัวแปร univariate และหลายตัวแปร (ข้อมูลจริงนับจำนวน) ทั่วโดเมนเชิงพื้นที่ ii) การสุ่มตัวอย่างตัวแปร univariate หรือตัวแปรหลายตัวแปรตามการกระจายข้ามพื้นที่เชิงพื้นที่ (การสุ่มตัวอย่างเชิงพื้นที่ในระยะสั้น)

1
ช่วงเวลากลางของการแจกแจงแบบสมมาตร
ฉันพยายามแสดงให้เห็นว่าช่วงเวลากลางของการแจกแจงแบบสมมาตร: เป็นศูนย์สำหรับเลขคี่ ดังนั้นตัวอย่างเช่นช่วงเวลากลางที่สามฉันเริ่มต้นด้วยการพยายามแสดงให้เห็นว่าฉันไม่แน่ใจว่าจะไปจากที่นี่ข้อเสนอแนะใด ๆ ? มีวิธีที่ดีกว่าในการพิสูจน์เรื่องนี้หรือไม่?ฉx( a + x ) =ฉx( a - x )fx(a+x)=fx(a−x){\bf f}_x{\bf (a+x)} = {\bf f}_x{\bf(a-x)}E [ ( X - u))3] = 0E[(X−u)3]=0.{\bf E[(X-u)^3] = 0}.E [ ( X - u))3] = E [X3] - 3 u E [X2] + 3ยู2E [ X ] -ยู3.E[(X−u)3]=E[X3]−3uE[X2]+3u2E[X]−u3.{\bf E[(X-u)^3] …

2
ทำไมปริมาณความแปรปรวนอธิบายโดยคอมพิวเตอร์เครื่องที่ 1 ของฉันจึงใกล้เคียงกับค่าสหสัมพันธ์แบบคู่เฉลี่ย?
อะไรคือความสัมพันธ์ระหว่างองค์ประกอบหลักแรกและความสัมพันธ์เฉลี่ยในเมทริกซ์ความสัมพันธ์ ตัวอย่างเช่นในแอปพลิเคชันเชิงประจักษ์ฉันสังเกตว่าความสัมพันธ์โดยเฉลี่ยเกือบจะเหมือนกับอัตราส่วนของความแปรปรวนขององค์ประกอบหลักตัวแรก (ค่าเริ่มต้นแรก) ต่อความแปรปรวนทั้งหมด (ผลรวมของค่าลักษณะเฉพาะทั้งหมด) มีความสัมพันธ์ทางคณิตศาสตร์หรือไม่? ด้านล่างคือแผนภูมิของผลลัพธ์เชิงประจักษ์ โดยที่ correlation คือค่าสหสัมพันธ์โดยเฉลี่ยระหว่างองค์ประกอบดัชนีหุ้น DAX ที่คำนวณได้จากการคำนวณในช่วงเวลา 15 วันและความแปรปรวนที่อธิบายคือส่วนแบ่งความแปรปรวนที่อธิบายโดยองค์ประกอบหลักตัวแรกที่คำนวณด้วยหน้าต่างกลิ้ง 15 วัน สิ่งนี้สามารถอธิบายได้ด้วยตัวแบบปัจจัยความเสี่ยงทั่วไปเช่น CAPM หรือไม่?

1
จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร
สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
ฉันจะพิสูจน์ได้อย่างไรว่าข้อมูลการทดสอบเป็นไปตามการกระจายแบบหางยาว
ฉันมีผลการทดสอบการตอบสนองของเซิร์ฟเวอร์ที่ล่าช้าหลายครั้ง จากการวิเคราะห์ทางทฤษฎีของเราการแจกแจงความล่าช้า (ฟังก์ชันการแจกแจงความน่าจะเป็นของความล่าช้าในการตอบกลับ) ควรมีพฤติกรรมแบบหางยาว แต่ฉันจะพิสูจน์ได้อย่างไรว่าผลการทดสอบมีการกระจายอย่างหนัก

1
การแพร่กระจายของข้อผิดพลาดโดยใช้ชุดลำดับที่ 2 ของ Taylor
ฉันกำลังอ่านข้อความ "สถิติคณิตศาสตร์และการวิเคราะห์ข้อมูล" โดย John Rice เรามีความกังวลกับการใกล้เคียงกับค่าที่คาดหวังและความแปรปรวนของตัวแปรสุ่มYเราสามารถที่จะคำนวณมูลค่าที่คาดหวังและความแปรปรวนของตัวแปรสุ่มและเรารู้ว่าความสัมพันธ์Y = กรัม (X) ดังนั้นจึงเป็นไปได้ที่จะใกล้เคียงกับค่าที่คาดหวังและความแปรปรวนของYโดยใช้การขยายตัวของซีรีส์เทย์เลอร์กรัมเกี่ยวกับ\ mu_XYYYXXXY=g(X)Y=g(X)Y = g(X)YYYgggμXμX\mu_X บนหน้า 162 เขารายการสมการ 3 ค่าที่คาดหวังของYYYโดยใช้การขยายอนุกรมลำดับที่ 1 ของเทย์เลอร์ มันเป็น: μY≈g(μX)μY≈g(μX)\mu_Y \approx g(\mu_X)mu_X) นี้จะเรียกว่าต่อมาในคำถามของฉันเป็นE(Y1)E(Y1)E(Y_1)(Y_1) ความแปรปรวนของYYYโดยใช้การขยายอนุกรมลำดับที่ 1 ของเทย์เลอร์ มันเป็น: σ2Y≈σ2X(g′(μX))2σY2≈σX2(g′(μX))2\sigma_Y^2 \approx \sigma_X^2 (g'(\mu_X))^2 2 นี้จะเรียกว่าต่อมาในคำถามของฉันเป็นVar(Y1)Var(Y1)Var(Y_1)(Y_1) ค่าที่คาดหวังของYYYโดยใช้การขยายอนุกรมลำดับที่ 2 ของเทย์เลอร์ มันเป็นμY≈g(μX)+12σ2Xg′′(μX)μY≈g(μX)+12σX2g″(μX)\mu_Y \approx g(\mu_X) + \frac12 \sigma_X^2 g''(\mu_X)mu_X) นี้จะเรียกว่าต่อมาในคำถามของฉันเป็นE(Y2)E(Y2)E(Y_2)(Y_2) โปรดทราบว่ามีการแสดงออกที่แตกต่างกันสองประการสำหรับYYYเพราะเราใช้คำสั่งที่แตกต่างกันสองคำในการขยายซีรี่ส์เทย์เลอร์ สมการที่ 1 และ …

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.