คำถามติดแท็ก variance

ความเบี่ยงเบนกำลังสองของตัวแปรสุ่มที่คาดหวังจากค่าเฉลี่ย หรือค่าเบี่ยงเบนยกกำลังสองเฉลี่ยของข้อมูลเกี่ยวกับค่าเฉลี่ย

1
การคำนวณซ้ำของเอฟเฟกต์จากโมเดล lmer
ฉันเพิ่งอ่านบทความนี้ซึ่งอธิบายถึงวิธีการคำนวณความสามารถในการทำซ้ำ (ความน่าเชื่อถือหรือความสัมพันธ์ภายในอินทราเน็ต) ของการวัดผ่านการสร้างแบบจำลองเอฟเฟกต์ผสม รหัส R จะเป็น: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

1
การดำรงอยู่ของฟังก์ชั่นการสร้างโมเมนต์และความแปรปรวน
การแจกแจงที่มีค่าเฉลี่ย จำกัด และความแปรปรวนแบบไม่สิ้นสุดมีฟังก์ชันสร้างช่วงเวลาได้หรือไม่? แล้วการกระจายตัวที่มีค่าเฉลี่ย จำกัด และความแปรปรวนอัน จำกัด แต่ช่วงเวลาที่สูงขึ้นไม่มีที่สิ้นสุด?
28 variance  moments  mgf 

1
องศาอิสระเป็นหมายเลขที่ไม่ใช่จำนวนเต็มหรือไม่
เมื่อฉันใช้ GAM มันให้ DF ที่เหลือกับฉันคือ (บรรทัดสุดท้ายในรหัส) นั่นหมายความว่าอย่างไร? นอกเหนือไปจากตัวอย่างของ GAM โดยทั่วไปแล้วจำนวนองศาความเป็นอิสระจะเป็นจำนวนที่ไม่ใช่จำนวนเต็มหรือไม่26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

2
การเปลี่ยนแปลงเหมือนกับความแปรปรวนหรือไม่
นี่เป็นคำถามแรกของฉันในการตรวจสอบความถูกต้องของ Cross ที่นี่ดังนั้นโปรดช่วยฉันแม้ว่ามันจะดูเล็กน้อย :-) ก่อนอื่นคำถามอาจเป็นผลลัพธ์ของความแตกต่างทางภาษาหรือบางทีฉันมีข้อบกพร่องทางสถิติที่แท้จริง อย่างไรก็ตามนี่คือ: ในสถิติประชากรการแปรปรวนและความแปรปรวนเป็นคำเดียวกันหรือไม่ ถ้าไม่ความแตกต่างระหว่างสองคืออะไร ฉันรู้ว่าความแปรปรวนเป็นกำลังสองของค่าเบี่ยงเบนมาตรฐาน ฉันรู้ด้วยเช่นกันว่ามันเป็นการวัดว่าข้อมูลกระจัดกระจายแค่ไหนและฉันรู้วิธีการคำนวณ อย่างไรก็ตามฉันได้ติดตามหลักสูตร Coursera.org ที่เรียกว่า "การคิดแบบจำลอง" และผู้บรรยายอธิบายความแปรปรวนอย่างชัดเจน นั่นทำให้ฉันสับสนเล็กน้อย เพื่อความเป็นธรรมเขามักจะพูดคุยเกี่ยวกับการเปลี่ยนแปลงของอินสแตนซ์บางอย่างในประชากร ใครช่วยอธิบายให้ฉันได้ไหมถ้าคนเหล่านั้นใช้แทนกันได้หรือบางทีฉันอาจจะพลาดอะไรบางอย่างไป?

2
ความแตกต่างระหว่างความแปรปรวนกับความคลาดเคลื่อนกำลังสองเฉลี่ยคืออะไร
ฉันประหลาดใจที่สิ่งนี้ไม่ได้ถูกถามมาก่อน แต่ฉันไม่สามารถหาคำถามเกี่ยวกับสถิติได้ นี่คือสูตรในการคำนวณความแปรปรวนของตัวอย่างที่กระจายแบบปกติ: ∑(X−X¯)2n−1∑(X−X¯)2n−1\frac{\sum(X - \bar{X}) ^2}{n-1} นี่คือสูตรในการคำนวณความคลาดเคลื่อนเฉลี่ยกำลังสองของการสังเกตในการถดถอยเชิงเส้นอย่างง่าย: ∑(yi−y^i)2n−2∑(yi−y^i)2n−2\frac{\sum(y_i - \hat{y}_i) ^2}{n-2} สูตรสองสูตรนี้แตกต่างกันอย่างไร? ความแตกต่างเดียวที่ฉันสามารถเห็นคือ MSE ใช้n-2ดังนั้นถ้านั่นคือความแตกต่างเท่านั้นทำไมไม่เรียกพวกเขาว่าเป็นทั้งความแปรปรวน แต่ด้วยระดับความอิสระที่แตกต่างกัน?n−2n−2n-2
27 variance  error 

5
ทำไมเราถึงต้องใช้สแควร์รูทของความแปรปรวนเพื่อสร้างความเบี่ยงเบนมาตรฐาน
ขออภัยหากมีการตอบที่อื่นฉันไม่สามารถหาได้ ฉันสงสัยว่าทำไมเราถึงใช้สแควร์รูทโดยเฉพาะความแปรปรวนเพื่อสร้างส่วนเบี่ยงเบนมาตรฐาน มันเกี่ยวกับการรากที่สองที่สร้างมูลค่าที่มีประโยชน์คืออะไร?

3
ช่วงความเชื่อมั่นสำหรับความแปรปรวนที่กำหนดหนึ่งการสังเกต
นี่เป็นปัญหาจาก "7th Kolmogorov Student Olympiad in The Probability Theory Theory": เมื่อทำการสังเกตจาก aโดยไม่ทราบพารามิเตอร์ทั้งสองให้ช่วงความมั่นใจสำหรับด้วยระดับความมั่นใจอย่างน้อย 99%XXXNormal(μ,σ2)Normal⁡(μ,σ2)\operatorname{Normal}(\mu,\sigma^2)σ2σ2\sigma^2 สำหรับฉันแล้วมันน่าจะเป็นไปไม่ได้ ฉันมีวิธีแก้ปัญหา แต่ยังไม่ได้อ่าน ความคิดใด ๆ ฉันจะโพสต์โซลูชันในอีกสองสามวัน [การแก้ไขการติดตาม: การแก้ปัญหาอย่างเป็นทางการที่โพสต์ด้านล่าง วิธีแก้ปัญหาของ Cardinal นั้นยาวกว่า แต่ให้ช่วงความมั่นใจที่ดีกว่า ขอบคุณ Max และ Glen_b สำหรับอินพุตของพวกเขา]

2
เหตุใดความแปรปรวนของตัวอย่างจึงเปลี่ยนไปถ้าการสังเกตซ้ำกัน
ความแปรปรวนกล่าวกันว่าเป็นมาตรวัดการแพร่กระจาย ดังนั้นฉันจึงคิดว่าความแปรปรวนของ3,5เท่ากับความแปรปรวน3,3,5,5เนื่องจากจำนวนนั้นกระจายเท่ากัน แต่นี่ไม่ใช่กรณีที่ความแปรปรวนของ3,5คือ2ในขณะที่ความแปรปรวนของการเป็น3,3,5,51 1/3 ปริศนานี้ทำให้ฉันได้รับคำอธิบายว่าความแปรปรวนควรจะเป็นตัวชี้วัดการแพร่กระจาย ดังนั้นในบริบทนั้นการวัดการแพร่กระจายหมายถึงอะไร
25 variance 

1
ค่าเบี่ยงเบนมาตรฐานของการสังเกตที่ถูกทำให้โค้งงอ
ฉันมีชุดข้อมูลของการสังเกตตัวอย่างเก็บไว้เป็นจำนวนภายในช่วงถังขยะ เช่น: min/max count 40/44 1 45/49 2 50/54 3 55/59 4 70/74 1 ทีนี้การหาค่าประมาณโดยเฉลี่ยจากสิ่งนี้ค่อนข้างตรงไปตรงมา เพียงใช้ค่าเฉลี่ย (หรือค่ามัธยฐาน) ของแต่ละช่วง bin เป็นค่าสังเกตและนับเป็นน้ำหนักและหาค่าเฉลี่ยถ่วงน้ำหนัก: x¯∗=1∑Ni=1wi∑i=1Nwixix¯∗=1∑i=1Nwi∑i=1Nwixi\bar{x}^* = \frac{1}{\sum_{i=1}^N w_i} \sum_{i=1}^N w_ix_i สำหรับกรณีทดสอบของฉันนี่ให้ฉัน 53.82 คำถามของฉันตอนนี้คือวิธีที่ถูกต้องในการหาค่าเบี่ยงเบนมาตรฐาน (หรือความแปรปรวน) คืออะไร? จากการค้นหาของฉันฉันพบคำตอบหลายข้อ แต่ฉันไม่แน่ใจว่ามีชุดไหนที่เหมาะสมกับชุดข้อมูลของฉัน ผมสามารถที่จะหาสูตรต่อไปนี้ทั้งในคำถามที่นี่อีกและเอกสาร NIST สุ่ม s2∗=∑Ni=1wi(xi−x¯∗)2(M−1)M∑Ni=1wis2∗=∑i=1Nwi(xi−x¯∗)2(M−1)M∑i=1Nwis^{2*} = \frac{ \sum_{i=1}^N w_i (x_i - \bar{x}^*)^2 }{ \frac{(M-1)}{M} \sum_{i=1}^N w_i } ซึ่งให้ค่าเบี่ยงเบนมาตรฐาน …

2
การสุ่มตัวอย่างที่สำคัญคืออะไร?
ฉันพยายามเรียนรู้การเสริมแรงและหัวข้อนี้ทำให้ฉันสับสนจริงๆ ฉันได้แนะนำสถิติไปแล้ว แต่ฉันไม่เข้าใจหัวข้อนี้อย่างสังหรณ์ใจ

2
การแก้ไขอคติในความแปรปรวนแบบถ่วงน้ำหนัก
สำหรับความแปรปรวนแบบไม่มีน้ำหนัก มีค่าความแปรปรวนตัวอย่างที่มีอคติถูกแก้ไขเมื่อค่าเฉลี่ยถูกประเมินจากข้อมูลเดียวกัน: Var(X):=1n∑i(xi−μ)2Var(X):=1n∑i(xi−μ)2\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2Var(X):=1n−1∑i(xi−E[X])2Var(X):=1n−1∑i(xi−E[X])2\text{Var}(X):=\frac{1}{n-1}\sum_i(x_i - E[X])^2 ฉันกำลังดูค่าเฉลี่ยและความแปรปรวนแบบถ่วงน้ำหนักและสงสัยว่าการแก้ไขความลำเอียงที่เหมาะสมสำหรับความแปรปรวนแบบถ่วงน้ำหนักคืออะไร การใช้: ค่าเฉลี่ย( X)) : = 1ΣผมωผมΣผมωผมxผมค่าเฉลี่ย(X)=1ΣผมωผมΣผมωผมxผม\text{mean}(X):=\frac{1}{\sum_i \omega_i}\sum_i \omega_i x_i "ไร้เดียงสา" ความแปรปรวนที่ไม่ได้แก้ไขที่ฉันใช้อยู่คือ: Var ( X) : = 1ΣผมωผมΣผมωผม( xผม- ค่าเฉลี่ย( X)) )2Var(X):=1∑iωi∑iωi(xi−mean(X))2\text{Var}(X):=\frac{1}{\sum_i \omega_i}\sum_i\omega_i(x_i - \text{mean}(X))^2 ดังนั้นฉันสงสัยว่าวิธีที่ถูกต้องในการแก้ไขอคติคืออะไร A) Var ( X) : = 1Σผมωผม- 1Σผมωผม( xผม−mean(X))2Var(X):=1∑iωi−1∑iωi(xi−mean(X))2\text{Var}(X):=\frac{1}{\sum_i \omega_i - 1}\sum_i\omega_i(x_i - \text{mean}(X))^2 หรือ B) Var …


1
แสดงให้เห็นว่าการวัด 100 ครั้งสำหรับ 5 วัตถุให้ข้อมูลน้อยกว่าการวัด 5 ครั้งสำหรับ 100 วัตถุ
ในการประชุมฉันได้ยินคำสั่งต่อไปนี้: การวัด 100 ครั้งสำหรับ 5 วิชาให้ข้อมูลน้อยกว่าการวัด 5 รายการสำหรับ 100 วิชา เห็นได้ชัดว่ามันเป็นเรื่องจริง แต่ฉันสงสัยว่าจะพิสูจน์ได้ในเชิงคณิตศาสตร์อย่างไร ... ฉันคิดว่าแบบจำลองเชิงเส้นผสมสามารถใช้งานได้ อย่างไรก็ตามฉันไม่รู้อะไรมากเกี่ยวกับคณิตศาสตร์ที่ใช้ในการประมาณค่า (ฉันเพิ่งเรียกใช้lmer4สำหรับ LMM และbmrsสำหรับ GLMMs) คุณช่วยแสดงตัวอย่างของสิ่งที่เป็นจริงได้ไหม ฉันต้องการคำตอบกับสูตรบางอย่างมากกว่าแค่บางโค้ดใน R. รู้สึกอิสระที่จะตั้งค่าอย่างง่ายเช่นตัวแบบผสมแบบเชิงเส้นที่มีการสกัดแบบสุ่มและการลาดชันแบบกระจายตามปกติ ป.ล. คำตอบทางคณิตศาสตร์ที่ไม่เกี่ยวข้องกับ LMM ก็ถือว่าใช้ได้เช่นกัน ฉันคิดถึง LMM เพราะพวกเขาดูเหมือนจะเป็นเครื่องมือตามธรรมชาติที่จะอธิบายว่าทำไมการวัดน้อยลงจากวิชาเพิ่มเติมนั้นดีกว่าการวัดเพิ่มเติมจากบางวิชา แต่ฉันอาจผิด

2
วิธีการทดสอบความแตกต่างของความแปรปรวนร่วมกับข้อมูลวงกลม
ฉันสนใจที่จะเปรียบเทียบจำนวนความแปรปรวนภายใน 8 ตัวอย่างที่แตกต่างกัน (แต่ละอันจากประชากรที่แตกต่างกัน) ฉันทราบว่าสามารถทำได้หลายวิธีด้วยข้อมูลอัตราส่วน: ความเท่าเทียมกันของการทดสอบความแปรปรวนของ F-test, การทดสอบ Levene เป็นต้น อย่างไรก็ตามข้อมูลของฉันเป็นแบบวงกลม / ทิศทาง (เช่นข้อมูลที่แสดงช่วงเวลาเช่นทิศทางลมและข้อมูลเชิงมุมทั่วไปหรือเวลาของวัน) ฉันได้ทำการวิจัยและพบหนึ่งการทดสอบในแพ็คเกจ "CircStats" ใน R - "การทดสอบของ Watson สำหรับความเป็นเนื้อเดียวกัน" ข้อบกพร่องอย่างหนึ่งคือการทดสอบนี้เปรียบเทียบเพียงสองตัวอย่างซึ่งหมายความว่าฉันจะต้องทำการเปรียบเทียบหลายรายการกับตัวอย่าง 8 รายการของฉัน (แล้วใช้การแก้ไข Bonferonni) นี่คือคำถามของฉัน: 1) มีการทดสอบที่ดีกว่าที่ฉันสามารถใช้ได้หรือไม่? 2) ถ้าไม่สมมติฐานของการทดสอบของ Watson คืออะไร มันเป็นพารามิเตอร์ / ไม่ใช่พารามิเตอร์? 3) อัลกอริทึมที่ฉันสามารถทำการทดสอบนี้คืออะไร? ข้อมูลของฉันอยู่ใน Matlab และฉันไม่ต้องการโอนไปยัง R เพื่อทำการทดสอบ ฉันอยากเขียนฟังก์ชั่นของตัวเอง

1
ทำไมต้องทดสอบ Levene ของความแตกต่างของความแปรปรวนมากกว่าอัตราส่วน F
SPSS ใช้การทดสอบ Levene เพื่อประเมินความสม่ำเสมอของความแปรปรวนในขั้นตอนการทดสอบกลุ่มอิสระ ทำไมการทดสอบ Levene ถึงดีกว่าอัตราส่วน F อย่างง่ายของอัตราส่วนของความแปรปรวนของทั้งสองกลุ่ม?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.