คำถามติดแท็ก standard-deviation

ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวนของตัวแปรสุ่มตัวประมาณของมันหรือการวัดที่คล้ายกันของการแพร่กระจายของชุดข้อมูล

5
สามารถคำนวณค่าเบี่ยงเบนมาตรฐานสำหรับค่าเฉลี่ยฮาร์มอนิกได้หรือไม่?
สามารถคำนวณค่าเบี่ยงเบนมาตรฐานสำหรับค่าฮาร์มอนิกได้หรือไม่? ฉันเข้าใจว่าค่าเบี่ยงเบนมาตรฐานสามารถคำนวณได้สำหรับค่าเฉลี่ยเลขคณิต แต่ถ้าคุณมีค่าเฉลี่ยฮาร์มอนิกคุณจะคำนวณค่าเบี่ยงเบนมาตรฐานหรือ CV ได้อย่างไร

3
ความแตกต่างคือสถิติสรุป: ค่าสัมประสิทธิ์จินีและส่วนเบี่ยงเบนมาตรฐาน
มีสถิติสรุปหลายอย่าง เมื่อคุณต้องการที่จะอธิบายการแพร่กระจายของการกระจายที่คุณสามารถใช้สำหรับตัวอย่างส่วนเบี่ยงเบนมาตรฐานหรือสัมประสิทธิ์จีนี ฉันรู้ว่าค่าเบี่ยงเบนมาตรฐานขึ้นอยู่กับแนวโน้มกลางนั่นคือการเบี่ยงเบนจากค่าเฉลี่ยและค่าสัมประสิทธิ์ Gini เป็นการวัดทั่วไปของการกระจายตัว ผมยังไม่ทราบว่าค่าสัมประสิทธิ์ Gini มีลดลงและผูกไว้บน [0 1] และค่าเบี่ยงเบนมาตรฐานไม่ได้ คุณสมบัติเหล่านี้เป็นสิ่งที่ดีที่จะรู้ แต่ความเข้าใจส่วนเบี่ยงเบนมาตรฐานสามารถให้ Gini ไม่สามารถและหนีบในทางกลับกันได้? ถ้าฉันต้องเลือกที่จะใช้หนึ่งในสองสิ่งที่เป็นประโยชน์ของการใช้หนึ่งเมื่อเทียบกับคนอื่นเมื่อมันเป็นข้อมูลและลึกซึ้ง

3
จำนวนตัวเลขที่สำคัญที่จะรายงาน
มีวิธีการทางวิทยาศาสตร์มากขึ้นในการกำหนดจำนวนตัวเลขที่สำคัญในการรายงานค่าเฉลี่ยหรือช่วงความเชื่อมั่นในสถานการณ์ที่ค่อนข้างเป็นมาตรฐาน - เช่นชั้นปีแรกที่วิทยาลัย ฉันได้เห็นจำนวนตัวเลขที่สำคัญที่จะใส่ในตาราง , ทำไมเราไม่ใช้เลขนัยสำคัญและจำนวนตัวเลขที่สำคัญในตารางพอดีไคแต่เหล่านี้ดูเหมือนจะไม่ใส่นิ้วของพวกเขาในการแก้ปัญหา ในชั้นเรียนของฉันฉันพยายามอธิบายให้นักเรียนของฉันทราบว่าเป็นเรื่องเสียหมึกที่จะรายงานตัวเลข 15 หลักที่สำคัญเมื่อพวกเขามีข้อผิดพลาดมาตรฐานที่กว้างเช่นนี้ในผลลัพธ์ของพวกเขา - ความรู้สึกของฉันคือว่ามันควรจะถูกปัดเศษ0.25นี้ไม่ได้แตกต่างกันเกินไปจากสิ่งที่ถูกกล่าวโดยASTM - การรายงานผลการทดสอบหมายถึง E29 ที่พวกเขาบอกว่ามันควรอยู่ระหว่างและ0.50.25σ0.25σ0.25\sigma0.05σ0.05σ0.05\sigma0.5σ0.5σ0.5\sigma แก้ไข: เมื่อฉันมีชุดตัวเลขxด้านล่างฉันควรใช้ตัวเลขกี่หลักในการพิมพ์ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน set.seed(123) x <- rnorm(30) # default mean=0, sd=1 # R defaults to 7 digits of precision options(digits=7) mean(x) # -0.04710376 - not far off theoretical 0 sd(x) # 0.9810307 - not far from …

3
การพล็อตผลลัพธ์ที่มีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานเท่านั้น
ฉันพยายามนึกภาพพล็อตที่เหมาะสมสำหรับการสังเกตในตารางวิธีการนี้และค่าเบี่ยงเบนมาตรฐานของคะแนนการเรียกคืน: จำควบคุมMean37SD8การทดลองMean21SD6ควบคุมการทดลองMeanSDMeanSDจำ378216\begin{array} {c|c c|c c|} & \text{Control} & & \text{Experimental} & \\ & \text{Mean} & \text{SD} &\text{Mean} &\text{SD} \\ \hline \text{Recall} & 37 & 8 & 21 & 6 \\ \hline \end{array} อะไรคือวิธีที่ดีที่สุดในการทำเช่นนั้น? แผนภูมิแท่งเป็นวิธีที่ดีหรือไม่ ฉันจะอธิบายค่าเบี่ยงเบนมาตรฐานในกรณีนั้นได้อย่างไร

2
ม้วนตาย 6 ด้านจนรวมM หมายถึงจำนวนที่เกินหรือไม่
นี่คือคำถาม: คุณหมุนลูกเต๋า 6 ด้านอย่างยุติธรรมซ้ำ ๆ จนกว่าผลรวมของลูกเต๋าจะมีค่ามากกว่าหรือเท่ากับ M ค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานของผลรวมลบด้วย M คืออะไรเมื่อ M = 300 ฉันควรเขียนรหัสเพื่อตอบคำถามประเภทนี้หรือไม่? กรุณาให้คำแนะนำกับฉัน ขอบคุณ!

3
สัญชาตญาณและการใช้สัมประสิทธิ์การเปลี่ยนแปลง
ฉันกำลังเข้าร่วมหลักสูตรการจัดการการดำเนินงานเบื้องต้นใน Coursera.org ในบางช่วงของหลักสูตรศาสตราจารย์เริ่มจัดการกับความแปรปรวนในเวลาของการปฏิบัติงาน การวัดที่เขาใช้คือสัมประสิทธิ์การแปรผันอัตราส่วนระหว่างส่วนเบี่ยงเบนมาตรฐานและค่าเฉลี่ย: คโวลต์= σμคโวลต์=σμc_v = \frac{\sigma}{\mu} เหตุใดการวัดนี้จึงถูกใช้ ข้อดีและข้อเสียของการทำงานกับCVนอกเหนือจากการทำงานด้วยพูดส่วนเบี่ยงเบนมาตรฐานคืออะไร สัญชาตญาณของการวัดนี้คืออะไร?

3
ฉันจะค้นหาค่าเบี่ยงเบนมาตรฐานของค่าเบี่ยงเบนมาตรฐานตัวอย่างจากการแจกแจงแบบปกติได้อย่างไร
ยกโทษให้ฉันถ้าฉันพลาดบางสิ่งบางอย่างค่อนข้างชัดเจน ฉันเป็นนักฟิสิกส์ที่มีการแจกแจง (ฮิสโตแกรม) เป็นหลักเกี่ยวกับค่าเฉลี่ยที่ใกล้เคียงกับการแจกแจงแบบปกติ ค่าที่สำคัญสำหรับฉันคือส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่มเกาส์นี่ ฉันจะพยายามค้นหาข้อผิดพลาดเกี่ยวกับค่าเบี่ยงเบนมาตรฐานตัวอย่างได้อย่างไร ฉันรู้สึกว่ามันเกี่ยวข้องกับความผิดพลาดในแต่ละ bin ในฮิสโทแกรมดั้งเดิม

1
รูตหมายความว่าสแควร์เทียบกับค่าเบี่ยงเบนสัมบูรณ์เฉลี่ย?
ทั้งRoot Mean Squareและค่าเบี่ยงเบนสัมบูรณ์โดยเฉลี่ยดูเหมือนว่าการวัดขนาดของความแปรปรวน (โดยเฉพาะอย่างยิ่งเมื่อตัวแปรเป็นทั้ง + ve และ -ve) กฎของหัวแม่มือที่จะเลือกหนึ่งของพวกเขามากกว่าที่อื่นคืออะไร?

1
ค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยถ่วงน้ำหนักแบบเอ็กซ์โปเนนเชียล
ฉันเขียนฟังก์ชันง่าย ๆ ใน Python เพื่อคำนวณค่าเฉลี่ยถ่วงน้ำหนักชี้แจง: def test(): x = [1,2,3,4,5] alpha = 0.98 s_old = x[0] for i in range(1, len(x)): s = alpha * x[i] + (1- alpha) * s_old s_old = s return s อย่างไรก็ตามฉันจะคำนวณ SD ที่เกี่ยวข้องได้อย่างไร

2
การคำนวณความสม่ำเสมอในการถ่ายภาพของ NBA
อะไรคือวิธีที่เหมาะสมในการประเมิน / กำหนดความสอดคล้องในการถ่ายภาพ 3 จุดของผู้เล่น NBA? ตัวอย่างเช่นฉันมีผู้เล่นที่ยิง 37% จากช่วง 3 จุดและใช้เวลา 200 ครั้งตลอดทั้งปี ฉันกำลังพิจารณาที่จะถ่ายภาพ 3% โดยเฉลี่ยของจำนวนนัดโดยพลการ (พูด 20) จากนั้นใช้ค่าเฉลี่ยเหล่านั้นเพื่อกำหนดค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย 37% การใช้ขนาดตัวอย่างที่หมุนได้ 20 นัดจะช่วยให้ความแม่นยำ 5% ในอัตราการถ่ายภาพ แต่ฉันกังวลว่าการใช้ภาพมากเกินไปจะไม่แสดงให้เห็นถึงความไม่สอดคล้องของประสิทธิภาพการทำงาน มีวิธีที่ดีกว่าในการพิจารณาความสอดคล้องหรือไม่

1
จำนวนของการจำลองที่จำเป็นสำหรับการวิเคราะห์ Monte Carlo
คำถามของฉันเกี่ยวกับการจำลองจำนวนที่ต้องการสำหรับวิธีการวิเคราะห์ Monte Carlo เท่าที่ฉันเห็นจำนวนการจำลองที่ต้องการสำหรับข้อผิดพลาดเปอร์เซ็นต์ที่อนุญาต (เช่น 5) คือ EEEn = { 100 ⋅ zค⋅ std ( x )E⋅ เฉลี่ย( x )}2,n={100⋅Zค⋅มาตรฐาน(x)E⋅ค่าเฉลี่ย(x)}2, n = \left\{\frac{100 \cdot z_c \cdot \text{std}(x)}{E \cdot \text{mean}(x)} \right\}^2 , โดยที่เป็นค่าเบี่ยงเบนมาตรฐานของการสุ่มตัวอย่างที่เกิดขึ้นและคือสัมประสิทธิ์ระดับความเชื่อมั่น (เช่น 95% คือ 1.96) ดังนั้นด้วยวิธีนี้จึงเป็นไปได้ที่จะตรวจสอบว่าค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของการจำลองแสดงถึงค่าเฉลี่ยจริงและค่าเบี่ยงเบนมาตรฐานที่ระดับความเชื่อมั่น 95%มาตรฐาน( x )มาตรฐาน(x)\text{std}(x)ZคZคz_cnnn ในกรณีของฉันฉันใช้ simualtion 7500 ครั้งและคำนวณหาค่าเฉลี่ยเคลื่อนที่และค่าเบี่ยงเบนมาตรฐานสำหรับแต่ละชุด 100 ตัวอย่างจากการจำลอง 7500 จำนวนการจำลองที่ต้องการที่ฉันได้รับน้อยกว่า 100 เสมอ …

2
การเผยแพร่ข้อผิดพลาด SD vs SE
ฉันมีการวัดลักษณะนิสัยแบบ 3 ถึง 5 ข้อต่อบุคคลในสองเงื่อนไขที่แตกต่างกัน (A และ B) ฉันวางแผนค่าเฉลี่ยสำหรับแต่ละบุคคลในแต่ละสภาพและฉันจะใช้ข้อผิดพลาดมาตรฐาน ( เช่น ,กับ = จำนวนวัด) เป็นแถบข้อผิดพลาด NSD/N−−√SD/NSD/\sqrt{N}NNN ตอนนี้ฉันต้องการพล็อตความแตกต่างระหว่างการวัดเฉลี่ยต่อบุคคลในสภาพ A และเงื่อนไข B ฉันรู้ว่าฉันสามารถระบุข้อผิดพลาดที่แพร่กระจายได้: SD=SD2A+SD2B−−−−−−−−−−√SD=SDA2+SDB2SD=\sqrt{SD_A^2+SD_B^2} แต่ฉันจะเผยแพร่ข้อผิดพลาดมาตรฐานได้อย่างไร (เนื่องจากฉันจัดการกับค่าเฉลี่ยของการวัด) แทนที่จะเป็นค่าเบี่ยงเบนมาตรฐาน มันสมเหตุสมผลหรือไม่?

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

2
การใช้ส่วนเบี่ยงเบนมาตรฐานสร้างขึ้นบนสมมติฐานของการแจกแจงแบบปกติหรือไม่?
ฉันสงสัยว่าค่าเบี่ยงเบนมาตรฐานมักถูกสร้างขึ้นบนสมมติฐานของการแจกแจงแบบปกติหรือไม่ กล่าวอีกนัยหนึ่งถ้าตัวอย่างไม่กระจายตามปกติแล้วควรใช้การเบี่ยงเบนมาตรฐานถือเป็นข้อผิดพลาดหรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.