คำถามติดแท็ก standard-deviation

ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวนของตัวแปรสุ่มตัวประมาณของมันหรือการวัดที่คล้ายกันของการแพร่กระจายของชุดข้อมูล

5
ฉันจะคำนวณส่วนเบี่ยงเบนมาตรฐานถ่วงน้ำหนักได้อย่างไร ใน Excel?
ดังนั้นฉันมีชุดข้อมูลเป็นเปอร์เซ็นต์ดังนี้: 100 / 10000 = 1% (0.01) 2 / 5 = 40% (0.4) 4 / 3 = 133% (1.3) 1000 / 2000 = 50% (0.5) ฉันต้องการค้นหาค่าเบี่ยงเบนมาตรฐานของเปอร์เซ็นต์ แต่ถ่วงน้ำหนักสำหรับปริมาณข้อมูลของพวกเขา เช่นจุดข้อมูลแรกและจุดสุดท้ายควรมีอิทธิพลเหนือการคำนวณ ฉันจะทำอย่างไร และมีวิธีง่าย ๆ ใน Excel หรือไม่

3
R: การสุ่มฟอเรสต์การโยน NaN / Inf ในข้อผิดพลาด“ การเรียกฟังก์ชันต่างประเทศ” แม้จะไม่มีชุดข้อมูลของ NaN [ปิด]
ฉันใช้คาเร็ตเพื่อรันฟอเรสต์แบบสุ่มที่ผ่านการตรวจสอบความถูกต้องข้ามชุดข้อมูล ตัวแปร Y เป็นปัจจัย ไม่มีชุดข้อมูลของ NaN, Inf's หรือ NA ในชุดข้อมูลของฉัน อย่างไรก็ตามเมื่อใช้ป่าสุ่มฉันได้รับ Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs …

4
จะทำการทดสอบแบบทดสอบของนักเรียนที่มีขนาดตัวอย่างค่าเฉลี่ยตัวอย่างและค่าเฉลี่ยประชากรได้อย่างไร
นักเรียน -test ต้องใช้กลุ่มตัวอย่างส่วนเบี่ยงเบนมาตรฐานsอย่างไรก็ตามฉันจะคำนวณหาเมื่อทราบขนาดตัวอย่างและค่าเฉลี่ยตัวอย่างเท่านั้นเสื้อเสื้อtssssss ตัวอย่างเช่นถ้าขนาดตัวอย่างคือและค่าเฉลี่ยตัวอย่างคือฉันจะพยายามสร้างรายการตัวอย่างตัวอย่างที่มีค่าแต่ละตัวอย่าง คาดว่าค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างเป็น0สิ่งนี้จะสร้างปัญหาการหารด้วยศูนย์ในการทดสอบ494949112112112494949112112112000เสื้อเสื้อt ข้อมูลเพิ่มเติม: รายได้เฉลี่ยของคนงานโรงงาน ACME North เป็น\มีรายงานว่าตัวอย่างที่สุ่มจากคนงานในโรงงาน ACME ใต้มีรายได้ต่อปี\ความแตกต่างนี้มีนัยสำคัญทางสถิติหรือไม่$200$200\$200494949$ 112$112\$112 ฉันถูกต้องในการบอกว่าประชากรเฉลี่ย ?$ 200$200\$200

5
ทำไมเราถึงต้องใช้สแควร์รูทของความแปรปรวนเพื่อสร้างความเบี่ยงเบนมาตรฐาน
ขออภัยหากมีการตอบที่อื่นฉันไม่สามารถหาได้ ฉันสงสัยว่าทำไมเราถึงใช้สแควร์รูทโดยเฉพาะความแปรปรวนเพื่อสร้างส่วนเบี่ยงเบนมาตรฐาน มันเกี่ยวกับการรากที่สองที่สร้างมูลค่าที่มีประโยชน์คืออะไร?

1
กำลังแปลงข้อผิดพลาดมาตรฐานเป็นส่วนเบี่ยงเบนมาตรฐานหรือไม่
การแปลงข้อผิดพลาดมาตรฐานเป็นความเบี่ยงเบนมาตรฐานเป็นเรื่องที่สมเหตุสมผลหรือไม่ และถ้าเป็นเช่นนั้นสูตรนี้เหมาะสมหรือไม่ SE=SDN−−√SE=SDNSE = \frac{SD}{\sqrt{N}}

4
สัญชาตญาณที่อยู่เบื้องหลังส่วนเบี่ยงเบนมาตรฐาน
ฉันพยายามที่จะเข้าใจความเบี่ยงเบนมาตรฐานได้ง่ายขึ้น จากสิ่งที่ฉันเข้าใจมันเป็นตัวแทนของค่าเฉลี่ยของความแตกต่างของชุดการสังเกตในชุดข้อมูลจากค่าเฉลี่ยของชุดข้อมูลนั้น อย่างไรก็ตามมันไม่เท่ากับค่าเฉลี่ยของความแตกต่างเนื่องจากมันให้น้ำหนักมากกว่าการสังเกตเพิ่มเติมจากค่าเฉลี่ย ว่าฉันมีประชากรของค่าต่อไปนี้ -{1,3,5,7,9}{1,3,5,7,9}\{1, 3, 5, 7, 9\} ค่าเฉลี่ยคือ5555 ถ้าฉันวัดการแพร่กระจายตามค่าสัมบูรณ์ที่ฉันได้รับ ∑5i=1|xi−μ|5=2.4∑i=15|xi−μ|5=2.4\frac{\sum_{i = 1}^5|x_i - \mu|}{5} = 2.4 ถ้าฉันวัดการแพร่กระจายโดยใช้ค่าเบี่ยงเบนมาตรฐานฉันจะได้รับ ∑5i=1(xi−μ)25−−−−−−−−−−−−√=2.83∑i=15(xi−μ)25=2.83\sqrt{\frac{\sum_{i = 1}^5(x_i - \mu)^2}{5}} = 2.83 ผลลัพธ์ที่ใช้ค่าเบี่ยงเบนมาตรฐานมีขนาดใหญ่ขึ้นอย่างที่คาดไว้เนื่องจากน้ำหนักที่เพิ่มขึ้นจะให้ค่าเพิ่มเติมจากค่าเฉลี่ย แต่ถ้าฉันเพิ่งบอกว่าฉันจัดการกับประชากรที่มีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานที่ฉันจะอนุมานได้อย่างไรว่าประชากรประกอบด้วยค่าบางอย่างเช่น ? ดูเหมือนว่าร่างของนั้นไม่มีกฎเกณฑ์มาก ... ฉันไม่เห็นว่าคุณควรตีความมันอย่างไร ไม่หมายถึงค่าที่มีการแพร่กระจายกว้างมากหรือว่าพวกเขาทั้งหมดคลัสเตอร์แน่นรอบหมายถึง ...5552.832.832.83{1,3,5,7,9}{1,3,5,7,9}\{1, 3, 5, 7, 9\}2.832.832.832.832.832.83 เมื่อคุณนำเสนอด้วยคำแถลงว่าคุณกำลังเผชิญกับประชากรที่มีค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานนั่นบอกอะไรคุณเกี่ยวกับประชากร5552.832.832.83

1
ค่าเบี่ยงเบนมาตรฐานของการสังเกตที่ถูกทำให้โค้งงอ
ฉันมีชุดข้อมูลของการสังเกตตัวอย่างเก็บไว้เป็นจำนวนภายในช่วงถังขยะ เช่น: min/max count 40/44 1 45/49 2 50/54 3 55/59 4 70/74 1 ทีนี้การหาค่าประมาณโดยเฉลี่ยจากสิ่งนี้ค่อนข้างตรงไปตรงมา เพียงใช้ค่าเฉลี่ย (หรือค่ามัธยฐาน) ของแต่ละช่วง bin เป็นค่าสังเกตและนับเป็นน้ำหนักและหาค่าเฉลี่ยถ่วงน้ำหนัก: x¯∗=1∑Ni=1wi∑i=1Nwixix¯∗=1∑i=1Nwi∑i=1Nwixi\bar{x}^* = \frac{1}{\sum_{i=1}^N w_i} \sum_{i=1}^N w_ix_i สำหรับกรณีทดสอบของฉันนี่ให้ฉัน 53.82 คำถามของฉันตอนนี้คือวิธีที่ถูกต้องในการหาค่าเบี่ยงเบนมาตรฐาน (หรือความแปรปรวน) คืออะไร? จากการค้นหาของฉันฉันพบคำตอบหลายข้อ แต่ฉันไม่แน่ใจว่ามีชุดไหนที่เหมาะสมกับชุดข้อมูลของฉัน ผมสามารถที่จะหาสูตรต่อไปนี้ทั้งในคำถามที่นี่อีกและเอกสาร NIST สุ่ม s2∗=∑Ni=1wi(xi−x¯∗)2(M−1)M∑Ni=1wis2∗=∑i=1Nwi(xi−x¯∗)2(M−1)M∑i=1Nwis^{2*} = \frac{ \sum_{i=1}^N w_i (x_i - \bar{x}^*)^2 }{ \frac{(M-1)}{M} \sum_{i=1}^N w_i } ซึ่งให้ค่าเบี่ยงเบนมาตรฐาน …


3
วิธีการตีความรูตหมายความว่าข้อผิดพลาดกำลังสอง (RMSE) กับค่าเบี่ยงเบนมาตรฐาน?
สมมติว่าฉันมีแบบจำลองที่ให้ค่าที่คาดการณ์กับฉัน ฉันคำนวณ RMSE ของค่าเหล่านั้น แล้วค่าเบี่ยงเบนมาตรฐานของค่าจริง มันสมเหตุสมผลไหมที่จะเปรียบเทียบค่าทั้งสอง (ความแปรปรวน)? สิ่งที่ฉันคิดคือถ้า RMSE และส่วนเบี่ยงเบนมาตรฐานเหมือนกัน / เหมือนกันข้อผิดพลาด / ความแปรปรวนของโมเดลของฉันจะเหมือนกับสิ่งที่เกิดขึ้นจริง แต่ถ้ามันไม่สมเหตุสมผลที่จะเปรียบเทียบค่าเหล่านั้นดังนั้นข้อสรุปนี้อาจผิด หากความคิดของฉันเป็นจริงแสดงว่าแบบจำลองนั้นดีเท่าที่ควรเพราะมันไม่สามารถบอกได้ว่าอะไรทำให้เกิดความแปรปรวน? ฉันคิดว่าส่วนสุดท้ายอาจผิดหรืออย่างน้อยต้องการข้อมูลเพิ่มเติมเพื่อตอบ

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

5
เหตุใดเราจึงใช้สูตรเบี่ยงเบนมาตรฐานแบบเอนเอียงและทำให้เข้าใจผิดสำหรับ
มันค่อนข้างน่าตกใจสำหรับฉันในครั้งแรกที่ฉันทำการจำลองแบบมอนติคาร์โลและพบว่าค่าเฉลี่ยของส่วนเบี่ยงเบนมาตรฐาน100100100ค่าจาก100100100ตัวอย่างทั้งหมดมีขนาดตัวอย่างเพียงn=2n=2n=2ซึ่งพิสูจน์ได้ว่าน้อยกว่ามาก กว่าคือค่าเฉลี่ย2π−−√2π \sqrt{\frac{2}{\pi }} ,σσ\sigmaใช้สำหรับสร้างประชากร อย่างไรก็ตามนี่เป็นที่รู้จักกันดีหากไม่ค่อยมีใครจำได้และฉันก็ไม่รู้เหมือนกันหรือฉันจะไม่ทำแบบจำลอง นี่คือการจำลอง นี่คือตัวอย่างสำหรับการทำนายช่วงความเชื่อมั่น 95% ของN(0,1)N(0,1)N(0,1)โดยใช้ 100, n=2n=2n=2 , ค่าประมาณของSDSD\text{SD} , และE(sn=2)=π2−−√SDE(sn=2)=π2SD\text{E}(s_{n=2})=\sqrt\frac{\pi}{2}\text{SD} SD RAND() RAND() Calc Calc N(0,1) N(0,1) SD E(s) -1.1171 -0.0627 0.7455 0.9344 1.7278 -0.8016 1.7886 2.2417 1.3705 -1.3710 1.9385 2.4295 1.5648 -0.7156 1.6125 2.0209 1.2379 0.4896 0.5291 0.6632 -1.8354 1.0531 2.0425 2.5599 1.0320 …

1
ข้อผิดพลาดมาตรฐานของค่าเบี่ยงเบนมาตรฐานตัวอย่างคืออะไร
ผมอ่านจากที่นั่นว่าข้อผิดพลาดมาตรฐานความแปรปรวนของกลุ่มตัวอย่างคือ SEs2=2σ4N−1−−−−−−√SEs2=2σ4N−1SE_{s^2} = \sqrt{\frac{2 \sigma^4}{N-1}} ข้อผิดพลาดมาตรฐานของค่าเบี่ยงเบนมาตรฐานตัวอย่างคืออะไร ฉันจะถูกล่อลวงให้เดาและพูดว่าแต่ผมไม่แน่ใจว่าSEs=SEs2−−−−√SEs=SEs2SE_{s} = \sqrt{SE_{s^2}}

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

4
อาจหมายถึงการบวกส่วนเบี่ยงเบนมาตรฐานหนึ่งค่าเกินค่าสูงสุดหรือไม่
ฉันมีค่าเฉลี่ย 74.10 และส่วนเบี่ยงเบนมาตรฐาน 33.44 สำหรับตัวอย่างที่มีค่าต่ำสุด 0 และสูงสุด 94.33 อาจารย์ของฉันถามฉันว่าค่าเฉลี่ยบวกหนึ่งส่วนเบี่ยงเบนมาตรฐานสูงกว่าค่าสูงสุดได้อย่างไร ฉันแสดงตัวอย่างมากมายเกี่ยวกับเรื่องนี้ แต่เธอไม่เข้าใจ ฉันต้องการการอ้างอิงเพื่อแสดงให้เธอเห็น อาจเป็นบทหรือย่อหน้าใด ๆ จากหนังสือสถิติที่พูดถึงเรื่องนี้โดยเฉพาะ


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.