คำถามติดแท็ก variance

ความเบี่ยงเบนกำลังสองของตัวแปรสุ่มที่คาดหวังจากค่าเฉลี่ย หรือค่าเบี่ยงเบนยกกำลังสองเฉลี่ยของข้อมูลเกี่ยวกับค่าเฉลี่ย

3
สัมประสิทธิ์การตัดสินใจ (
ฉันต้องการเข้าใจความคิดของอย่างเต็มที่อธิบายถึงจำนวนของการเปลี่ยนแปลงระหว่างตัวแปร คำอธิบายทุกเว็บเป็นบิตกลและป้าน ฉันต้องการที่จะ "รับ" แนวคิดไม่ใช่แค่ใช้ตัวเลขโดยอัตโนมัติR2R2r^2 เช่นชั่วโมงที่เรียนเทียบกับคะแนนทดสอบ RRr = .8 R2R2r^2 = .64 ดังนั้นสิ่งนี้หมายความว่าอย่างไร 64% ของคะแนนความแปรปรวนสามารถอธิบายเป็นชั่วโมงได้หรือไม่ เราจะรู้ได้อย่างไรว่าเพียงแค่ยกกำลังสอง?

2
ในการถดถอยเชิงเส้นอย่างง่ายสูตรการแปรปรวนของค่าตกค้างมาจากไหน?
ตามข้อความที่ฉันใช้สูตรสำหรับความแปรปรวนของส่วนที่เหลือจะได้รับจาก:ผมt hithi^{th} σ2( 1 - 1)n- ( xผม- x¯¯¯)2Sx x)σ2(1−1n−(xi−x¯)2Sxx)\sigma^2\left ( 1-\frac{1}{n}-\frac{(x_{i}-\overline{x})^2}{S_{xx}} \right ) ฉันพบนี้ยากที่จะเชื่อตั้งแต่ที่เหลือคือความแตกต่างระหว่างค่าสังเกตและค่าติดตั้ง; ถ้าใครจะคำนวณความแปรปรวนของความแตกต่างอย่างน้อยที่สุดฉันก็คาดหวังว่า "บวก" บางอย่างในการแสดงออกที่เกิดขึ้น ความช่วยเหลือใด ๆ ในการทำความเข้าใจแหล่งที่มาจะได้รับการชื่นชมผมt hithi^{th}ผมt hithi^{th}ผมt hithi^{th}

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

1
เชื่อมโยงระหว่างความแปรปรวนและระยะทางคู่ภายในตัวแปร
โปรดพิสูจน์ว่าถ้าเรามีสองตัวแปร (ขนาดตัวอย่างเท่ากัน)และและความแปรปรวนในมากกว่าในแล้วผลรวมของความแตกต่างกำลังสอง (เช่นระยะห่างแบบยุคลิดกำลังสอง) ระหว่างจุดข้อมูลภายในนั้นมากกว่า ว่าภายในYYXXXYYYYXXXYYYYXXXYYY

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

1
ตรงข้ามของความแปรปรวน
มีคำว่า 'ผกผันของความแปรปรวน' หรือไม่? นั่นคือถ้ามีความแปรปรวนสูงแล้วมีต่ำ ? ไม่สนใจคำตรงข้ามที่ใกล้เคียง (เช่น 'ข้อตกลง' หรือ 'ความคล้ายคลึง') แต่มีความหมายเฉพาะ ?X … 1 / σ 2XXXXXX......\dots1 / σ21/σ21/\sigma^2

8
เหตุใดจึงไม่นิยามความแปรปรวนเป็นความแตกต่างระหว่างทุกค่าที่ติดตามซึ่งกันและกัน
นี่อาจเป็นคำถามง่าย ๆ สำหรับหลาย ๆ คน แต่ที่นี่คือ: เหตุใดจึงไม่ได้กำหนดความแปรปรวนเป็นความแตกต่างระหว่างทุกค่าที่ติดตามกันแทนที่จะแตกต่างกับค่าเฉลี่ยของค่า นี่จะเป็นตัวเลือกที่สมเหตุสมผลกว่าสำหรับฉันฉันคิดว่าฉันกำลังดูแลข้อเสียอยู่บ้าง ขอบคุณ แก้ไข: ให้ฉันใช้ถ้อยคำใหม่อย่างชัดเจนที่สุด นี่คือสิ่งที่ฉันหมายถึง: สมมติว่าคุณมีตัวเลขเรียงตามลำดับ: 1,2,3,4,5 คำนวณและสรุปผลต่าง (ค่าสัมบูรณ์) (อย่างต่อเนื่องระหว่างทุกค่าต่อไปนี้ไม่ใช่คู่) ระหว่างค่า (โดยไม่ใช้ค่าเฉลี่ย) หารด้วยจำนวนความแตกต่าง (การติดตามผล: คำตอบจะแตกต่างกันหรือไม่หากตัวเลขยังไม่ได้รับคำสั่ง) -> อะไรคือข้อเสียของวิธีการนี้เมื่อเทียบกับสูตรมาตรฐานสำหรับความแปรปรวน?
19 variance 

5
สัญชาตญาณ (เรขาคณิตหรืออื่น ๆ ) ของ
พิจารณาตัวตนเบื้องต้นของความแปรปรวน: Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} มันเป็นการจัดการเชิงพีชคณิตอย่างง่าย ๆ ของการนิยามของโมเมนต์ศูนย์กลางในช่วงเวลาที่ไม่เกี่ยวข้อง ช่วยให้การจัดการในบริบทอื่น ๆ สะดวกขึ้น นอกจากนี้ยังช่วยให้การคำนวณความแปรปรวนผ่านการส่งผ่านข้อมูลครั้งเดียวมากกว่าการส่งผ่านสองครั้งแรกเพื่อคำนวณค่าเฉลี่ยแล้วทำการคำนวณความแปรปรวนVar(X)Var(X)Var(X) แต่มันหมายความว่าอะไร? สำหรับฉันไม่มีสัญชาตญาณทางเรขาคณิตทันทีที่เกี่ยวข้องกับการแพร่กระจายเกี่ยวกับค่าเฉลี่ยในการแพร่กระจายประมาณ 0 เป็นเป็นชุดในมิติเดียวคุณจะดูการแพร่กระจายรอบค่าเฉลี่ยเป็นความแตกต่างระหว่างการแพร่กระจายรอบต้นกำเนิดและสี่เหลี่ยมจัตุรัส หมายความว่าอย่างไรXXX มีการตีความพีชคณิตเชิงเส้นที่ดีหรือการตีความทางกายภาพหรืออื่น ๆ ที่จะให้ข้อมูลเชิงลึกเกี่ยวกับตัวตนนี้หรือไม่?

3
การกระจายแบบไม่ระบุตัวอย่างความแปรปรวนของตัวอย่างที่ไม่ปกติ
นี่เป็นการแก้ไขปัญหาทั่วไปที่เกิดจาก คำถามนี้ หลังจากได้รับการแจกแจงเชิงซีมโทติคของความแปรปรวนตัวอย่างเราสามารถใช้วิธีเดลต้าเพื่อให้ได้การแจกแจงที่สอดคล้องกันสำหรับค่าเบี่ยงเบนมาตรฐาน ขอตัวอย่างขนาดของตัวแปรสุ่มแบบไม่ปกติของ iid , มีค่าเฉลี่ยและความแปรปรวน 2 ตั้งค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างเป็น nnn{Xi},i=1,...,n{Xi},i=1,...,n\{X_i\},\;\; i=1,...,nμμ\muσ2σ2\sigma^2x¯=1n∑i=1nXi,s2=1n−1∑i=1n(Xi−x¯)2x¯=1n∑i=1nXi,s2=1n−1∑i=1n(Xi−x¯)2\bar x = \frac 1n \sum_{i=1}^nX_i,\;\;\; s^2 = \frac 1{n-1} \sum_{i=1}^n(X_i-\bar x)^2 เรารู้ว่า E(s2)=σ2,Var(s2)=1n(μ4−n−3n−1σ4)E(s2)=σ2,Var⁡(s2)=1n(μ4−n−3n−1σ4)E(s^2) = \sigma^2, \;\;\; \operatorname {Var}(s^2) = \frac{1}{n} \left(\mu_4 - \frac{n-3}{n-1}\sigma^4\right) โดยที่และเรา จำกัด ความสนใจของเราในการแจกแจงว่าช่วงเวลาใดที่จำเป็นต้องมีอยู่และมีขอบเขต จำกัด มีอยู่จริงและมีขอบเขต จำกัดμ4=E(Xi−μ)4μ4=E(Xi−μ)4\mu_4 = E(X_i -\mu)^4 มันถืออย่างนั้นหรือเปล่า n−−√(s2−σ2)→dN(0,μ4−σ4)?n(s2−σ2)→dN(0,μ4−σ4)?\sqrt n(s^2 - \sigma^2) \rightarrow_d N\left(0,\mu_4 …

2
ทำไมการถดถอยถึงความแปรปรวน?
ฉันกำลังอ่านบันทึกนี้ บนหน้า 2 มันระบุ: "ความแปรปรวนของข้อมูลอธิบายได้อย่างไรโดยตัวแบบการถดถอยที่กำหนด" "การตีความการถดถอยเป็นเรื่องเกี่ยวกับค่าเฉลี่ยของสัมประสิทธิ์; การอนุมานเป็นเรื่องของความแปรปรวน" ฉันได้อ่านเกี่ยวกับคำแถลงดังกล่าวหลายครั้งแล้วทำไมเราถึงสนใจ "ความแปรปรวนของข้อมูลอธิบายโดยตัวแบบการถดถอยที่ให้มาเท่าไหร่" ... โดยเฉพาะอย่างยิ่งทำไม "ความแปรปรวน"?

6
คำอธิบายที่ใช้งานง่ายของคำในความแปรปรวนของตัวประมาณกำลังสองน้อยที่สุด
ถ้าอยู่ในอันดับเต็มค่าผกผันของมีอยู่และเราจะได้ค่าประมาณกำลังสองน้อยที่สุด: และXXXXTXXTXX^TXˆβ=(XTX)−1XYβ^=(XTX)−1XY\hat\beta = (X^TX)^{-1}XYVar(ˆβ)=σ2(XTX)−1Var(β^)=σ2(XTX)−1\operatorname{Var}(\hat\beta) = \sigma^2(X^TX)^{-1} เราจะอธิบายอย่างสังหรณ์ใจได้อย่างไรในสูตรผลต่าง เทคนิคของการได้มานั้นชัดเจนสำหรับฉัน(XTX)−1(XTX)−1(X^TX)^{-1}

4
ความแปรปรวนเป็นแนวคิดพื้นฐานมากกว่าความเบี่ยงเบนมาตรฐานหรือไม่
บนเว็บไซต์ไซโครเมทริกนี้ฉันอ่านแล้ว [A] ความแปรปรวนระดับลึกตาเป็นแนวคิดพื้นฐานมากกว่าส่วนเบี่ยงเบนมาตรฐาน ไซต์ไม่ได้อธิบายเพิ่มเติมว่าทำไมความแปรปรวนจึงมีความสำคัญมากกว่าความเบี่ยงเบนมาตรฐาน แต่มันทำให้ฉันนึกถึงว่าฉันได้อ่านสิ่งที่คล้ายกันในเว็บไซต์นี้ ยกตัวอย่างเช่นในความคิดเห็นนี้ @ kjetil-b-halvorsen เขียนว่า "ค่าเบี่ยงเบนมาตรฐานดีต่อการตีความการรายงานสำหรับการพัฒนาทฤษฎีความแปรปรวนจะดีกว่า" ฉันรู้สึกว่าการอ้างสิทธิ์เหล่านี้เชื่อมโยงกัน แต่ฉันไม่เข้าใจจริงๆ ฉันเข้าใจว่าสแควร์รูทของความแปรปรวนตัวอย่างไม่ใช่ตัวประมาณที่ไม่เอนเอียงของค่าเบี่ยงเบนมาตรฐานของประชากร แต่แน่นอนว่าต้องมีมากกว่านั้น บางทีคำว่า "พื้นฐาน" นั้นคลุมเครือเกินไปสำหรับไซต์นี้ ในกรณีนี้บางทีเราสามารถทำให้คำถามของฉันเป็นคำถามที่ว่าความแปรปรวนสำคัญกว่าการเบี่ยงเบนมาตรฐานจากมุมมองของการพัฒนาทฤษฎีทางสถิติหรือไม่ ทำไม / ทำไมไม่

3
ความสอดคล้องเชิงเส้นกำกับที่มีความแปรปรวนเชิงเส้นกำกับที่ไม่ใช่ศูนย์ - มันแสดงถึงอะไร?
ปัญหาเกิดขึ้นก่อนหน้านี้ แต่ฉันต้องการถามคำถามเฉพาะที่จะพยายามล้วงเอาคำตอบที่จะทำให้ชัดเจน (และจำแนก): ใน "Asymptotics ของคนจน" คนหนึ่งรักษาความแตกต่างที่ชัดเจนระหว่าง (a)ลำดับของตัวแปรสุ่มที่รวมความน่าจะเป็นเป็นค่าคงที่ ตรงกันข้ามกับ (b)ลำดับของตัวแปรสุ่มที่รวมความน่าจะเป็นเข้ากับตัวแปรสุ่ม แต่ใน "Asymptotics ของ Wise Man" เราสามารถมีกรณีของ (c)ลำดับของตัวแปรสุ่มที่รวมความน่าจะเป็นเป็นค่าคงที่ในขณะที่รักษาความแปรปรวนที่ไม่ใช่ศูนย์ที่ขีด จำกัด คำถามของฉันคือ (ขโมยจากคำตอบเชิงสำรวจของฉันเองด้านล่าง): เราจะเข้าใจตัวประมาณที่สอดคล้องกันเชิงเส้นกำกับ แต่ก็มีความแปรปรวนที่ไม่ใช่ศูนย์และ จำกัด ได้อย่างไร ความแปรปรวนนี้สะท้อนถึงอะไร? พฤติกรรมของมันแตกต่างจากตัวประมาณ "ปกติ" ที่สอดคล้องกันอย่างไร หัวข้อที่เกี่ยวข้องกับปรากฏการณ์ที่อธิบายไว้ใน (c) (ดูในความคิดเห็นด้วย): ความแตกต่างระหว่างตัวประมาณที่สอดคล้องกันและตัวประมาณที่ไม่เอนเอียงคืออะไร? /stats/120553/convergence-of-an-estimator-with-infinite-variance ทำไมตัวประมาณที่ไม่สอดคล้องกันแบบเชิงเส้นกำกับจึงไม่มีความแปรปรวนที่ไม่มีที่สิ้นสุด เกือบแน่ใจว่าการลู่เข้าและการแปรปรวนที่ จำกัด ไปที่ศูนย์

2
มีการแสดงกราฟิกของการแลกเปลี่ยนความแปรปรวนแบบอคติในการถดถอยเชิงเส้นหรือไม่?
ฉันกำลังทุกข์ทรมานจากความมืดมน ฉันได้นำเสนอภาพต่อไปนี้เพื่อแสดงการแลกเปลี่ยนความเอนเอียงอคติในบริบทของการถดถอยเชิงเส้น: ฉันสามารถเห็นได้ว่าไม่มีทั้งสองรุ่นที่เหมาะสม - "ง่าย" ไม่เห็นคุณค่าความซับซ้อนของความสัมพันธ์ XY และ "ซับซ้อน" เป็นเพียง overfitting โดยทั่วไปเรียนรู้ข้อมูลการฝึกอบรมด้วยหัวใจ อย่างไรก็ตามฉันล้มเหลวอย่างสิ้นเชิงที่จะเห็นอคติและความแปรปรวนในภาพทั้งสองนี้ มีคนแสดงให้ฉันดูได้ไหม ป.ล. : คำตอบสำหรับคำอธิบายที่เข้าใจง่ายของการแลกเปลี่ยนความเอนเอียง? ไม่ได้ช่วยฉันฉันจะดีใจถ้ามีคนให้วิธีการที่แตกต่างจากภาพด้านบน

2
สัดส่วนของความแปรปรวนที่อธิบายในโมเดลผสมผลกระทบ
ฉันไม่ทราบว่ามีการถามก่อนหน้านี้หรือไม่ แต่ฉันไม่พบสิ่งใดเกี่ยวกับเรื่องนี้ คำถามของฉันคือถ้าทุกคนสามารถให้การอ้างอิงที่ดีเพื่อเรียนรู้วิธีการได้สัดส่วนสัดส่วนของความแปรปรวนที่อธิบายโดยแต่ละปัจจัยคงที่และสุ่มในรูปแบบผสมผลกระทบ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.