คำถามติดแท็ก standard-deviation

ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวนของตัวแปรสุ่มตัวประมาณของมันหรือการวัดที่คล้ายกันของการแพร่กระจายของชุดข้อมูล

5
อะนาล็อก 2 มิติของค่าเบี่ยงเบนมาตรฐานหรือไม่
ลองพิจารณาการทดลองต่อไปนี้: กลุ่มคนจะได้รับรายชื่อเมืองและขอให้ทำเครื่องหมายสถานที่ที่เกี่ยวข้องบนแผนที่ (ไม่มีป้ายกำกับ) ของโลก สำหรับแต่ละเมืองคุณจะได้รับคะแนนที่กระจายอยู่ตรงกลางของเมืองนั้น ๆ บางเมืองกล่าวว่าอิสตันบูลจะมีการกระเจิงน้อยกว่าเมืองอื่น ๆ สมมติว่าสำหรับเมืองหนึ่ง ๆ เราจะได้ชุดตัวอย่าง 2Dแทนตำแหน่งของเมือง (เช่นในระบบพิกัดท้องถิ่น) บนแผนที่ที่กำหนดโดยการทดสอบ เรื่องฉันฉันต้องการแสดงจำนวน "การกระจาย" ของคะแนนในชุดนี้เป็นตัวเลขเดียวในหน่วยที่เหมาะสม (กม.){(xi,yi)}{(xi,yi)}\{(x_i, y_i)\}(x,y)(x,y)(x, y)iii สำหรับปัญหา 1D ฉันจะเลือกค่าเบี่ยงเบนมาตรฐาน แต่มีอะนาล็อก 2 มิติที่สามารถเลือกได้อย่างสมเหตุสมผลสำหรับสถานการณ์ตามที่อธิบายไว้ข้างต้นหรือไม่

4
ความแปรปรวนเป็นแนวคิดพื้นฐานมากกว่าความเบี่ยงเบนมาตรฐานหรือไม่
บนเว็บไซต์ไซโครเมทริกนี้ฉันอ่านแล้ว [A] ความแปรปรวนระดับลึกตาเป็นแนวคิดพื้นฐานมากกว่าส่วนเบี่ยงเบนมาตรฐาน ไซต์ไม่ได้อธิบายเพิ่มเติมว่าทำไมความแปรปรวนจึงมีความสำคัญมากกว่าความเบี่ยงเบนมาตรฐาน แต่มันทำให้ฉันนึกถึงว่าฉันได้อ่านสิ่งที่คล้ายกันในเว็บไซต์นี้ ยกตัวอย่างเช่นในความคิดเห็นนี้ @ kjetil-b-halvorsen เขียนว่า "ค่าเบี่ยงเบนมาตรฐานดีต่อการตีความการรายงานสำหรับการพัฒนาทฤษฎีความแปรปรวนจะดีกว่า" ฉันรู้สึกว่าการอ้างสิทธิ์เหล่านี้เชื่อมโยงกัน แต่ฉันไม่เข้าใจจริงๆ ฉันเข้าใจว่าสแควร์รูทของความแปรปรวนตัวอย่างไม่ใช่ตัวประมาณที่ไม่เอนเอียงของค่าเบี่ยงเบนมาตรฐานของประชากร แต่แน่นอนว่าต้องมีมากกว่านั้น บางทีคำว่า "พื้นฐาน" นั้นคลุมเครือเกินไปสำหรับไซต์นี้ ในกรณีนี้บางทีเราสามารถทำให้คำถามของฉันเป็นคำถามที่ว่าความแปรปรวนสำคัญกว่าการเบี่ยงเบนมาตรฐานจากมุมมองของการพัฒนาทฤษฎีทางสถิติหรือไม่ ทำไม / ทำไมไม่

1
เราสามารถใช้การละทิ้งค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานเพื่อเปิดเผยค่าผิดปกติได้ไหม
สมมติว่าฉันมีการกระจายข้อมูลตามปกติ สำหรับแต่ละองค์ประกอบของข้อมูลฉันต้องการตรวจสอบว่ามี SDs จำนวนเท่าใดที่อยู่ห่างจากค่าเฉลี่ย อาจมีค่าผิดปกติในข้อมูล (น่าจะมีเพียงหนึ่ง แต่อาจมีสองหรือสาม) หรือไม่ แต่ค่าผิดปกตินี้เป็นสิ่งที่ฉันกำลังมองหา เป็นเรื่องที่สมเหตุสมผลหรือไม่ที่จะแยกองค์ประกอบที่ฉันกำลังดูจากการคำนวณค่าเฉลี่ยและ SD ชั่วคราว ความคิดของฉันคือถ้าใกล้เคียงกับค่าเฉลี่ยมันจะไม่มีผลกระทบใด ๆ หากเป็นค่าผิดปกติอาจมีอคติในการคำนวณค่าเฉลี่ยและ SD และลดความน่าจะเป็นที่ตรวจพบได้ ฉันไม่ใช่นักสถิติดังนั้นความช่วยเหลือใด ๆ ที่ชื่นชม!

3
ค่าสูงสุดของสัมประสิทธิ์การแปรผันสำหรับชุดข้อมูลที่มีขอบเขต
ในการอภิปรายทำตามคำถามล่าสุดเกี่ยวกับว่าส่วนเบี่ยงเบนมาตรฐานสามารถสูงกว่าค่าเฉลี่ยได้หรือไม่คำถามหนึ่งถูกยกให้สั้น ๆ แต่ไม่เคยตอบอย่างสมบูรณ์ ดังนั้นฉันถามมันที่นี่ พิจารณาชุดของnnnตัวเลขไม่ติดลบ xixix_iที่0≤xi≤c0≤xi≤c0 \leq x_i \leq cสำหรับ1≤i≤n1≤i≤n1 \leq i \leq n n ไม่จำเป็นต้องให้xixix_iแตกต่างนั่นคือเซตอาจเป็นหลายเซ็ต ค่าเฉลี่ยและความแปรปรวนของชุดถูกกำหนดเป็น x¯=1n∑i=1nxi, σ2x=1n∑i=1n(xi−x¯)2=(1n∑i=1nx2i)−x¯2x¯=1n∑i=1nxi, σx2=1n∑i=1n(xi−x¯)2=(1n∑i=1nxi2)−x¯2\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i, ~~ \sigma_x^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2 = \left(\frac{1}{n}\sum_{i=1}^n x_i^2\right) - \bar{x}^2 และค่าเบี่ยงเบนมาตรฐานคือσxσx\sigma_xx โปรดทราบว่าชุดของตัวเลขไม่ใช่ตัวอย่างจากประชากรและเราไม่ได้ประมาณค่าเฉลี่ยประชากรหรือความแปรปรวนของประชากร คำถามคือ: ค่าสูงสุดของσ xคืออะไรσxx¯σxx¯\dfrac{\sigma_x}{\bar{x}}สัมประสิทธิ์ของการเปลี่ยนแปลงมากกว่าตัวเลือกทั้งหมดของxixix_i's ในช่วง[0,c][0,c][0,c]? ค่าสูงสุดที่ฉันสามารถหาได้สำหรับσxx¯σxx¯\frac{\sigma_x}{\bar{x}}คือn−1−−−−−√n−1\sqrt{n-1} ซึ่งทำได้เมื่อn−1n−1n-1ของxixix_iมีค่า000และส่วนที่เหลือ (นอก)xixix_i มีค่าccc, ให้ แต่นี่ไม่ได้ขึ้นอยู่กับcเลยและฉันสงสัยว่าถ้าค่าที่มากขึ้นอาจขึ้นอยู่กับทั้งnและcสามารถทำได้x¯=cn, 1n∑x2i=c2n⇒σx=c2n−c2n2−−−−−−−√=cnn−1−−−−−√.x¯=cn, 1n∑xi2=c2n⇒σx=c2n−c2n2=cnn−1.\bar{x} = …

2
ทำไมจึงเรียกว่าส่วนเบี่ยงเบน "มาตรฐาน"
ฉันมีคำถามที่เรียบง่ายและอาจเห็นได้ชัดว่าทำไมค่าเบี่ยงเบนมาตรฐานจึงเรียกว่า " มาตรฐาน " เป็นเพราะมันเป็นมาตรฐานการเปรียบเทียบชุดข้อมูลและผลลัพธ์ที่เกี่ยวกับการกระจายตัวของพวกเขา? การค้นหาใน Exchange Exchange ไม่ได้ทำให้เกิดคำถามนี้ขึ้นและการค้นหาโดย Google ในนิรุกติศาสตร์ของคำนั้นให้คุณค่าอย่างมาก

2
การแจกแจงแบบใดมีตัวประมาณแบบไม่เอนเอียงสำหรับค่าเบี่ยงเบนมาตรฐาน
สำหรับการแจกแจงแบบปกติจะมีการประมาณค่าส่วนเบี่ยงเบนมาตรฐานโดย: σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2−−−−−−−−−−−−√σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2\hat{\sigma}_\text{unbiased} = \frac{\Gamma(\frac{n-1}{2})}{\Gamma(\frac{n}{2})} \sqrt{\frac{1}{2}\sum_{k=1}^n(x_i-\bar{x})^2} เหตุผลที่ผลนี้ไม่เป็นที่รู้จักเป็นอย่างดีน่าจะเป็นที่มันเป็นส่วนใหญ่โบราณมากกว่าเรื่องของการนำเข้าที่ดีใด ๆ หลักฐานที่จะครอบคลุมในหัวข้อนี้ ; มันใช้ประโยชน์จากคุณสมบัติที่สำคัญของการแจกแจงแบบปกติ: 1σ2∑k=1n(xi−x¯)2∼χ2n−11σ2∑k=1n(xi−x¯)2∼χn−12 \frac{1}{\sigma^2} \sum_{k=1}^n(x_i-\bar{x})^2 \sim \chi^{2}_{n-1} จากนั้นด้วยการทำงานเล็กน้อยก็เป็นไปได้ที่จะคาดหวังและโดยการระบุคำตอบนี้เป็นหลายของσเราสามารถสรุปผลการ σเป็นกลางE(∑nk=1(xi−x¯)2−−−−−−−−−−−−√)E(∑k=1n(xi−x¯)2)\mathbb{E}\left( \sqrt{\sum_{k=1}^n(x_i-\bar{x})^2} \right)σσ\sigmaσ^unbiasedσ^unbiased\hat{\sigma}_\text{unbiased} นี่ทำให้ฉันอยากรู้ว่าการแจกแจงแบบอื่นมีตัวประมาณค่าเบี่ยงเบนมาตรฐานแบบปิดแบบเป็นกลาง ต่างจากการประมาณค่าความแปรปรวนแบบไม่เอนเอียงนี่คือการแจกแจงที่เฉพาะเจาะจงอย่างชัดเจน ยิ่งไปกว่านั้นมันจะไม่ตรงไปตรงมาที่จะปรับเปลี่ยนหลักฐานเพื่อค้นหาตัวประมาณสำหรับการแจกแจงแบบอื่น การแจกแจงแบบเบ้ปกติมีคุณสมบัติการแจกแจงที่ดีสำหรับรูปแบบสมการกำลังสองซึ่งคุณสมบัติการแจกแจงแบบปกติที่เราใช้นั้นมีประสิทธิภาพเป็นกรณีพิเศษของ (เนื่องจากปกติเป็นชนิดพิเศษแบบเบ้ปกติ) ดังนั้นบางทีมันอาจไม่ยากนัก ขยายวิธีการนี้ให้กับพวกเขา แต่สำหรับความแตกต่างอื่น ๆ มันจะปรากฏวิธีการที่แตกต่างกันโดยสิ้นเชิงเป็นสิ่งจำเป็น มีการแจกแจงอื่น ๆ ที่ทราบการประมาณเช่นนี้หรือไม่?

2
ทำไมค่าเบี่ยงเบนมาตรฐานถูกกำหนดเป็น sqrt ของความแปรปรวนและไม่เป็น sqrt ของผลรวมของกำลังสองเหนือ N
วันนี้ฉันสอนชั้นสถิติเบื้องต้นและมีนักเรียนคนหนึ่งถามคำถามซึ่งฉันได้เรียบเรียงใหม่ที่นี่: "ทำไมค่าเบี่ยงเบนมาตรฐานที่กำหนดเป็น sqrt ของความแปรปรวนและไม่ใช่ผลรวมของสี่เหลี่ยมจัตุรัสเหนือ N" เรากำหนดความแปรปรวนประชากร: σ2=1N∑(xi−μ)2σ2=1N∑(xi−μ)2\sigma^2=\frac{1}{N}\sum{(x_i-\mu)^2} และค่าเบี่ยงเบนมาตรฐาน: σ=σ2−−√=1N√∑(xi−μ)2−−−−−−−−−−√σ=σ2=1N∑(xi−μ)2\sigma=\sqrt{\sigma^2}=\frac{1}{\sqrt{N}}\sqrt{\sum{(x_i-\mu)^2}} 2 ในความหมายที่เราจะได้มอบให้σσ\sigmaคือว่ามันจะช่วยให้ค่าเบี่ยงเบนเฉลี่ยของหน่วยในประชากรจากค่าเฉลี่ยของประชากรXXXX อย่างไรก็ตามในคำจำกัดความของ sd เราหาร sqrt ของผลรวมของกำลังสองผ่านN−−√N\sqrt{N} . คำถามที่นักเรียนยกคือทำไมเราไม่หาร sqrt ของ sume of squares โดยNNNแทน ดังนั้นเรามาถึงสูตรการแข่งขัน: σnew=1N∑(xi−μ)2−−−−−−−−−−√.σnew=1N∑(xi−μ)2.\sigma_{new}=\frac{1}{N}\sqrt{\sum{(x_i-\mu)^2}}.นักเรียนให้เหตุผลว่าสูตรนี้ดูเหมือนว่าส่วนเบี่ยงเบน "เฉลี่ย" มากกว่าค่าเฉลี่ยเมื่อหารด้วยN−−√N\sqrt{N}ในขณะที่σσσ\sigma ฉันคิดว่าคำถามนี้ไม่ได้โง่ ฉันต้องการที่จะให้คำตอบกับนักเรียนที่ไปไกลกว่าที่บอกว่า sd หมายถึง sqrt ของความแปรปรวนซึ่งเป็นค่าเบี่ยงเบนมาตรฐานกำลังสอง ทำไมนักเรียนถึงใช้สูตรที่ถูกต้องและไม่ทำตามความคิดของเธอ? คำถามนี้เกี่ยวข้องกับด้ายเก่าและคำตอบที่ให้ไว้ที่นี่ คำตอบมีสามทิศทาง: σσ\sigmaคือค่าเบี่ยงเบน root-Mean-squared (RMS) ไม่ใช่ส่วนเบี่ยงเบน "ทั่วไป" จากค่าเฉลี่ย (เช่นσnewσnew\sigma_{new} ) ดังนั้นจึงถูกกำหนดแตกต่างกัน มันมีคุณสมบัติทางคณิตศาสตร์ที่ดี นอกจากนี้ sqrt จะนำ …

3
การคำนวณค่าเบี่ยงเบนมาตรฐานใหม่โดยใช้ค่าเบี่ยงเบนมาตรฐานเดิมหลังจากการเปลี่ยนแปลงในชุดข้อมูล
ฉันมีอาร์เรย์ของnnnค่าจริงซึ่งมีค่าเฉลี่ยμoldμold\mu_{old}และส่วนเบี่ยงเบนมาตรฐานσoldσold\sigma_{old} d หากองค์ประกอบของอาร์เรย์xixix_iถูกแทนที่ด้วยองค์ประกอบอื่นxjxjx_jค่าเฉลี่ยใหม่จะเป็น μnew=μold+xj−xinμnew=μold+xj−xin\mu_{new}=\mu_{old}+\frac{x_j-x_i}{n} ข้อดีของวิธีนี้ก็คือจะต้องมีการคำนวณอย่างต่อเนื่องโดยไม่คำนึงถึงความคุ้มค่าของnnnnจะมีวิธีการใดในการคำนวณσnewσnew\sigma_{new}ใช้σoldσold\sigma_{old}เช่นการคำนวณของμnewμnew\mu_{new}ใช้μoldμold\mu_{old} ?

3
เมื่อใดที่เหมาะสมที่จะรายงานความแปรปรวนแทนที่จะเป็นค่าเบี่ยงเบนมาตรฐาน
ฉันได้ทำการวิเคราะห์ที่ฉันสร้างแบบจำลองส่วนประกอบความแปรปรวนที่แตกต่างกัน เมื่อรายงานผลลัพธ์ในตารางจะมีความรัดกุมมากกว่าการรายงานส่วนเบี่ยงเบนมาตรฐานแทนที่จะเป็นความแปรปรวน ดังนั้นสิ่งนี้นำมาสู่คำถาม - มีเหตุผลที่จะรายงานความแปรปรวนแทนที่จะเบี่ยงเบนมาตรฐานหรือไม่? มันเหมาะสมกว่าไหมที่จะรายงานอีกตัวหนึ่ง?

5
การเปรียบเทียบความแปรปรวนของการสังเกตแบบจับคู่
ฉันมีการสังเกตแบบจับคู่NNN ( XiXiX_i , YiYiY_i ) มาจากการแจกแจงที่ไม่รู้จักทั่วไปซึ่งมีช่วงเวลาที่หนึ่งและสองที่แน่นอนและมีความสมมาตรรอบค่าเฉลี่ย ขอσXσX\sigma_Xค่าเบี่ยงเบนมาตรฐานของXXX (ไม่มีเงื่อนไขบนYYY ), และσYσY\sigma_Yเหมือนกันสำหรับ Y. ฉันอยากทดสอบสมมติฐาน H0H0H_0 :σX=σYσX=σY\sigma_X = \sigma_Y H1H1H_1 :σX≠σYσX≠σY\sigma_X \neq \sigma_Y ไม่มีใครรู้ว่าการทดสอบดังกล่าวหรือไม่ ฉันสามารถสันนิษฐานได้ในการวิเคราะห์ก่อนว่าการแจกแจงเป็นเรื่องปกติแม้ว่ากรณีทั่วไปน่าสนใจกว่า ฉันกำลังมองหาวิธีแก้ปัญหาแบบปิด Bootstrap เป็นทางเลือกสุดท้ายเสมอ

2
ค่าเบี่ยงเบนสัมบูรณ์กลาง (MAD) และ SD ของการแจกแจงที่แตกต่างกัน
สำหรับข้อมูลที่กระจายตามปกติค่าเบี่ยงเบนมาตรฐานและค่าเบี่ยงเบนสัมบูรณ์แบบมัธยฐานMADสัมพันธ์กันโดย:σσ\sigmaMADMAD\text{MAD} σ=Φ−1(3/4)⋅MAD≈1.4826⋅MAD,σ=Φ−1(3/4)⋅MAD≈1.4826⋅MAD,\sigma=\Phi^{-1}(3/4)\cdot \text{MAD}\approx1.4826\cdot\text{MAD}, โดยที่เป็นฟังก์ชันการแจกแจงสะสมสำหรับการแจกแจงแบบปกติมาตรฐานΦ()Φ()\Phi() มีความสัมพันธ์แบบเดียวกันสำหรับการแจกแจงแบบอื่นหรือไม่?

3
ฉันจะประเมินความเบี่ยงเบนมาตรฐานได้อย่างไร
ฉันได้รวบรวมคำตอบจาก 85 คนเกี่ยวกับความสามารถในการทำงานบางอย่าง การตอบสนองอยู่ในระดับห้าจุด Likert: 5 = ดีมาก 4 = ดี 3 = ปานกลาง 2 = แย่ 1 = แย่มาก คะแนนเฉลี่ยคือ 2.8 และส่วนเบี่ยงเบนมาตรฐานคือ 0.54 ฉันเข้าใจว่าค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานเป็นอย่างไร คำถามของฉันคือ: ส่วนเบี่ยงเบนมาตรฐานนี้ดีแค่ไหน (หรือไม่ดี) กล่าวอีกนัยหนึ่งมีแนวทางใดบ้างที่สามารถช่วยในการประเมินค่าเบี่ยงเบนมาตรฐาน

4
ความสัมพันธ์คืออะไรหากค่าเบี่ยงเบนมาตรฐานของตัวแปรหนึ่งตัวคือ 0
ดังที่ฉันเข้าใจเราสามารถได้สหสัมพันธ์โดยการทำให้ความแปรปรวนร่วมเป็นปกติโดยใช้สมการ ρi,j=cov(Xi,Xj)σiσjρi,j=cov(Xi,Xj)σiσj\rho_{i,j}=\frac{cov(X_i, X_j)}{\sigma_i \sigma_j} ที่เป็นค่าเบี่ยงเบนมาตรฐานของx_iσi=E[(Xi−μi)2]−----------√σผม=E[(Xผม-μผม)2]\sigma_i=\sqrt{E[(X_i-\mu_i)^2]}XผมXผมX_i ความกังวลของฉันคืออะไรถ้าค่าเบี่ยงเบนมาตรฐานเท่ากับศูนย์? มีเงื่อนไขใด ๆ ที่รับประกันได้หรือไม่ว่าจะไม่เป็นศูนย์? ขอบคุณ

9
ค่าเบี่ยงเบนมาตรฐานของข้อมูลที่ไม่เป็นลบสามารถเกินค่าเฉลี่ยได้หรือไม่
ฉันมีตาข่ายสามมิติแบบสามเหลี่ยม สถิติสำหรับพื้นที่สามเหลี่ยมคือ: ต่ำสุด 0.000 สูงสุด 2341.141 ค่าเฉลี่ย 56.317 Std dev 98.720 ดังนั้นมันหมายถึงสิ่งใดที่มีประโยชน์เป็นพิเศษเกี่ยวกับค่าเบี่ยงเบนมาตรฐานหรือแนะนำว่ามีข้อบกพร่องในการคำนวณเมื่อตัวเลขออกมาเหมือนด้านบน? พื้นที่อยู่ไกลจากการกระจายตามปกติอย่างแน่นอน และเมื่อมีคนพูดถึงคำตอบข้อใดข้อหนึ่งของพวกเขาด้านล่างสิ่งที่ทำให้ฉันประหลาดใจจริง ๆ ก็คือการใช้ SD หนึ่งฉบับจากค่าเฉลี่ยเพื่อให้ตัวเลขติดลบและออกจากโดเมนตามกฎหมาย ขอบคุณ

5
เหตุใดโรงเรียนในสหรัฐอเมริกาและสหราชอาณาจักรจึงสอนวิธีต่างๆในการคำนวณส่วนเบี่ยงเบนมาตรฐาน
ตามที่ฉันเข้าใจโรงเรียนในสหราชอาณาจักรสอนว่าการเบี่ยงเบนมาตรฐานนั้นใช้โดย: ในขณะที่โรงเรียนของเราสอน: (ในระดับพื้นฐานอยู่แล้ว) สิ่งนี้ทำให้นักเรียนของฉันมีปัญหาหลายอย่างในอดีตเมื่อพวกเขาค้นหาบนอินเทอร์เน็ต แต่พบคำอธิบายที่ผิด ทำไมถึงแตกต่าง ด้วยชุดข้อมูลอย่างง่ายบอกว่ามีค่า 10 ระดับข้อผิดพลาดระดับใดที่จะเกิดขึ้นหากใช้วิธีการที่ไม่ถูกต้อง (เช่นในการสอบ)?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.