ฉันจะคำนวณส่วนเบี่ยงเบนมาตรฐานถ่วงน้ำหนักได้อย่างไร ใน Excel?


29

ดังนั้นฉันมีชุดข้อมูลเป็นเปอร์เซ็นต์ดังนี้:

100   /   10000   = 1% (0.01)
2     /     5     = 40% (0.4)
4     /     3     = 133% (1.3) 
1000  /   2000    = 50% (0.5)

ฉันต้องการค้นหาค่าเบี่ยงเบนมาตรฐานของเปอร์เซ็นต์ แต่ถ่วงน้ำหนักสำหรับปริมาณข้อมูลของพวกเขา เช่นจุดข้อมูลแรกและจุดสุดท้ายควรมีอิทธิพลเหนือการคำนวณ

ฉันจะทำอย่างไร และมีวิธีง่าย ๆ ใน Excel หรือไม่


สูตรที่มี (M-1) / M นั้นถูกต้อง หากคุณมีข้อสงสัยให้ตรวจสอบโดยการตั้งค่าน้ำหนักทั้งหมดเท่ากับ 1 และคุณจะได้รับสูตรคลาสสิกสำหรับการประมาณการแบบไม่เอนเอียงสำหรับค่าเบี่ยงเบนมาตรฐานด้วย (N-1) ในตัวส่วน สำหรับ whuber: ผิดปกติไม่ได้หมายความว่าไม่ถูกต้อง

1
สูตรที่มี (M-1) / M ไม่ถูกต้อง ลองนึกภาพคุณเพิ่มหนึ่งล้านคะแนนด้วยน้ำหนักหนึ่งล้านล้าน คุณไม่เปลี่ยนคำตอบของคุณเลยไม่ว่าน้ำหนักนั้นจะเป็นอะไร แต่เทอมของคุณกลายเป็น 1? ไม่ได้อย่างแน่นอน! หากคุณสนใจคุณก็สนใจเช่นกันว่ามันผิด ( M - 1 ) / M 1(M1)/M(M1)/M1
Rex Kerr

คะแนนสูงสุดถูกต้อง โปรดตรวจสอบitl.nist.gov/div898/software/dataplot/refman2/ch2/weightsd.pdf
Bo Wang

ฉันสงสัยว่าทำไมคุณต้องการส่วนเบี่ยงเบนมาตรฐานที่นี่ คุณมีเพียงหมายเลข! ตัวเลขนั้นมากเกินไปอย่างไร โดยเฉพาะอย่างยิ่งเมื่อมีการอธิบายและเข้าใจเปอร์เซ็นต์ได้ง่ายขึ้น 4
ความน่าจะเป็นที่จะเกิดขึ้น

@probabilityislogic มันเป็นตัวอย่างที่ทำให้เข้าใจง่าย
Yahel

คำตอบ:


35

สูตรสำหรับค่าเบี่ยงเบนมาตรฐานถ่วงน้ำหนักคือ

i=1Nwi(xix¯)2(M1)Mi=1Nwi,

ที่ไหน

Nคือจำนวนการสังเกต

Mคือจำนวนน้ำหนักที่ไม่ใช่ศูนย์

wiคือน้ำหนัก

xiเป็นข้อสังเกต

x¯เป็นค่าเฉลี่ยถ่วงน้ำหนัก

โปรดจำไว้ว่าสูตรสำหรับค่าเฉลี่ยถ่วงน้ำหนักคือ:

x¯=i=1Nwixii=1Nwi.

ใช้น้ำหนักที่เหมาะสมเพื่อให้ได้ผลลัพธ์ตามที่ต้องการ ในกรณีของคุณผมจะแนะนำให้ใช้{จำนวนกรณี}}Number of cases in segmentTotal number of cases

ในการทำเช่นนี้ใน Excel คุณต้องคำนวณค่าเฉลี่ยถ่วงน้ำหนักก่อน จากนั้นคำนวณในคอลัมน์แยกต่างหาก ส่วนที่เหลือจะต้องง่ายมาก(xix¯)2


2
@Gilles คุณพูดถูก deps_stats, เศษส่วนใน SD นั้นผิดปกติ คุณมีการอ้างอิงสำหรับสูตรนี้หรืออย่างน้อยคุณสามารถอธิบายเหตุผลในการรวมคำนั้นได้หรือไม่? (M1)/M
whuber

4
@Aaron Weights ไม่ได้ถูกนิยามไว้เสมอว่าจะนำไปรวมกับความเป็นน้ำหนึ่งใจเดียวกันอย่างสุดขีดโดยน้ำหนักที่กำหนดในคำถามนี้!
whuber

2
(-1) ฉันกำลัง downvoting คำตอบนี้เพราะไม่มีการให้เหตุผลหรือการอ้างอิงสำหรับคำ (และฉันค่อนข้างแน่ใจว่ามันไม่ได้ทำการประมาณค่าความแปรปรวนแบบไม่เอนเอียงซึ่งจะเห็นได้ชัด แรงจูงใจ) (M1)/M
whuber

1
ในแง่ของการอ้างอิงเพิ่มเติม (ซึ่งไม่ได้มีสิทธิ์ แต่เป็นการอ้างอิง) ฉันกำลังลบ downvote ฉันไม่ได้ถอนคำตอบนี้เนื่องจากการคำนวณแสดงให้เห็นว่าการชั่งน้ำหนักที่เสนอนั้นไม่ได้สร้างการประเมินที่เป็นกลางใด ๆ เลย (ยกเว้นเมื่อน้ำหนักทั้งหมดเท่ากับ ) ความยากลำบากที่แท้จริงที่นี่ - ซึ่งเป็นความผิดของคำถามไม่ใช่คำตอบ - คือมันไม่ชัดเจนว่า "การเบี่ยงเบนมาตรฐานถ่วงน้ำหนัก" นี้คืออะไรที่พยายามประเมิน หากไม่มีการประมาณที่แน่นอนและไม่มีเหตุผลที่จะแนะนำปัจจัยเพื่อ "ลดอคติ" (หรือด้วยเหตุผลอื่นใด) ( M - 1 ) / M1(M1)/M
whuber

1
@ Mikail คุณถูกต้องว่า "ผิดปกติ" และ "ถูกต้อง" มีส่วนเกี่ยวข้องกับคนอื่น อย่างไรก็ตามผลลัพธ์ที่ผิดปกตินั้นต้องการข้ออ้างเพิ่มเติมเล็กน้อยเนื่องจากความผิดปกติเป็นตัวบ่งชี้หนึ่งที่อาจทำให้เกิดข้อผิดพลาดได้ อาร์กิวเมนต์ของคุณไม่ถูกต้อง: แม้ว่าสูตรจะลดลงเป็นหนึ่งเดียวสำหรับตัวประมาณที่เป็นกลางเมื่อน้ำหนักทั้งหมดเท่ากัน แต่ไม่ได้หมายความว่าตัวประมาณจะยังคงเป็นกลางเมื่อใช้น้ำหนักที่ไม่เท่ากัน ฉันไม่ยืนยันข้อสรุปของคุณผิด แต่จนถึงขณะนี้ยังไม่มีการเสนอเหตุผลที่ถูกต้อง
whuber

18

สูตรนี้เป็นสถานที่ต่าง ๆ ที่มีอยู่รวมทั้งวิกิพีเดีย

กุญแจสำคัญคือการแจ้งให้ทราบว่ามันขึ้นอยู่กับสิ่งที่หมายถึงน้ำหนัก โดยเฉพาะอย่างยิ่งคุณจะได้รับคำตอบที่แตกต่างกันหากน้ำหนักเป็นความถี่ (เช่นคุณกำลังพยายามหลีกเลี่ยงการบวกผลรวมทั้งหมดของคุณ) หากน้ำหนักเป็นจริงแล้วความแปรปรวนของการวัดแต่ละครั้งหรือหากเป็นเพียงค่าภายนอกบางอย่างที่คุณต้องการ กำหนดข้อมูลของคุณ

ในกรณีของคุณมันเผินๆดูเหมือนว่าน้ำหนักที่มีความถี่แต่พวกเขาไม่ได้ คุณสร้างข้อมูลจากความถี่ แต่ไม่ใช่เรื่องง่ายที่จะมี 45 ระเบียน 3 และ 15 รายการ 4 ในชุดข้อมูลของคุณ คุณต้องใช้วิธีการสุดท้ายแทน (อันที่จริงทั้งหมดนี้เป็นขยะ - คุณจริงๆต้องใช้รูปแบบที่ซับซ้อนมากขึ้นของกระบวนการที่มีการสร้างตัวเลขเหล่านี้เห็นได้ชัดว่าคุณไม่! ไม่ได้มีสิ่งที่ถ่มน้ำลายออกหมายเลขปกติกระจายเพื่อพัฒนาการระบบที่มีค่าเบี่ยงเบนมาตรฐาน ไม่ใช่สิ่งที่ถูกต้องที่จะทำ)

ในกรณีใด ๆ สูตรสำหรับความแปรปรวน (ซึ่งคุณคำนวณค่าเบี่ยงเบนมาตรฐานตามวิธีปกติ) ด้วยน้ำหนัก "ความน่าเชื่อถือ" คือ

wi(xix)2wiwi2wi

โดยที่เป็นค่าเฉลี่ยถ่วงน้ำหนักx=wixi/wi

คุณไม่มีค่าประมาณสำหรับน้ำหนักซึ่งฉันคิดว่าคุณต้องการที่จะเป็นสัดส่วนกับความน่าเชื่อถือ รับเปอร์เซ็นต์วิธีที่คุณจะทำการวิเคราะห์ที่ยุ่งยากแม้ว่าพวกเขาจะถูกสร้างขึ้นโดยกระบวนการของ Bernoulli เพราะถ้าคุณได้รับคะแนน 20 และ 0 คุณก็จะมีจำนวนอนันต์ การให้น้ำหนักโดยการผกผันของ SEM เป็นสิ่งที่พบได้บ่อยและบางครั้งก็เหมาะสมที่สุด บางทีคุณควรใช้ประมาณการเบส์หรือวิลสันทำคะแนนช่วงเวลา


2
+1 การอภิปรายเกี่ยวกับความหมายที่แตกต่างของน้ำหนักคือสิ่งที่ฉันกำลังมองหาในหัวข้อนี้ตลอด มันมีส่วนสำคัญในคำถามทั้งหมดของเว็บไซต์นี้เกี่ยวกับสถิติถ่วงน้ำหนัก (ฉันกังวลเล็กน้อยเกี่ยวกับคำพูดของผู้ปกครองเกี่ยวกับการแจกแจงแบบปกติและค่าเบี่ยงเบนมาตรฐาน แต่เนื่องจากพวกเขาแนะนำอย่างไม่ถูกต้องว่า SDs ไม่ได้ใช้นอกโมเดลตามเกณฑ์ปกติ)
whuber

@whuber - ทฤษฎีบทขีด จำกัด กลางสำหรับการช่วยเหลือแน่นอน! แต่สำหรับสิ่งที่ OP กำลังทำอยู่พยายามที่จะอธิบายลักษณะของชุดตัวเลขที่มีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานดูเหมือนจะไม่สามารถมองข้ามได้ และโดยทั่วไปแล้วสำหรับการใช้งานหลายคนค่าเบี่ยงเบนมาตรฐานจะกลายเป็นความเข้าใจที่ผิดพลาด ตัวอย่างเช่นหากการแจกแจงนั้นเป็นอะไรก็ได้ยกเว้นปกติ (หรือการประมาณที่ดี) การพึ่งพาค่าเบี่ยงเบนมาตรฐานจะทำให้คุณมีความคิดที่ไม่ดีเกี่ยวกับรูปร่างของก้อยเมื่อมันเป็นก้อยที่คุณสนใจมากที่สุดในเชิงสถิติ การทดสอบ
Rex Kerr

@RexKerr เราแทบจะไม่สามารถตำหนิส่วนเบี่ยงเบนมาตรฐานได้หากผู้คนตีความที่ไม่สมควร แต่ขอให้ถอยห่างจากภาวะปกติและพิจารณาการกระจายตัวแบบ unimodal แบบ unimodal ที่มีความต่อเนื่องและสมมาตรมากขึ้นโดยมีความแปรปรวน จำกัด (ตัวอย่าง) จากนั้นระหว่าง 89 ถึง 100 เปอร์เซ็นต์ของการกระจายอยู่ภายในส่วนเบี่ยงเบนมาตรฐานสองค่า มักจะมีประโยชน์พอสมควรที่จะรู้ (และ 95% อยู่ตรงกลางค่อนข้างมากดังนั้นจึงไม่มากไปกว่า 7%) ด้วยการแจกแจงทั่วไปจำนวนมากความสมมาตรของการปล่อยไม่เปลี่ยนแปลงมากนัก (เช่นดูเลขยกกำลัง) .... ctd
Glen_b

ctd ... - หรือถ้าเราไม่ทำข้อสันนิษฐานพวกนั้นมันมีขอบเขตปกติของ Chebyshev ที่พูดอะไรบางอย่างเกี่ยวกับก้อยและส่วนเบี่ยงเบนมาตรฐาน ..
Glen_b

1
@Gabriel - ใช่ขอโทษฉันเป็นคนเลอะเทอะ (ฉันคิดว่าผู้คนสามารถบอกได้ว่าอันไหนโดยการเหลือบ) ฉันแก้ไขคำอธิบายของฉันแล้ว
Rex Kerr

5
=SQRT(SUM(G7:G16*(H7:H16-(SUMPRODUCT(G7:G16,H7:H16)/SUM(G7:G16)))^2)/
     ((COUNTIFS(G7:G16,"<>0")-1)/COUNTIFS(G7:G16,"<>0")*SUM(G7:G16)))

คอลัมน์Gคือตุ้มน้ำหนักคอลัมน์Hคือค่า


การใช้ Ctrl + Shift + Enter เป็น gotcha สำหรับฉัน แต่ดูเหมือนว่าจะทำงานเป็นอย่างอื่น
philipkd

1

หากเราปฏิบัติกับน้ำหนักอย่างน่าจะเป็นเราจะสร้างมันขึ้นมาดังนี้: ที่ - ปริมาณข้อมูล

pi=viivi,
vi

ถัดไปเห็นได้ชัดว่าค่าเฉลี่ยถ่วงน้ำหนักคือ และความแปรปรวน: σ 2=Σฉันหน้าฉัน(xฉัน - μ )2

μ^=ipixi,
σ^2=ipi(xiμ^)2

0
Option Explicit

Function wsdv(vals As Range, wates As Range)
Dim i, xV, xW, y As Integer
Dim wi, xi, WgtAvg, N
Dim sumProd, SUMwi

    sumProd = 0
    SUMwi = 0
    N = vals.Count  ' number of values to determine W Standard Deviation
    xV = vals.Column  ' Column number of first value element
    xW = wates.Column  ' Column number of first weight element
    y = vals.Row - 1  ' Row number of the values and weights

    WgtAvg = WorksheetFunction.SumProduct(vals, wates) / WorksheetFunction.Sum(wates)

    For i = 1 To N  ' step through the elements, calculating the sum of values and the sumproduct
        wi = ActiveSheet.Cells(i + y, xW).Value  ' (i+y, xW) is the cell containing the weight element
        SUMwi = SUMwi + wi
        xi = ActiveSheet.Cells(i + y, xV).Value  ' (i+y, xV) is the cell containing the value element
        sumProd = sumProd + wi * (xi - WgtAvg) ^ 2
    Next i

    wsdv = (sumProd / SUMwi * N / (N - 1)) ^ (1 / 2)  ' output of weighted standard deviation

End Function

2
ยินดีต้อนรับสู่เว็บไซต์ @ uswer71015 ดูเหมือนว่าจะเป็นรหัสเท่านั้น คุณสามารถเพิ่มข้อความ / คำอธิบายเกี่ยวกับวิธีการทำงานของรหัส & วิธีตอบคำถามได้หรือไม่
gung - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.