ค่าเบี่ยงเบนมาตรฐานของค่าเบี่ยงเบนมาตรฐาน


54

ตัวประมาณค่าเบี่ยงเบนมาตรฐานของค่าเบี่ยงเบนมาตรฐานคืออะไรหากสามารถใช้ค่าปกติของข้อมูลได้


ฉันคิดว่าคุณกำลังมองหาการกระจายตัวของความแปรปรวนของกลุ่มตัวอย่าง ลิงก์นี้ไปยังส่วนหนึ่งในหน้า Wikipedia เกี่ยวกับความแปรปรวนในวันที่ 16:55, 21 สิงหาคม 2559 เนื่องจากนี่เป็นลิงก์ไปยัง Wikipedia บทความนี้อาจเปลี่ยนแปลงได้ในอนาคต ดังนั้นส่วนอาจไม่สะท้อนเนื้อหาที่คำตอบนี้อ้างถึงหลังจากการเปลี่ยนแปลงดังกล่าว ดังนั้นการเชื่อมโยงไปยังหน้าประวัติศาสตร์ของหน้า Wikipedia จึงมีให้ที่นี่ พบบทความปัจจุบันเกี่ยวกับความแปรปรวน [ที่นี่] ( en.wikipedia.org/wik

คำตอบ:


58

ให้2) ดังที่แสดงในหัวข้อนี้ค่าเบี่ยงเบนมาตรฐานของค่าเบี่ยงเบนมาตรฐานตัวอย่างX1,...,XnN(μ,σ2)

s=1n1i=1n(XiX¯),

คือ

SD(s)=E([E(s)s]2)=σ12n1(Γ(n/2)Γ(n12))2

โดยที่คือฟังก์ชันแกมม่า ,คือขนาดตัวอย่างและคือค่าเฉลี่ยตัวอย่าง ตั้งแต่เป็นประมาณการที่สอดคล้องกันของนี้แสดงให้เห็นการเปลี่ยนกับในสมการข้างต้นจะได้รับการประมาณการที่สอดคล้องกันของ(s)Γ()nX¯=1ni=1nXisσσsSD(s)

ถ้ามันเป็นตัวประมาณค่าที่คุณต้องการเราจะเห็นในหัวข้อนี้ว่าซึ่งแสดงให้เห็นถึงความเป็นเส้นตรงของความคาดหวังE(s)=σ2n1Γ(n/2)Γ(n12)

sn12Γ(n12)Γ(n/2)

ในฐานะที่เป็นประมาณการที่เป็นกลางจาก\ทั้งหมดนี้พร้อมกับความเป็นเส้นตรงของความคาดหวังให้ตัวประมาณที่เป็นกลางที่ : σSD(s)

sΓ(n12)Γ(n/2)n12(Γ(n/2)Γ(n12))2

12
+1 เป็นเรื่องดีที่ไม่เพียง แต่จะได้คำตอบที่ดีกว่าหลังจากผ่านไปเกือบสองปี แต่การตอบกลับที่ให้รายละเอียดที่เป็นประโยชน์มากกว่าการอ้างอิงที่อื่นในกระทู้นี้
whuber

2
คุณลืมที่จะยกกำลังสองระยะทางในสูตรแรกหรือไม่?
danijar

2
ฟังก์ชันแกมมายากที่จะคำนวณค่าที่ไม่ใช่เล็ก ๆ ของnฉันใช้การประมาณค่าของ Stirling ฉันได้รับซึ่งเป็นไปได้ในการคำนวณและบิต กะทัดรัดมากขึ้นการแสดงออกที่ชาญฉลาด nse(11n)n11
59

1
น่าจะคุ้มค่าที่ชี้ให้เห็นว่า s (คำนวณในคำตอบของ @ Macro บางครั้งจะเรียกว่าเป็นข้อผิดพลาดมาตรฐานของส่วนเบี่ยงเบนมาตรฐานตัวอย่าง.
ฮาร์วีย์ Motulsky

สำหรับผู้ที่ต้องการรูปแบบที่เรียบง่ายเป็นค่าประมาณที่ดีในระดับไม่กี่เปอร์เซ็นต์ s/2(n1)
Syrtis Major

5

สมมติคุณสังเกต IID จากปกติที่มีค่าเฉลี่ยศูนย์และความแปรปรวน 2 ค่าเบี่ยงเบนมาตรฐาน (ประจักษ์) คือรากที่สองของตัวประมาณของ (ไม่เอนเอียงหรือไม่ใช่นั่นไม่ใช่คำถาม) ในฐานะตัวประมาณ (รับด้วย ),มีความแปรปรวนที่สามารถคำนวณได้ในทางทฤษฎี บางทีสิ่งที่คุณเรียกว่าค่าเบี่ยงเบนมาตรฐานของค่าเบี่ยงเบนมาตรฐานจริง ๆ แล้วสแควร์รูทของความแปรปรวนของค่าเบี่ยงเบนมาตรฐานคือ ? มันไม่ใช่ตัวประมาณมันเป็นปริมาณเชิงทฤษฎี (เช่นσ 2 σ 2 σ 2 X 1 , ... , X n σX1,,Xnσ2σ^2σ2X1,,Xnσ^ σ/E[(σσ^)2]σ/n รอการยืนยัน) ที่สามารถคำนวณได้อย่างชัดเจน!


ฟังก์ชันของตัวประมาณยังไม่ได้เป็นตัวประมาณใช่หรือไม่ ฉันยังไม่รู้ \ sigma เพียง X_i

σ^/n

2σ^22n

1
σ^2n

-3

@Macro ให้คำอธิบายทางคณิตศาสตร์ที่ดีพร้อมสมการคำนวณ นี่คือการอธิบายทั่วไปมากขึ้นสำหรับคนคณิตศาสตร์น้อย

ฉันคิดว่าคำศัพท์ "SD ของ SD" นั้นทำให้หลายคนสับสน การคิดถึงช่วงความมั่นใจของ SD ง่ายกว่า ค่าเบี่ยงเบนมาตรฐานที่คุณคำนวณจากกลุ่มตัวอย่างมีความแม่นยำเพียงใด โดยบังเอิญคุณอาจได้รับข้อมูลที่รวมเข้าด้วยกันอย่างใกล้ชิดทำให้ตัวอย่าง SD ต่ำกว่าประชากร SD มาก หรือคุณอาจได้รับค่าแบบสุ่มที่กระจัดกระจายกว่าประชากรโดยรวมทำให้ตัวอย่าง SD สูงกว่า SD ประชากร

การตีความ CI ของ SD นั้นตรงไปตรงมา เริ่มต้นด้วยสมมติฐานตามธรรมเนียมว่าข้อมูลของคุณสุ่มตัวอย่างและสุ่มตัวอย่างอย่างอิสระจากการแจกแจงแบบเกาส์เซียน ทวนซ้ำตัวอย่างนี้หลาย ๆ ครั้ง คุณคาดหวัง 95% ของช่วงความมั่นใจเหล่านั้นเพื่อรวม SD ประชากรจริง

ช่วงความมั่นใจ 95% ของ SD นั้นกว้างแค่ไหน ขึ้นอยู่กับขนาดตัวอย่าง (n) แน่นอน

n: 95% CI ของ SD

2: 0.45 * SD เป็น 31.9 * SD

3: 0.52 * SD ถึง 6.29 * SD

5: 0.60 * SD ถึง 2.87 * SD

10: 0.69 * SD ถึง 1.83 * SD

25: 0.78 * SD ถึง 1.39 * SD

50: 0.84 * SD ถึง 1.25 * SD

100: 0.88 * SD ถึง 1.16 * SD

500: 0.94 * SD ถึง 1.07 * SD

เครื่องคิดเลขเว็บฟรี


ฉันสามารถทำ Monte Carlo ได้ฉันแค่อยากจะทำใน 'ความมีชีวิตชีวา' มากกว่านี้ คุณยังคงถูกต้องว่าการกระจายไม่ปกติดังนั้น sd นี้จะไร้ประโยชน์สำหรับการทดสอบ

4
สำหรับสิ่งที่คุ้มค่าฉันไม่สบายใจกับคำสั่ง "ช่วงความมั่นใจที่ 95% ... น่าจะมี SD จริง" (หรือระบุไว้อย่างชัดเจนในหน้าเชื่อมโยง: "คุณมั่นใจได้ 95% ว่า CI ที่คำนวณจาก SD ตัวอย่างมี SD ประชากรจริง ") ฉันคิดว่าข้อความเหล่านี้เจ้าชู้ด้วยการเสริมความเข้าใจผิดที่เป็นที่นิยมดูที่นี่เช่นสำหรับการสนทนาที่เกี่ยวข้องกับประวัติย่อ
gung - Reinstate Monica

5
"ฉันคิดว่าทั้งแนวคิดและคำศัพท์ของ" SD of SD "นั้นลื่นเกินไปที่จะรับมือ" ควรจะหมายถึงอะไร ค่าเบี่ยงเบนมาตรฐานตัวอย่างเป็นตัวแปรสุ่มที่มีค่าเบี่ยงเบนมาตรฐาน
มาโคร

@Macro ขอบคุณสำหรับความคิดเห็นของคุณ ฉันเขียนใหม่อย่างมาก
Harvey Motulsky

1
@gung ฉันเขียนใหม่เพื่ออธิบายช่วงความมั่นใจอย่างถูกต้อง
Harvey Motulsky
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.