ความแตกต่างระหว่างข้อผิดพลาดมาตรฐานและค่าเบี่ยงเบนมาตรฐาน


96

ฉันพยายามเข้าใจถึงความแตกต่างระหว่างข้อผิดพลาดมาตรฐานและส่วนเบี่ยงเบนมาตรฐาน มันแตกต่างกันอย่างไรและทำไมคุณต้องวัดความผิดพลาดมาตรฐาน?


7
ความคิดเห็นด่วนไม่ใช่คำตอบเนื่องจากมีสองประโยชน์อยู่แล้ว: ส่วนเบี่ยงเบนมาตรฐานเป็นคุณสมบัติของตัวแปรสุ่ม (การกระจายของ) ข้อผิดพลาดมาตรฐานนั้นเกี่ยวข้องกับการวัดในตัวอย่างเฉพาะ ทั้งสองได้สับสนเมื่อพร่ามัวความแตกต่างระหว่างจักรวาลและตัวอย่างของคุณ
ฟรานเชสโก

อาจเป็นไปได้ที่น่าสนใจ: stats.stackexchange.com/questions/15505/…
มาโคร

คำตอบ:


31

เพื่อให้คำตอบของคำถามเสร็จสมบูรณ์ Ocram แก้ไขข้อผิดพลาดมาตรฐานอย่างดี แต่ไม่ได้เปรียบเทียบกับส่วนเบี่ยงเบนมาตรฐานและไม่ได้กล่าวถึงการพึ่งพาขนาดตัวอย่าง ในกรณีพิเศษสำหรับตัวประมาณให้พิจารณาค่าเฉลี่ยตัวอย่าง ข้อผิดพลาดมาตรฐานสำหรับค่าเฉลี่ยคือโดยที่σคือค่าเบี่ยงเบนมาตรฐานของประชากร ดังนั้นในตัวอย่างนี้เราจะเห็นได้อย่างชัดเจนว่าข้อผิดพลาดมาตรฐานลดลงอย่างไรเมื่อเพิ่มขนาดตัวอย่าง ค่าเบี่ยงเบนมาตรฐานมักใช้เพื่ออ้างถึงการสังเกตการณ์ส่วนบุคคล ดังนั้นค่าเบี่ยงเบนมาตรฐานจะอธิบายความแปรปรวนของการสังเกตการณ์ส่วนบุคคลในขณะที่ข้อผิดพลาดมาตรฐานแสดงให้เห็นถึงความแปรปรวนของตัวประมาณ ตัวประมาณที่ดีมีความสอดคล้องซึ่งหมายความว่าพวกมันมาบรรจบกับค่าพารามิเตอร์จริง เมื่อข้อผิดพลาดมาตรฐานลดลงเป็น 0 เมื่อขนาดตัวอย่างเพิ่มขึ้นตัวประมาณจะสอดคล้องกันซึ่งส่วนใหญ่เกิดขึ้นเนื่องจากข้อผิดพลาดมาตรฐานไปที่ 0 ตามที่เราเห็นอย่างชัดเจนด้วยค่าเฉลี่ยตัวอย่างσ/nσ


3
Re: "... สอดคล้องกันซึ่งหมายความว่าข้อผิดพลาดมาตรฐานลดลงเป็น 0" - ไม่เป็นความจริง คุณจำการสนทนานี้ได้หรือไม่: stats.stackexchange.com/questions/31036/… ?
มาโคร

1
ใช่ฉันจำการอภิปรายของข้อยกเว้นที่ผิดปกติและฉันคิดเกี่ยวกับมันเมื่อฉันตอบคำถาม แต่คำถามนั้นเกี่ยวกับข้อผิดพลาดมาตรฐานและในแง่ง่ายการประมาณพารามิเตอร์ที่ดีนั้นมีความสอดคล้องกันและมีข้อผิดพลาดมาตรฐานมักจะเป็น 0 เช่นในกรณีของค่าเฉลี่ยตัวอย่าง
Michael Chernick

4
ฉันเห็นด้วยกับความคิดเห็นของคุณ - ข้อผิดพลาดมาตรฐานของค่าเฉลี่ยตัวอย่างไปที่ 0 และค่าเฉลี่ยตัวอย่างสอดคล้องกัน แต่ข้อผิดพลาดมาตรฐานของมันจะเป็นศูนย์ไม่ได้เป็นผลมาจาก (หรือเทียบเท่า) ความจริงที่ว่ามันสอดคล้องซึ่งเป็นสิ่งที่คำตอบของคุณพูดว่า
มาโคร

3
@Macro ใช่คำตอบจะดีขึ้นซึ่งฉันตัดสินใจที่จะทำ ฉันคิดว่ามันเป็นสิ่งสำคัญที่จะไม่เป็นเรื่องเทคนิคด้วย OPs เพราะทุกอย่างที่มีคุณสมบัติอาจซับซ้อนและสับสนได้ แต่ความแม่นยำทางเทคนิคไม่ควรเสียสละเพื่อความเรียบง่าย ดังนั้นฉันคิดว่าวิธีที่ฉันพูดถึงในการแก้ไขของฉันเป็นวิธีที่ดีที่สุดในการทำเช่นนี้
Michael Chernick

9
ฉันเห็นด้วยเป็นสิ่งสำคัญที่จะไม่ได้รับเทคนิคเว้นแต่จำเป็นจริงๆ ความคิดเห็นเดียวของฉันคือเมื่อคุณเลือกที่จะแนะนำแนวคิดเรื่องความมั่นคง (แนวคิดทางเทคนิค) แล้วจะไม่มีประโยชน์ในการอธิบายลักษณะผิด ๆ ในชื่อของการทำให้คำตอบเข้าใจง่ายขึ้น ฉันคิดว่าการแก้ไขของคุณสามารถตอบความคิดเห็นของฉันได้
มาโคร

51

นี่คือคำตอบที่ใช้ได้จริง (ไม่ใช่ทางคณิตศาสตร์):

  • SD (ส่วนเบี่ยงเบนมาตรฐาน) ปริมาณการกระจาย - จำนวนค่าแตกต่างจากกัน
  • SEM (ข้อผิดพลาดมาตรฐานของค่าเฉลี่ย) วัดปริมาณความแม่นยำของค่าเฉลี่ยของประชากรอย่างแม่นยำ โดยคำนึงถึงทั้งค่าของ SD และขนาดตัวอย่าง
  • ทั้ง SD และ SEM อยู่ในหน่วยเดียวกัน - หน่วยของข้อมูล
  • SEM โดยนิยามจะเล็กกว่า SD เสมอ
  • SEM จะเล็กลงเมื่อตัวอย่างของคุณมีขนาดใหญ่ขึ้น สิ่งนี้สมเหตุสมผลเนื่องจากค่าเฉลี่ยของกลุ่มตัวอย่างขนาดใหญ่น่าจะใกล้เคียงกับค่าเฉลี่ยประชากรจริงมากกว่าค่าเฉลี่ยของกลุ่มตัวอย่างขนาดเล็ก ด้วยตัวอย่างขนาดใหญ่คุณจะรู้คุณค่าของค่าเฉลี่ยที่มีความแม่นยำมากแม้ว่าข้อมูลจะกระจัดกระจาย
  • SD ไม่เปลี่ยนแปลงอย่างที่คาดการณ์เมื่อคุณได้รับข้อมูลเพิ่มเติม SD ที่คุณคำนวณจากตัวอย่างเป็นค่าประมาณ SD ที่ดีที่สุดของประชากรโดยรวม เมื่อคุณรวบรวมข้อมูลเพิ่มเติมคุณจะประเมิน SD ของประชากรอย่างแม่นยำยิ่งขึ้น แต่คุณไม่สามารถคาดการณ์ได้ว่า SD จากตัวอย่างขนาดใหญ่จะใหญ่กว่าหรือเล็กกว่า SD จากตัวอย่างขนาดเล็ก (นี่คือการทำให้เข้าใจง่ายไม่เป็นความจริงเลยดูความคิดเห็นด้านล่าง)

โปรดทราบว่าข้อผิดพลาดมาตรฐานสามารถคำนวณได้สำหรับเกือบทุกพารามิเตอร์ที่คุณคำนวณจากข้อมูลไม่ใช่แค่ค่าเฉลี่ย วลี "ข้อผิดพลาดมาตรฐาน" นั้นค่อนข้างคลุมเครือ คะแนนด้านบนอ้างถึงข้อผิดพลาดมาตรฐานของค่าเฉลี่ย

(จากคู่มือสถิติ GraphPadที่ฉันเขียน)


11
n100* * * *n0.18n=2

4
@whuber: แน่นอนคุณพูดถูก เป็นความแปรปรวน (SD กำลังสอง) ที่จะไม่เปลี่ยนแปลงอย่างที่คาดการณ์เมื่อคุณเพิ่มข้อมูลเพิ่มเติม SD จะมีขนาดใหญ่ขึ้นเล็กน้อยเมื่อขนาดตัวอย่างเพิ่มขึ้นโดยเฉพาะเมื่อคุณเริ่มต้นด้วยตัวอย่างเล็ก ๆ การเปลี่ยนแปลงนี้เล็กน้อยเมื่อเทียบกับการเปลี่ยนแปลงใน SEM เป็นการเปลี่ยนแปลงขนาดตัวอย่าง
Harvey Motulsky

@HarveyMotulsky: ทำไม sd ถึงเพิ่มขึ้น?
แอนดรู

ด้วยตัวอย่างขนาดใหญ่ความแปรปรวนตัวอย่างจะค่อนข้างใกล้เคียงกับความแปรปรวนประชากรดังนั้น SD ตัวอย่างจะใกล้เคียงกับ SD ของประชากร ด้วยตัวอย่างขนาดเล็กความแปรปรวนตัวอย่างจะเท่ากับความแปรปรวนประชากรโดยเฉลี่ย แต่ความแตกต่างจะใหญ่กว่า หากสมมาตรเป็นความแปรปรวนพวกเขาจะไม่สมดุลเหมือน SD ตัวอย่าง: ความแปรปรวนของประชากรคือ 100 ความแปรปรวนตัวอย่างสองตัวอย่างคือ 80 หรือ 120 (สมมาตร) ตัวอย่าง SD ควรเป็น 10 แต่จะเป็น 8.94 หรือ 10.95 ตัวอย่าง SDs เฉลี่ยจากการกระจายแบบสมมาตรรอบความแปรปรวนประชากรและค่าเฉลี่ย SD จะต่ำโดยที่ N.
Harvey Motulsky

43

θx={x1,...,xn}θθ^(x)θ^(x)xx~θ^(x~)θ^(x)θ^θ^(x)θ^


1
ข้อผิดพลาดมาตรฐานของการประมาณการเท่ากับความเบี่ยงเบนมาตรฐานของตัวแปรที่ประมาณการหรือไม่
Yurii

6

(โปรดทราบว่าฉันมุ่งเน้นไปที่ข้อผิดพลาดมาตรฐานของค่าเฉลี่ยซึ่งฉันเชื่อว่าผู้ถามเป็นเช่นกัน แต่คุณสามารถสร้างข้อผิดพลาดมาตรฐานสำหรับสถิติตัวอย่างใด ๆ )

ข้อผิดพลาดมาตรฐานเกี่ยวข้องกับค่าเบี่ยงเบนมาตรฐาน แต่ไม่เหมือนกันและการเพิ่มขนาดตัวอย่างไม่ทำให้ใกล้กันมากขึ้น แต่มันทำให้พวกเขาห่างกันมากขึ้น ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างใกล้เคียงกับค่าเบี่ยงเบนมาตรฐานของประชากรเมื่อขนาดตัวอย่างเพิ่มขึ้น แต่ไม่ใช่ข้อผิดพลาดมาตรฐาน

บางครั้งคำศัพท์รอบ ๆ ตัวนี้ก็หนาไปหน่อย

เมื่อคุณรวบรวมตัวอย่างและคำนวณค่าเบี่ยงเบนมาตรฐานของตัวอย่างนั้นเมื่อตัวอย่างมีขนาดใหญ่ขึ้นการประเมินค่าเบี่ยงเบนมาตรฐานจะแม่นยำยิ่งขึ้น ดูเหมือนว่าจากคำถามของคุณนั่นคือสิ่งที่คุณคิด แต่ให้พิจารณาด้วยว่าค่าเฉลี่ยของกลุ่มตัวอย่างมีแนวโน้มที่จะใกล้เคียงกับค่าเฉลี่ยประชากรมากขึ้น นั่นเป็นสิ่งสำคัญสำหรับการทำความเข้าใจข้อผิดพลาดมาตรฐาน

ข้อผิดพลาดมาตรฐานคือสิ่งที่จะเกิดขึ้นหากคุณมีตัวอย่างหลายขนาดที่กำหนด ถ้าคุณหาตัวอย่าง 10 ข้อคุณจะได้ค่าประมาณค่าเฉลี่ย จากนั้นคุณนำตัวอย่าง 10 ข้อและค่าประมาณค่าเฉลี่ยใหม่เป็นต้น ค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยของตัวอย่างเหล่านั้นเป็นข้อผิดพลาดมาตรฐาน เนื่องจากคุณโพสต์คำถามของคุณคุณอาจเห็นได้ว่าถ้า N สูงดังนั้นข้อผิดพลาดมาตรฐานจะน้อยลงเนื่องจากค่าเฉลี่ยของกลุ่มตัวอย่างมีแนวโน้มที่จะเบี่ยงเบนจากค่าจริงน้อยกว่ามาก

สำหรับบางคนที่ฟังดูน่าอัศจรรย์เพราะคุณได้คำนวนจากตัวอย่างหนึ่ง ดังนั้นสิ่งที่คุณสามารถทำได้คือ bootstrap ข้อผิดพลาดมาตรฐานผ่านการจำลองเพื่อแสดงความสัมพันธ์ ใน R ที่จะมีลักษณะ:

# the size of a sample
n <- 10
# set true mean and standard deviation values
m <- 50
s <- 100

# now generate lots and lots of samples with mean m and standard deviation s
# and get the means of those samples. Save them in y.
y <- replicate( 10000, mean( rnorm(n, m, s) ) )
# standard deviation of those means
sd(y)
# calcuation of theoretical standard error
s / sqrt(n)

คุณจะพบว่าคำสั่งสุดท้ายสองคำนั้นสร้างหมายเลขเดียวกัน (โดยประมาณ) คุณสามารถเปลี่ยนแปลงค่า n, m และ s และค่าเหล่านั้นจะออกมาใกล้กันเสมอ


ฉันพบว่ามันมีประโยชน์จริง ๆ ขอบคุณสำหรับการโพสต์ มันจะยุติธรรมหรือไม่ที่จะอธิบายข้อผิดพลาดมาตรฐานว่า "ส่วนเบี่ยงเบนมาตรฐานของการกระจายตัวตัวอย่าง" การกระจายตัวตัวอย่างเป็น y ในบล็อคโค้ดของคุณด้านบน? นี่คือสิ่งที่ฉันสับสนสร้างความสับสนให้กับพารามิเตอร์ตัวอย่าง sd และค่าเฉลี่ยกับพารามิเตอร์การกระจายตัวอย่าง
Doug Fir

1
หากคุณเปลี่ยนถ้อยคำเพื่อระบุตัวอย่างหมายถึงสำหรับกรณีนี้ใช่
John
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.