ฉันพยายามเข้าใจถึงความแตกต่างระหว่างข้อผิดพลาดมาตรฐานและส่วนเบี่ยงเบนมาตรฐาน มันแตกต่างกันอย่างไรและทำไมคุณต้องวัดความผิดพลาดมาตรฐาน?
ฉันพยายามเข้าใจถึงความแตกต่างระหว่างข้อผิดพลาดมาตรฐานและส่วนเบี่ยงเบนมาตรฐาน มันแตกต่างกันอย่างไรและทำไมคุณต้องวัดความผิดพลาดมาตรฐาน?
คำตอบ:
เพื่อให้คำตอบของคำถามเสร็จสมบูรณ์ Ocram แก้ไขข้อผิดพลาดมาตรฐานอย่างดี แต่ไม่ได้เปรียบเทียบกับส่วนเบี่ยงเบนมาตรฐานและไม่ได้กล่าวถึงการพึ่งพาขนาดตัวอย่าง ในกรณีพิเศษสำหรับตัวประมาณให้พิจารณาค่าเฉลี่ยตัวอย่าง ข้อผิดพลาดมาตรฐานสำหรับค่าเฉลี่ยคือโดยที่σคือค่าเบี่ยงเบนมาตรฐานของประชากร ดังนั้นในตัวอย่างนี้เราจะเห็นได้อย่างชัดเจนว่าข้อผิดพลาดมาตรฐานลดลงอย่างไรเมื่อเพิ่มขนาดตัวอย่าง ค่าเบี่ยงเบนมาตรฐานมักใช้เพื่ออ้างถึงการสังเกตการณ์ส่วนบุคคล ดังนั้นค่าเบี่ยงเบนมาตรฐานจะอธิบายความแปรปรวนของการสังเกตการณ์ส่วนบุคคลในขณะที่ข้อผิดพลาดมาตรฐานแสดงให้เห็นถึงความแปรปรวนของตัวประมาณ ตัวประมาณที่ดีมีความสอดคล้องซึ่งหมายความว่าพวกมันมาบรรจบกับค่าพารามิเตอร์จริง เมื่อข้อผิดพลาดมาตรฐานลดลงเป็น 0 เมื่อขนาดตัวอย่างเพิ่มขึ้นตัวประมาณจะสอดคล้องกันซึ่งส่วนใหญ่เกิดขึ้นเนื่องจากข้อผิดพลาดมาตรฐานไปที่ 0 ตามที่เราเห็นอย่างชัดเจนด้วยค่าเฉลี่ยตัวอย่าง
นี่คือคำตอบที่ใช้ได้จริง (ไม่ใช่ทางคณิตศาสตร์):
โปรดทราบว่าข้อผิดพลาดมาตรฐานสามารถคำนวณได้สำหรับเกือบทุกพารามิเตอร์ที่คุณคำนวณจากข้อมูลไม่ใช่แค่ค่าเฉลี่ย วลี "ข้อผิดพลาดมาตรฐาน" นั้นค่อนข้างคลุมเครือ คะแนนด้านบนอ้างถึงข้อผิดพลาดมาตรฐานของค่าเฉลี่ย
(จากคู่มือสถิติ GraphPadที่ฉันเขียน)
(โปรดทราบว่าฉันมุ่งเน้นไปที่ข้อผิดพลาดมาตรฐานของค่าเฉลี่ยซึ่งฉันเชื่อว่าผู้ถามเป็นเช่นกัน แต่คุณสามารถสร้างข้อผิดพลาดมาตรฐานสำหรับสถิติตัวอย่างใด ๆ )
ข้อผิดพลาดมาตรฐานเกี่ยวข้องกับค่าเบี่ยงเบนมาตรฐาน แต่ไม่เหมือนกันและการเพิ่มขนาดตัวอย่างไม่ทำให้ใกล้กันมากขึ้น แต่มันทำให้พวกเขาห่างกันมากขึ้น ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างใกล้เคียงกับค่าเบี่ยงเบนมาตรฐานของประชากรเมื่อขนาดตัวอย่างเพิ่มขึ้น แต่ไม่ใช่ข้อผิดพลาดมาตรฐาน
บางครั้งคำศัพท์รอบ ๆ ตัวนี้ก็หนาไปหน่อย
เมื่อคุณรวบรวมตัวอย่างและคำนวณค่าเบี่ยงเบนมาตรฐานของตัวอย่างนั้นเมื่อตัวอย่างมีขนาดใหญ่ขึ้นการประเมินค่าเบี่ยงเบนมาตรฐานจะแม่นยำยิ่งขึ้น ดูเหมือนว่าจากคำถามของคุณนั่นคือสิ่งที่คุณคิด แต่ให้พิจารณาด้วยว่าค่าเฉลี่ยของกลุ่มตัวอย่างมีแนวโน้มที่จะใกล้เคียงกับค่าเฉลี่ยประชากรมากขึ้น นั่นเป็นสิ่งสำคัญสำหรับการทำความเข้าใจข้อผิดพลาดมาตรฐาน
ข้อผิดพลาดมาตรฐานคือสิ่งที่จะเกิดขึ้นหากคุณมีตัวอย่างหลายขนาดที่กำหนด ถ้าคุณหาตัวอย่าง 10 ข้อคุณจะได้ค่าประมาณค่าเฉลี่ย จากนั้นคุณนำตัวอย่าง 10 ข้อและค่าประมาณค่าเฉลี่ยใหม่เป็นต้น ค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยของตัวอย่างเหล่านั้นเป็นข้อผิดพลาดมาตรฐาน เนื่องจากคุณโพสต์คำถามของคุณคุณอาจเห็นได้ว่าถ้า N สูงดังนั้นข้อผิดพลาดมาตรฐานจะน้อยลงเนื่องจากค่าเฉลี่ยของกลุ่มตัวอย่างมีแนวโน้มที่จะเบี่ยงเบนจากค่าจริงน้อยกว่ามาก
สำหรับบางคนที่ฟังดูน่าอัศจรรย์เพราะคุณได้คำนวนจากตัวอย่างหนึ่ง ดังนั้นสิ่งที่คุณสามารถทำได้คือ bootstrap ข้อผิดพลาดมาตรฐานผ่านการจำลองเพื่อแสดงความสัมพันธ์ ใน R ที่จะมีลักษณะ:
# the size of a sample
n <- 10
# set true mean and standard deviation values
m <- 50
s <- 100
# now generate lots and lots of samples with mean m and standard deviation s
# and get the means of those samples. Save them in y.
y <- replicate( 10000, mean( rnorm(n, m, s) ) )
# standard deviation of those means
sd(y)
# calcuation of theoretical standard error
s / sqrt(n)
คุณจะพบว่าคำสั่งสุดท้ายสองคำนั้นสร้างหมายเลขเดียวกัน (โดยประมาณ) คุณสามารถเปลี่ยนแปลงค่า n, m และ s และค่าเหล่านั้นจะออกมาใกล้กันเสมอ