วันนี้ฉันสอนชั้นสถิติเบื้องต้นและมีนักเรียนคนหนึ่งถามคำถามซึ่งฉันได้เรียบเรียงใหม่ที่นี่: "ทำไมค่าเบี่ยงเบนมาตรฐานที่กำหนดเป็น sqrt ของความแปรปรวนและไม่ใช่ผลรวมของสี่เหลี่ยมจัตุรัสเหนือ N"
เรากำหนดความแปรปรวนประชากร:
และค่าเบี่ยงเบนมาตรฐาน: 2
ในความหมายที่เราจะได้มอบให้คือว่ามันจะช่วยให้ค่าเบี่ยงเบนเฉลี่ยของหน่วยในประชากรจากค่าเฉลี่ยของประชากรX
อย่างไรก็ตามในคำจำกัดความของ sd เราหาร sqrt ของผลรวมของกำลังสองผ่าน . คำถามที่นักเรียนยกคือทำไมเราไม่หาร sqrt ของ sume of squares โดยแทน ดังนั้นเรามาถึงสูตรการแข่งขัน:
ฉันคิดว่าคำถามนี้ไม่ได้โง่ ฉันต้องการที่จะให้คำตอบกับนักเรียนที่ไปไกลกว่าที่บอกว่า sd หมายถึง sqrt ของความแปรปรวนซึ่งเป็นค่าเบี่ยงเบนมาตรฐานกำลังสอง ทำไมนักเรียนถึงใช้สูตรที่ถูกต้องและไม่ทำตามความคิดของเธอ?
คำถามนี้เกี่ยวข้องกับด้ายเก่าและคำตอบที่ให้ไว้ที่นี่ คำตอบมีสามทิศทาง:
- คือค่าเบี่ยงเบน root-Mean-squared (RMS) ไม่ใช่ส่วนเบี่ยงเบน "ทั่วไป" จากค่าเฉลี่ย (เช่น ) ดังนั้นจึงถูกกำหนดแตกต่างกัน
- มันมีคุณสมบัติทางคณิตศาสตร์ที่ดี
- นอกจากนี้ sqrt จะนำ "หน่วย" กลับมาสู่ระดับเดิม แต่นี้ยังจะเป็นกรณีสำหรับซึ่งแบ่งโดยแทน
ทั้งสองจุดที่ 1 และ 2 มีข้อโต้แย้งในความโปรดปรานของ SD เป็น RMS แต่ผมไม่เห็นโต้แย้งกับการใช้งานของ W อะไรจะเป็นข้อโต้แย้งที่ดีในการโน้มน้าวใจนักเรียนระดับเริ่มต้นเกี่ยวกับการใช้ระยะทาง RMS เฉลี่ยจากค่าเฉลี่ย?
"Why is the standard deviation defined as sqrt of variance and not as average of [the root of] sum of squares?"
อาจเป็นได้ว่าสิ่งใดที่อยู่ในวงเล็บเหลี่ยมหายไปในคำถาม