ฉันไม่แน่ใจว่านี่เป็นปัญหาของสหรัฐฯและอังกฤษอย่างแท้จริง ส่วนที่เหลือของหน้านี้คัดลอกมาจากคำถามที่พบบ่อย ( http://www.graphpad.com/faq/viewfaq.cfm?faq=1383 )
วิธีการคำนวณ SD ด้วย n-1 ในตัวหาร
คำนวณกำลังสองของความแตกต่างระหว่างแต่ละค่าและค่าเฉลี่ยตัวอย่าง
เพิ่มค่าเหล่านั้นขึ้น
หารผลรวมด้วย n-1 ผลลัพธ์ถูกเรียกว่าความแปรปรวน
นำสแควร์รูทไปหาค่าเบี่ยงเบนมาตรฐาน
ทำไมต้อง n-1
ทำไมหารด้วย n-1 มากกว่า n เมื่อคำนวณส่วนเบี่ยงเบนมาตรฐาน ในขั้นตอนที่ 1 คุณคำนวณความแตกต่างระหว่างแต่ละค่าและค่าเฉลี่ยของค่าเหล่านั้น คุณไม่รู้ค่าเฉลี่ยที่แท้จริงของประชากร ทั้งหมดที่คุณรู้คือค่าเฉลี่ยของตัวอย่างของคุณ ยกเว้นกรณีที่หาได้ยากซึ่งค่าเฉลี่ยตัวอย่างเกิดขึ้นเท่ากับค่าเฉลี่ยประชากรข้อมูลจะใกล้เคียงกับค่าเฉลี่ยตัวอย่างมากกว่าค่าเฉลี่ยประชากรจริง ดังนั้นค่าที่คุณคำนวณในขั้นตอนที่ 2 อาจจะเล็กกว่าเล็กน้อย (และไม่สามารถมีขนาดใหญ่กว่า) ได้ถ้าคุณใช้ค่าเฉลี่ยประชากรจริงในขั้นตอนที่ 1 เมื่อต้องการทำสิ่งนี้ให้หารด้วย n-1 แทน กว่า nv สิ่งนี้เรียกว่าการแก้ไขของเบสเซล
แต่ทำไมต้อง n-1 หากคุณรู้ค่าเฉลี่ยตัวอย่างและทั้งหมดยกเว้นค่าใดค่าหนึ่งคุณสามารถคำนวณได้ว่าค่าสุดท้ายนั้นต้องเป็นเท่าใด นักสถิติกล่าวว่ามีองศาอิสระ n-1
เมื่อใดที่ควรคำนวณ SD ด้วยตัวส่วนของ n แทน n-1
หนังสือสถิติมักแสดงสมการสองอันเพื่อคำนวณ SD หนึ่งรายการที่ใช้ n และอีกอันใช้ n-1 ในตัวส่วน เครื่องคิดเลขบางตัวมีสองปุ่ม
สมการ n-1 ถูกใช้ในสถานการณ์ทั่วไปที่คุณกำลังวิเคราะห์ตัวอย่างของข้อมูลและต้องการสรุปโดยทั่วไป SD ที่คำนวณด้วยวิธีนี้ (โดยมี n-1 ในตัวส่วน) เป็นการคาดเดาที่ดีที่สุดของคุณสำหรับค่าของ SD ในประชากรโดยรวม
หากคุณเพียงต้องการหาปริมาณความแปรปรวนในชุดข้อมูลหนึ่ง ๆ และไม่ได้วางแผนที่จะคาดการณ์เพื่อให้ได้ข้อสรุปที่กว้างขึ้นคุณสามารถคำนวณ SD โดยใช้ n ในตัวหาร SD ที่ได้คือ SD ของค่าเฉพาะเหล่านั้น มันไม่มีเหตุผลที่จะคำนวณ SD ด้วยวิธีนี้หากคุณต้องการประมาณค่า SD ของประชากรที่ได้รับคะแนนเหล่านั้น มันสมเหตุสมผลที่จะใช้ n ในตัวหารเมื่อไม่มีการสุ่มตัวอย่างจากประชากรไม่มีความปรารถนาที่จะสรุปโดยทั่วไป
เป้าหมายของวิทยาศาสตร์นั้นมักจะพูดคุยกันเสมอดังนั้นไม่ควรใช้สมการกับ n ในตัวส่วน ตัวอย่างเดียวที่ฉันสามารถนึกได้ว่ามันจะเข้าท่าอย่างไรในการหาปริมาณความแปรปรวนระหว่างคะแนนสอบ แต่ที่ดีกว่ามากคือการแสดงกระจายของคะแนนทุกคะแนนหรือฮิสโตแกรมการกระจายความถี่