มีการฝึกสอนคนธรรมดามากมายเกี่ยวกับการเบี่ยงเบนมาตรฐานและความแปรปรวน
TL; DR; มันเหมือนกับค่าเฉลี่ยของระยะทางจากค่าเฉลี่ย (ซึ่งเป็นบิตสับสนและทำให้เข้าใจผิดในรุ่นที่กระชับดังนั้นอ่านบทความเต็ม)
ฉันถือว่าคนธรรมดารู้เรื่องเฉลี่ย ฉันพูดถึงความสำคัญของการรู้ SD และการประเมินข้อผิดพลาด (ดู PS ด้านล่าง) จากนั้นฉันสัญญาว่าจะไม่มีการใช้ความรู้ทางคณิตศาสตร์หรือสถิติอันศักดิ์สิทธิ์ใด ๆ - เป็นเพียงเหตุผลที่สมเหตุสมผลและตรรกะที่บริสุทธิ์
ปัญหา. ให้บอกว่าเรามีเทอร์โมมิเตอร์ (ฉันเลือกอุปกรณ์วัดตามสิ่งที่อยู่ใกล้กับหู)
เราทำการวัดอุณหภูมิและเครื่องวัดอุณหภูมิแบบเดียวกันโดยที่ N แสดงให้เราเห็นเช่น 36.5, 35.9, 37.0, 36.6, ... (ดูรูป) เรารู้ว่าอุณหภูมิจริงนั้นเท่ากัน แต่เทอร์โมมิเตอร์อยู่กับเราเพียงเล็กน้อยในแต่ละการวัด
เราจะประมาณปริมาณขยะขนาดเล็กนี้อยู่กับเราได้อย่างไร
เราสามารถคำนวณค่าเฉลี่ย (ดูเส้นสีแดงในภาพด้านล่าง) เราเชื่อได้มั้ย แม้หลังจากเฉลี่ยแล้วมันมีความแม่นยำเพียงพอสำหรับความต้องการของเราหรือไม่?
วิธีที่ง่ายที่สุด เราสามารถหาจุดที่ไกลที่สุดคำนวณระยะห่างระหว่างมันกับค่าเฉลี่ย (เส้นสีแดง) แล้วบอกว่านี่คือวิธีที่เทอร์โมมิเตอร์อยู่กับเราเพราะมันเป็นความผิดพลาดสูงสุดที่เราเห็น อาจเดาได้ว่ามันไม่ใช่การประเมินที่ดีที่สุด ถ้าเราดูภาพส่วนใหญ่อยู่ในระดับโดยเฉลี่ยเราจะตัดสินได้แค่จุดเดียว ที่จริงแล้วหนึ่งคนสามารถฝึกเหตุผลการนับเลขทำไมการประมาณเช่นนั้นหยาบและมักจะไม่ดี
ความแปรปรวน จากนั้น ... ให้ใช้ระยะทางทั้งหมดและคำนวณระยะทางเฉลี่ย !
(xi−x¯)x¯xiเป็นหนึ่งในการวัด
จากนั้นอาจจินตนาการได้ว่าสูตรของระยะทางเฉลี่ยจะรวมกันทุกอย่างและหารด้วย N:
∑(xi−x¯)N
แต่มีปัญหา เราสามารถมองเห็นได้ง่ายเช่น ที่ 36.4 และ 36.8 อยู่ที่ระยะห่างเดียวกันจาก 36.6 แต่ถ้าเราใส่ค่าในสูตรด้านบนเราจะได้รับ -0.2 และ +0.2 และผลรวมของพวกเขาเท่ากับ 0 ซึ่งไม่ใช่สิ่งที่เราต้องการ
วิธีกำจัดเครื่องหมาย (ณ จุดนี้คนธรรมดามักพูดว่า "รับค่าสัมบูรณ์" และรับคำแนะนำว่า "การรับค่าสัมบูรณ์เป็นสิ่งประดิษฐ์น้อยอีกวิธีหนึ่งคืออะไร") เราสามารถกำหนดค่าเป็นสองเท่า! จากนั้นสูตรจะกลายเป็น:
∑(xi−x¯)2N
สูตรนี้เรียกว่า "ความแปรปรวน" ในสถิติ และมันก็เหมาะกว่าการประมาณค่าการแพร่กระจายของเทอร์โมมิเตอร์ (หรืออะไรก็ตาม) ที่ดีกว่าการวัดระยะทางสูงสุด
ส่วนเบี่ยงเบนมาตรฐาน แต่ก็ยังมีอีกหนึ่งปัญหา ดูสูตรความแปรปรวน กำลังสองทำให้หน่วยการวัดของเรา ... กำลังสอง หากเครื่องวัดอุณหภูมิวัดอุณหภูมิเป็น° C (หรือ° F) การประมาณค่าความผิดพลาดของเรานั้นวัดเป็น (หรือ ° F 2°C2°F2 ) วิธีการแก้สี่เหลี่ยม? - ใช้สแควร์รูท!
∑(xi−x¯)2N−−−−−−−−−−√
ดังนั้นที่นี่เรามาถึงสูตรค่าเบี่ยงเบนมาตรฐานซึ่งจะแสดงกันทั่วไปว่าเป็น\และนี่คือวิธีที่ดีกว่าในการประเมินความแม่นยำของอุปกรณ์ของเราσ
ณ จุดนี้คนธรรมดาเข้าใจชัดเจนว่าเรามาที่นี่ได้อย่างไรและการเบี่ยงเบนมาตรฐาน / ความแปรปรวนทำงานอย่างไร จากจุดนี้ฉันมักจะไปที่กฎ 68–95–99.7 ซึ่งอธิบายเกี่ยวกับการสุ่มตัวอย่างและประชากรข้อผิดพลาดมาตรฐานเทียบกับข้อกำหนดส่วนเบี่ยงเบนมาตรฐาน ฯลฯ
PS ความสำคัญของการรู้ตัวอย่างพูดคุย SD:
ช่วยบอกว่าคุณมีอุปกรณ์วัดบางที่ costed 1 000 000 $ และมันให้คำตอบกับคุณ: 42. คุณคิดว่าจะจ่าย 1 000 000 $สำหรับ 42 ไหม? อี้! หนึ่งจ่าย 1,000,000 สำหรับความแม่นยำของคำตอบนั้น เพราะคุ้มค่า - ไม่มีค่าใช้จ่ายใด ๆ โดยไม่ทราบว่ามีข้อผิดพลาด คุณจ่ายสำหรับข้อผิดพลาดไม่ใช่ค่า นี่คือตัวอย่างชีวิตที่ดี
ในชีวิตทั่วไปเวลาส่วนใหญ่เราใช้ไม้บรรทัดเพื่อวัดระยะทาง ไม้บรรทัดให้ความแม่นยำประมาณหนึ่งมิลลิเมตร (หากคุณไม่ได้อยู่ในสหรัฐฯ) ถ้าคุณต้องไปไกลกว่ามิลลิเมตรแล้ววัดบางอย่างด้วยความแม่นยำ 0.1 มม. - คุณอาจใช้คาลิปเปอร์ ตอนนี้มันเป็นเรื่องง่ายที่จะตรวจสอบว่าผู้ปกครองที่ถูกที่สุด (แต่ยังมีความแม่นยำมิลลิเมตร) ค่าใช้จ่ายเซนต์ในขณะที่คาลิปเปอร์ที่ดีค่าใช้จ่ายสิบดอลลาร์ 2 ขนาดของราคาสำหรับ 1 ขนาดของความแม่นยำ และนั่นเป็นเรื่องปกติของจำนวนเงินที่คุณจ่ายสำหรับข้อผิดพลาด