เหตุผลที่ชัดเจนที่สุดคือบ่อยครั้งที่ไม่มีลำดับเวลาในค่าต่างๆ ดังนั้นหากคุณสับสนข้อมูลมันก็ไม่ได้สร้างความแตกต่างในข้อมูลที่ถ่ายทอดโดยข้อมูล หากเราปฏิบัติตามวิธีการของคุณทุกครั้งที่คุณสับสนข้อมูลที่คุณได้รับความแปรปรวนตัวอย่างที่แตกต่างกัน
คำตอบเชิงทฤษฎีมากขึ้นคือความแปรปรวนตัวอย่างประมาณความแปรปรวนที่แท้จริงของตัวแปรสุ่ม ความแปรปรวนที่แท้จริงของตัวแปรสุ่มคือ
E [ ( X - E X ) 2 ]X
E[ ( X- EX)2] .
นี่หมายถึงความคาดหวังหรือ "ค่าเฉลี่ย" ดังนั้นนิยามของความแปรปรวนคือระยะห่างกำลังสองเฉลี่ยระหว่างตัวแปรจากค่าเฉลี่ย เมื่อคุณดูคำจำกัดความนี้จะไม่มี "ลำดับเวลา" ที่นี่เนื่องจากไม่มีข้อมูล มันเป็นเพียงคุณสมบัติของตัวแปรสุ่มE
เมื่อคุณเก็บรวบรวมข้อมูลจากการกระจาย IID นี้คุณมีความเข้าใจ n วิธีที่ดีที่สุดในการประเมินความคาดหวังคือการใช้ค่าเฉลี่ยตัวอย่าง กุญแจสำคัญในที่นี้คือเราได้รับข้อมูล iid ดังนั้นจึงไม่มีการสั่งซื้อข้อมูล ตัวอย่างx 1 , x 2 , ... , x nเป็นเช่นเดียวกับตัวอย่างx 2 , x 5 , x 1 , x n .x1, x2, … , xnx1, x2, … , xnx2, x5, x1, xn. .
แก้ไข
ความแปรปรวนของตัวอย่างเป็นการวัดการกระจายตัวแบบเฉพาะสำหรับตัวอย่างชนิดที่วัดระยะทางเฉลี่ยจากค่าเฉลี่ย มีการกระจายแบบอื่นเช่นช่วงข้อมูลและช่วง Inter-Quantile
แม้ว่าคุณจะเรียงลำดับตามลำดับจากน้อยไปมาก แต่ก็ไม่ได้เปลี่ยนลักษณะของตัวอย่าง ตัวอย่าง (ข้อมูล) ที่คุณได้รับคือการรับรู้จากตัวแปร การคำนวณความแปรปรวนตัวอย่างนั้นคล้ายกับการเข้าใจว่าการกระจายตัวอยู่ในตัวแปรเท่าใด ตัวอย่างเช่นถ้าคุณสุ่มตัวอย่าง 20 คนและคำนวณความสูงของพวกเขาแล้วนั่นคือ 20 "การรับรู้" จากตัวแปรสุ่มความสูงของคน ตอนนี้ความแปรปรวนตัวอย่างควรจะวัดความแปรปรวนในความสูงของบุคคลทั่วไป หากคุณสั่งซื้อข้อมูล
100 , 110 , 123 , 124 , … ,X=
100 , 110 , 123 , 124 , … ,
ที่ไม่เปลี่ยนแปลงข้อมูลในตัวอย่าง
ให้ดูอีกตัวอย่างหนึ่ง ช่วยบอกว่าคุณมี 100 ข้อสังเกตจากตัวแปรสุ่มสั่งซื้อในลักษณะนี้จากนั้นระยะทางเฉลี่ยต่อมาคือ 1 หน่วยดังนั้นโดยวิธีการของคุณความแปรปรวนจะเป็น 1
1,2,3,4,5,6,7,8,9,10,11,12,13,14,...100.
วิธีการตีความ "ความแปรปรวน" หรือ "การกระจาย" คือการเข้าใจช่วงของค่าที่เป็นไปได้สำหรับข้อมูล ในกรณีนี้คุณจะได้รับช่วง. 99 หน่วยซึ่งแน่นอนไม่ได้เป็นตัวแทนของการเปลี่ยนแปลงที่ดี
หากแทนที่จะใช้ค่าเฉลี่ยคุณเพียงแค่รวมความแตกต่างที่ตามมาความแปรปรวนของคุณจะเท่ากับ 99 แน่นอนว่าไม่ได้แสดงถึงความแปรปรวนในตัวอย่างเพราะ 99 ให้ช่วงของข้อมูลไม่ใช่ความแปรปรวน