เหตุใดจึงใช้สแควร์รูทสำหรับการนับตัวอย่าง“ N” ในสูตรค่าเบี่ยงเบนมาตรฐาน


9

ฉันพยายามเข้าใจแนวคิดพื้นฐานของการเบี่ยงเบนมาตรฐาน

จากสูตร σ=i=1n(xiμ)2N

ฉันไม่เข้าใจว่าทำไมเราควรลดจำนวนประชากร "N" ลงครึ่งหนึ่งนั่นคือสาเหตุที่เราต้องการที่จะ N เมื่อเราไม่ได้ทำ N2? นั่นไม่บิดเบือนประชากรที่เรากำลังพิจารณาใช่หรือไม่

ไม่ควรเป็นสูตร σ=i=1n(xiμ)2N

คำตอบ:


10

คุณกำลังพยายามหาค่าเบี่ยงเบน "ทั่วไป" จากค่าเฉลี่ย

ความแปรปรวนคือ "ระยะทางยกกำลังสองเฉลี่ยจากค่าเฉลี่ย"

ค่าเบี่ยงเบนมาตรฐานคือสแควร์รูทของมัน

นั่นทำให้มันเบี่ยงเบนรากค่าเฉลี่ยกำลังสองจากค่าเฉลี่ย

  1. ทำไมเราถึงใช้ค่าเบี่ยงเบนกำลังสองเฉลี่ย? อะไรทำให้ความแตกต่างน่าสนใจ เหนือสิ่งอื่นใดเนื่องจาก ความจริงพื้นฐานเกี่ยวกับความแปรปรวน - ความแปรปรวนของผลรวมของตัวแปรที่ไม่เกี่ยวข้องคือผลรวมของความแปรปรวนของแต่ละบุคคล (คำถามนี้ครอบคลุมในคำถามจำนวนมากเช่นที่นี่ ใน CrossValidated คุณลักษณะที่มีประโยชน์นี้ไม่ได้แชร์ตัวอย่างเช่นค่าเบี่ยงเบนสัมบูรณ์
  2. ทำไมต้องใช้สแควร์รูทของสิ่งนั้น เพราะมันอยู่ในหน่วยเดียวกับข้อสังเกตดั้งเดิม มันวัดชนิดของ 'ระยะทางปกติ' ชนิดพิเศษจากค่าเฉลี่ย (ดังที่กล่าวไว้ระยะทาง RMS) - แต่เนื่องจากคุณสมบัติความแปรปรวนข้างต้น - อันที่มีคุณสมบัติที่ดีบางอย่าง

7

ส่วนเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวน

ความแปรปรวนคือระยะยกกำลังสองเฉลี่ยของข้อมูลจากค่าเฉลี่ย เนื่องจากค่าเฉลี่ยคือผลรวมหารด้วยจำนวนรายการที่รวมสูตรสำหรับความแปรปรวนคือ:

Var(X)=E[(Xμ)2]=i=1N(xiμ)2N
ตั้งแต่นั้นมาค่าเบี่ยงเบนมาตรฐานก็แค่สแควร์รูทของสูตรการเบี่ยงเบนมาตรฐานคือ:
S.D.(X)=Var(X)=i=1N(xiμ)2N
ไม่มีอะไรที่ได้รับการเพิ่มหรือมีการเปลี่ยนแปลงเกี่ยวกับสมมติฐานหรือความแปรปรวนที่นี่เราก็เอารากที่สองของความแปรปรวนเนื่องจากว่าเป็นสิ่งที่มีค่าเบี่ยงเบนมาตรฐานคือ

อาจจะกล่าวได้ว่าสูตรความแปรปรวนนี้เป็นจริงสำหรับเครื่องแบบแยกเท่านั้น มิฉะนั้นอาจสร้างความสับสนให้กับความแตกต่างระหว่างกลุ่มตัวอย่างและความแปรปรวนของประชากร
เทย์เลอร์

@Taylor ฉันไม่ทราบว่าคุณหมายถึงอะไร สูตรสำหรับความแปรปรวนไม่เกี่ยวข้องกับการแจกแจง
gung - Reinstate Monica

สูตรสำหรับความแปรปรวน (ตัวอย่าง) ไม่เกี่ยวข้องกับการแจกแจง ( en.wikipedia.org/wiki/Expected_value#Definition )
เทย์เลอร์

@Taylor ฉันยังไม่ทราบว่าคุณหมายถึงอะไร สูตรสำหรับความแปรปรวนไม่เกี่ยวข้องกับการแจกแจง เพื่ออ้างอิงจากหน้า Wikipedia "ความแปรปรวนของตัวแปรสุ่ม X คือค่าที่คาดหวังของการเบี่ยงเบนกำลังสองจากค่าเฉลี่ยของ X ...Var(X)=E[(Xμ)2]. คำจำกัดความนี้ครอบคลุมตัวแปรสุ่มที่สร้างขึ้นโดยกระบวนการที่ไม่ต่อเนื่องไม่ต่อเนื่องหรือผสมสูตรนี้ไม่เพียง แต่จะถือเป็นชุดที่ไม่ต่อเนื่องเท่านั้น
gung - Reinstate Monica

ใช่ถูกต้องถ้าคุณทำ μ=EXแต่ E[(Xμ)2] ไม่จำเป็นต้องเท่ากันสำหรับตัวแปรสุ่มใด ๆ X, 1Ni(xiμ)2. สำหรับหนึ่งอันแรกคือค่าคงที่และที่สองคือการสุ่ม จริงๆแล้วมันยังไม่ชัดเจนว่าผลรวมจะผ่านการสนับสนุนของXหรือจำนวนตัวอย่าง หากหลังมันแปลกที่คุณรู้μซึ่งหาได้ยากในทางปฏิบัติ ถ้าในอดีตใช่แล้วมันเป็นความจริงสำหรับเครื่องแบบที่ไม่ต่อเนื่อง (เพราะเป็นผลรวม) (เพราะน้ำหนักเป็นเครื่องแบบทั้งหมด)
เทย์เลอร์

1

สิ่งแรกที่ต้องเข้าใจคือค่าเบี่ยงเบนมาตรฐาน (STD) จะแตกต่างจากการเบี่ยงเบนสัมบูรณ์เฉลี่ย ทั้งสองกำหนดคุณสมบัติทางคณิตศาสตร์ที่แตกต่างกันเกี่ยวกับข้อมูล

ซึ่งแตกต่างจากค่าเบี่ยงเบนสัมบูรณ์เฉลี่ยส่วนเบี่ยงเบนมาตรฐาน (std) น้ำหนักมากกว่าค่าที่อยู่ห่างจากค่าเฉลี่ยซึ่งจะทำโดยการยกกำลังสองค่าความแตกต่าง

เช่นสำหรับจุดข้อมูลสี่จุดต่อไปนี้:

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

ค่าเบี่ยงเบนสัมบูรณ์เฉลี่ย (aad) =16/4=4.0และ

ค่าเบี่ยงเบนมาตรฐาน (std) = 80/4=20=4.47

ในข้อมูลมีจุดสองจุดซึ่งอยู่ห่างจากค่าเฉลี่ย 6 จุดและสองจุดซึ่งห่างจากค่าเฉลี่ย 2 จุด ดังนั้นการเบี่ยงเบนของ 4.47 จึงสมเหตุสมผลมากกว่า 4

เนื่องจากการสังเกตโดยรวมอยู่เสมอ Nสำหรับการคำนวณมาตรฐานเราไม่ได้ดำน้ำโดย Nแต่เราหารความแปรปรวนทั้งหมดด้วย Nและนำสแควร์รูทของมันไปยังหน่วยเดียวกันกับข้อมูลดั้งเดิม


0

@Mahesh Subramaniya - นี้เป็นเพียงแค่บิดทางคณิตศาสตร์ เมื่อเรามีคุณค่าดั้งเดิมเช่นa/b=()d. เราสามารถได้ค่าเดียวกันโดยใช้สมการสองตัวนี้a2b=c และ cb=d.

เช่นทำกับ 52 = 2.5. แต่เราต้องการเพียงค่าไม่ใช่ลบ

ตอนนี้ 522=12.5. และ12.52=2.5

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.