ความแตกต่างระหว่างความแปรปรวนกับค่าเบี่ยงเบนมาตรฐานคืออะไร


127

ฉันสงสัยว่าความแตกต่างระหว่างความแปรปรวนกับส่วนเบี่ยงเบนมาตรฐานคืออะไร

หากคุณคำนวณค่าทั้งสองเป็นที่ชัดเจนว่าคุณได้ค่าเบี่ยงเบนมาตรฐานจากความแปรปรวน แต่นั่นหมายความว่าในแง่ของการกระจายที่คุณสังเกต

นอกจากนี้ทำไมคุณต้องมีค่าเบี่ยงเบนมาตรฐานจริง ๆ



12
คุณอาจได้รับคำตอบในตอนนี้ ลิงก์นี้ยังมีคำอธิบายที่ง่ายและดีที่สุด mathsisfun.com/data/standard-deviation.html

2
ค่าเบี่ยงเบนมาตรฐานมีประโยชน์เนื่องจากค่าอยู่ในระดับเดียวกับข้อมูลที่ถูกคำนวณ หากการวัดเมตรค่าเบี่ยงเบนมาตรฐานจะเป็นเมตร ในทางตรงกันข้ามความแปรปรวนจะเป็นเมตรกำลังสอง
Vladislavs Dovgalecs

ความแปรปรวนมาตรฐานสามารถไม่เอนเอียงได้แต่ความเบี่ยงเบนมาตรฐานไม่สามารถทำได้เนื่องจากฟังก์ชันรากที่สองไม่เป็นเส้นตรง
Daksh Gargas

คำตอบ:


84

ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวน

ค่าเบี่ยงเบนมาตรฐานจะแสดงในหน่วยเดียวกับค่าเฉลี่ยในขณะที่ความแปรปรวนแสดงหน่วยกำลังสอง แต่สำหรับการดูการแจกแจงคุณสามารถใช้ทั้งตราบเท่าที่คุณชัดเจนเกี่ยวกับสิ่งที่คุณกำลังใช้ ตัวอย่างเช่นการแจกแจงแบบปกติที่มีค่าเฉลี่ย = 10 และ sd = 3 เป็นสิ่งเดียวกันกับการแจกแจงแบบปกติที่มีค่าเฉลี่ย = 10 และความแปรปรวน = 9


58
ใช่นั่นคือวิธีการทางคณิตศาสตร์เพื่ออธิบายพารามิเตอร์ทั้งสองนี้ แต่การอธิบายเชิงตรรกะคืออะไร ทำไมฉันถึงต้องใช้พารามิเตอร์สองตัวเพื่อแสดงสิ่งเดียวกัน (ส่วนเบี่ยงเบนรอบค่าเฉลี่ยเลขคณิต) ...
เลอแม็กซ์

5
คุณไม่ต้องการทั้งสองอย่างจริงๆ หากคุณรายงานหนึ่งคุณไม่จำเป็นต้องรายงานอีก
Peter Flom

8
เราต้องการทั้งคู่: ส่วนเบี่ยงเบนมาตรฐานนั้นดีสำหรับการตีความการรายงาน สำหรับการพัฒนาทฤษฎีความแปรปรวนจะดีกว่า
kjetil b halvorsen

4
ประโยชน์ของการรายงานค่าเบี่ยงเบนมาตรฐานคือมันยังคงอยู่ในระดับของข้อมูล สมมติว่าตัวอย่างของความสูงของผู้ใหญ่อยู่ในหน่วยเมตรแล้วส่วนเบี่ยงเบนมาตรฐานก็จะเป็นหน่วยเมตรด้วย
Vladislavs Dovgalecs

5
@RushatRai เมื่อจัดการกับผลรวมของตัวแปรสุ่มความแปรปรวนจะได้รับการรวมเข้าด้วยกัน สำหรับตัวแปรสุ่มอิสระ(x_i) การแสดงออกที่คล้ายกันมีอยู่ในกรณีทั่วไปที่ไม่มีความเป็นอิสระ (ด้วยการแก้ไขโดยใช้เงื่อนไขความแปรปรวนร่วม) โดยทั่วไปการแปลงรากที่สองจะทำให้สิ่งต่าง ๆ ยุ่งยากและทำให้ส่วนเบี่ยงเบนมาตรฐานยากต่อการทำงานกับการวิเคราะห์ Var(Xi)=Var(Xi)
knrumsey

49

คุณไม่ต้องการทั้งคู่ พวกเขาแต่ละคนมีวัตถุประสงค์ที่แตกต่างกัน SD มักจะมีประโยชน์มากกว่าในการอธิบายความแปรปรวนของข้อมูลในขณะที่ความแปรปรวนมักจะมีประโยชน์มากกว่าในเชิงคณิตศาสตร์ ตัวอย่างเช่นผลรวมของการแจกแจง uncorrelated (ตัวแปรสุ่ม) ยังมีความแปรปรวนที่เป็นผลรวมของความแปรปรวนของการแจกแจงเหล่านั้น สิ่งนี้จะไม่เป็นจริงใน SD ในทางตรงกันข้าม SD มีความสะดวกในการแสดงในหน่วยของตัวแปรดั้งเดิม


24

ถ้าจอห์นอ้างถึงตัวแปรสุ่มแบบอิสระเมื่อเขาพูดว่า "การแจกแจงที่ไม่เกี่ยวข้อง" การตอบสนองของเขานั้นถูกต้อง อย่างไรก็ตามเพื่อตอบคำถามของคุณมีหลายจุดที่สามารถเพิ่มได้:

  1. ค่าเฉลี่ยและความแปรปรวนเป็นพารามิเตอร์สองตัวที่กำหนดการแจกแจงแบบปกติ

  2. ความไม่เท่าเทียมกันของ Chebyshev นั้นจำกัดความน่าจะเป็นของตัวแปรสุ่มที่สังเกตได้ว่าอยู่ภายในค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยk

  3. ค่าเบี่ยงเบนมาตรฐานที่ใช้ในการปกติสถิติการทดสอบทางสถิติ (เช่นที่รู้จักกันส่วนเบี่ยงเบนมาตรฐานที่ใช้ในการปกติตัวอย่างหมายความว่าสำหรับทดสอบที่ความหมายที่แตกต่างจากหรือค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างที่ใช้ในการปกติตัวอย่างหมายถึงเมื่อมาตรฐานจริง ไม่รู้จักการเบี่ยงเบนทำให้มีการทดสอบ )0 tz0t

  4. 68%195.4%299%3

  5. ระยะขอบของข้อผิดพลาดจะแสดงเป็นค่าเบี่ยงเบนมาตรฐานของการประมาณ

  6. ความแปรปรวนและอคติเป็นการวัดความไม่แน่นอนในปริมาณที่สุ่ม ความคลาดเคลื่อนกำลังสองเฉลี่ยสำหรับการประมาณการเท่ากับความแปรปรวน + ความเบี่ยงเบนยกกำลังสอง


4
คุณไม่ควรพูดว่า "พารามิเตอร์ธรรมชาติ" ซึ่งหมายถึงหารด้วยความแปรปรวนและ 1 หารด้วยความแปรปรวน: en.wikipedia.org/wiki/Natural_parameter
Neil G

σ

ในจุดที่ 3 ไม่ควรใช้ "การเบี่ยงเบนมาตรฐานเพื่อสร้างมาตรฐานสถิติ" แทนที่จะเป็นมาตรฐานหรือไม่
แฮร์รี่

15

ความแปรปรวนของชุดข้อมูลวัดการกระจายทางคณิตศาสตร์ของข้อมูลเทียบกับค่าเฉลี่ย อย่างไรก็ตามแม้ว่าค่านี้จะถูกต้องตามทฤษฎี แต่มันก็ยากที่จะนำไปใช้ในโลกแห่งความเป็นจริงเพราะค่าที่ใช้ในการคำนวณมันกำลังสอง ค่าเบี่ยงเบนมาตรฐานเนื่องจากสแควร์รูทของความแปรปรวนให้ค่าที่อยู่ในหน่วยเดียวกับค่าดั้งเดิมซึ่งทำให้ง่ายต่อการทำงานและตีความได้ง่ายขึ้นเมื่อเชื่อมโยงกับแนวคิดของเส้นโค้งปกติ


นี่เป็นงานที่ยอดเยี่ยมที่อธิบายว่าทำไมในแง่ง่าย
gwg

3
อีกจุดที่ดีที่จะทำคือแต่ละเมทริก sd และ var วัดการแพร่กระจายของตัวแปรเกี่ยวกับค่าเฉลี่ย การหาสแควร์รูทของความแปรปรวนเพื่อให้ได้ค่าเบี่ยงเบนมาตรฐานสามารถดูได้ว่าเป็นปัจจัยที่ใช้ในการปรับขนาดเพื่อให้ตัวชี้วัดกลับเข้าไปในหน่วยของตัวแปร
Matt L.

6

ในแง่ของการกระจายพวกมันเทียบเท่า (แต่เห็นได้ชัดว่าไม่สามารถแลกเปลี่ยนกันได้) แต่ระวังว่าในแง่ของตัวประมาณพวกมันไม่ได้: สแควร์รูทของการประมาณค่าความแปรปรวนไม่ใช่ตัวประมาณ (ไม่เอนเอียง) ของค่าเบี่ยงเบนมาตรฐาน สำหรับตัวอย่างจำนวนมากพอสมควร (และขึ้นอยู่กับตัวประมาณค่า) ทั้งสองเข้าหากัน สำหรับตัวอย่างขนาดเล็กคุณจำเป็นต้องรู้รูปแบบพารามิเตอร์ของการแจกแจงการแปลงระหว่างสองซึ่งสามารถกลายเป็นวงกลมเล็กน้อย


4

ในขณะที่คำนวณความแปรปรวนเราได้ยกกำลังเบี่ยงเบน หมายความว่าหากข้อมูล (การสังเกต) ที่ระบุเป็นหน่วยเมตรมันจะกลายเป็นตารางเมตร หวังว่ามันจะไม่ถูกต้องเกี่ยวกับการเบี่ยงเบน ดังนั้นเราจึงได้สแควร์รูทอีกครั้ง (SD) ที่ไม่มีอะไรนอกจาก SD

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.