การใช้ส่วนเบี่ยงเบนมาตรฐานสร้างขึ้นบนสมมติฐานของการแจกแจงแบบปกติหรือไม่?


10

ฉันสงสัยว่าค่าเบี่ยงเบนมาตรฐานมักถูกสร้างขึ้นบนสมมติฐานของการแจกแจงแบบปกติหรือไม่ กล่าวอีกนัยหนึ่งถ้าตัวอย่างไม่กระจายตามปกติแล้วควรใช้การเบี่ยงเบนมาตรฐานถือเป็นข้อผิดพลาดหรือไม่?


3
การแจกแจงแบบสม่ำเสมอมีค่าเบี่ยงเบนมาตรฐานนี่จะเป็น "ความผิดพลาด" ได้อย่างไร?

คำตอบ:


18

ไม่การใช้ส่วนเบี่ยงเบนมาตรฐานไม่ถือว่าเป็นเรื่องปกติ

ความแปรปรวนของตัวแปรสุ่มถูกกำหนดให้เป็น2] ตราบใดที่มีความแปรปรวนอยู่ก็จะมีการเบี่ยงเบนมาตรฐานเช่นกัน ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวนVar(X)=E[(XE[X])2]

คุณสามารถใช้ความแปรปรวนหรือค่าเบี่ยงเบนมาตรฐานได้ตลอดเวลาที่ทั้งสองมีอยู่ ความแปรปรวนเกิดขึ้นในสถานการณ์ที่นับไม่ถ้วนVar(X)

มีทฤษฎีบทพิเศษบทแทรก ฯลฯ ... แต่สำหรับกรณีพิเศษที่ตามการแจกแจงปกติX

การใช้งานทั่วไปของค่าเบี่ยงเบนมาตรฐานที่ขึ้นอยู่กับภาวะปกติ:

หากตามการกระจายตัวแบบปกติแสดงว่ามีความน่าจะเป็นประมาณ 95% ที่ตกอยู่ภายในค่าเบี่ยงเบนมาตรฐานสองค่าของค่าเฉลี่ยXX

ข้อความนั้นเป็นจริงถ้าตามหลังการแจกแจงแบบปกติ (และอีกหลายข้อ) แต่มันไม่เป็นความจริงโดยทั่วไปX

การใช้งานทั่วไปของความแปรปรวนที่ไม่ได้ขึ้นอยู่กับภาวะปกติ:

ให้เป็นตัวแปรสุ่มที่มีค่าเฉลี่ยและความแปรปรวน 2 กำหนดสำหรับเป็นตัวแปรสุ่มอิสระตามแต่ละกระจายเหมือนกันXXE[X]=μVar(X)=σ2Xii=1,,nX

กำหนดค่าเฉลี่ยตัวอย่างตามการสังเกต : n

X¯n=1ni=1nXi

โดยทฤษฎีขีด จำกัด กลาง,ลู่ต่อตัวแปรสุ่มกระจายตามปกติที่มีค่าเฉลี่ยและความแปรปรวน{n} (แม่นยำมากขึ้นลู่เข้าสู่การกระจายไปยังเป็น )X¯nμσ2nn(X¯nμ)N(0,σ2)n

ความหมายในทางปฏิบัติคือการที่ค่าเฉลี่ยตัวอย่างขนาดใหญ่สามารถจะถือว่าเป็นตัวแปรสุ่มกระจายตามปกติที่มีความแปรปรวนเป็นหน้าที่ของความแปรปรวนของการX(เรียกคืน ) และผลลัพธ์นี้ไม่ต้องการให้เป็นปกติ (มันต้องใช้ค่าต่ำกว่าเพื่อให้ทำงานได้ดีถ้าใกล้เคียงกับการแจกแจงแบบปกติมากกว่า)X¯nnσ2nXVar(X)=σ2XnX

ทฤษฎีบทขีด จำกัด กลางเป็นเครื่องมือที่แพร่หลายที่ใช้ความแปรปรวนของและไม่จำเป็นต้องเพื่อติดตามการแจกแจงแบบปกติXX


4
เซฟของความไม่เท่าเทียมกันไม่เฉพาะกับความแปรปรวน: รุ่นประโยชน์อย่างเท่าเทียมกันที่มีอยู่สำหรับช่วงเวลาที่แน่นอนทุกท่านด้วยมากขึ้นประหยัดพลังงานกว่า1ดังนั้นฉันขอแนะนำให้ดูที่อื่นด้วยเหตุผลที่ SD มีความสำคัญและ (เกือบ) เป็นสากลเช่นบทบาทที่เป็นเอกลักษณ์ซึ่งเล่นโดยความแปรปรวนในทฤษฎีบทขีด จำกัด กลาง 1
whuber

@whuber ใช่ฉันได้เริ่มเขียนตัวอย่าง CLT (และตอนนี้ฉันได้เพิ่ม) CLT เป็นเหตุผลที่มีประโยชน์อย่างมากในการดูแลความแปรปรวน
Matthew Gunn

1
+1 แต่โปรดทราบว่าในขณะที่ความแปรปรวน (พร้อมกับค่าเฉลี่ย) ให้คำอธิบายที่สมบูรณ์ในกรณีปกติสำหรับการแจกแจงแบบไม่ปกตินี่อาจไม่ใช่กรณีอีกต่อไปและ d3 ตัวเขียนอื่น ๆ ของข้อมูลอาจดีกว่ามาก
kjetil b halvorsen

2

ในการตั้งค่า IID มาตรฐานภายใต้เงื่อนไขระเบียบที่เหมาะสม (เช่นเดียวกับ ) เป็นประมาณการที่สอดคล้องกันอย่างมากของ[x_i] สิ่งนี้ตามมาโดยตรงจากกฎที่แข็งแกร่งของคนจำนวนมาก ไม่จำเป็นต้องใช้แบบจำลองปกติS2σ^ML2Var[Xi]

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.