ค่าที่เพิ่มค่าเบี่ยงเบนมาตรฐาน


12

ฉันสับสนโดยคำสั่งต่อไปนี้:

"เพื่อเพิ่มค่าเบี่ยงเบนมาตรฐานของชุดตัวเลขคุณต้องเพิ่มค่าที่มากกว่าหนึ่งค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย"

อะไรคือสิ่งที่พิสูจน์ว่า? ฉันรู้แน่นอนว่าเรากำหนดค่าเบี่ยงเบนมาตรฐาน แต่ส่วนที่ฉันดูเหมือนจะพลาดอย่างใด มีคำแนะนำอะไรมั้ย?


1
คุณได้ลองทำพีชคณิตที่เกี่ยวข้องแล้วหรือยัง?
Alecos Papadopoulos

ใช่ฉันมี. ฉันได้ลบความแปรปรวนตัวอย่างของค่า n จากความแปรปรวนของค่า n + 1 และฉันต้องการความแตกต่างมากกว่าศูนย์ แต่ฉันก็ไม่สามารถคิดออก
JohnK

3
หนึ่งในวิธีที่ง่ายที่สุดคือการแยกความแตกต่างของอัลกอริธึมของ Welfordด้วยค่าใหม่จากนั้นรวมเข้าด้วยกันเพื่อแสดงว่าหากการแนะนำเพิ่มความแปรปรวนจากนั้นโดยที่เป็นค่าเฉลี่ยของค่าแรกและเป็นค่าประมาณความแปรปรวน x n ( x n - ˉ x n - 1 ) 2nxnxn ˉ x n-1n-1vn-1(xnx¯n1)2nn1vn1x¯n1n1vn1
whuber

โอเค แต่สิ่งนี้สามารถแสดงด้วยพีชคณิตแบบง่ายได้ไหม? ความรู้เกี่ยวกับสถิติของฉันไม่ได้สูงขนาดนั้น
JohnK

@JohnK คุณช่วยแบ่งปันแหล่งอ้างอิงได้ไหม?
Pe Dro

คำตอบ:


20

สำหรับตัวเลขใด ๆ มีค่าเฉลี่ย ความแปรปรวนจะได้รับโดย การใช้ไปยังชุดตัวเลขกำหนด ซึ่งเราใช้เพื่อความสะดวกในการแสดงนิทรรศการที่มีค่าเฉลี่ยเรามีสิ่งนั้น y 1 , y 2 , , y N ˉ y = 1Ny1,y2,,yN σ 2y¯=1Ni=1Nyi(1)nx1,x2,xnˉx=0σ2=1

σ2=1N1i=1N(yiy¯)2=1N1i=1N(yi22yiy¯+y¯2)=1N1[(i=1Nyi2)2N(y¯)2+N(y¯)2](1)σ2=1N1i=1N(yi2(y¯)2)
(1)nx1,x2,xnx¯=0
σ2=1n1i=1n(xi2(x¯)2)=1n1i=1nxi2
หากเราเพิ่มการสังเกตใหม่ในชุดข้อมูลนี้ดังนั้นค่าเฉลี่ยใหม่ของชุดข้อมูลคือ ในขณะที่ความแปรปรวนใหม่คือ Soจะต้องมีขนาดใหญ่กว่าxn+1
1n+1i=1n+1xi=nx¯+xn+1n+1=xn+1n+1
σ^2=1ni=1n+1(xi2xn+12(n+1)2)=1n[((n1)σ2+xn+12)xn+12n+1]=1n[(n1)σ2+nn+1xn+12]>σ2 only if xn+12>n+1nσ2.
|xn+1|σ1+1n หรือโดยทั่วไปแล้วจำเป็นต้องแตกต่างจากค่าเฉลี่ยของชุดข้อมูลดั้งเดิมที่มากกว่าเพื่อให้ชุดข้อมูลเพิ่มเติมมีความแปรปรวนมากกว่าชุดข้อมูลดั้งเดิม เห็นด้วยคำตอบของ Ray Koopman ซึ่งชี้ให้เห็นว่าความแปรปรวนใหม่มีขนาดใหญ่กว่าเท่ากับหรือเล็กกว่าความแปรปรวนดั้งเดิมตาม แตกต่างจากค่าเฉลี่ยมากกว่าหรือน้อยกว่า{n}}xn+1x¯σ1+1nxn+1σ1+1n

5
+1 ในที่สุดบางคนทำให้ถูกต้อง ... ;-) ข้อความที่จะพิสูจน์นั้นถูกต้อง มันไม่แน่น บังเอิญคุณอาจเลือกหน่วยการวัดของคุณเพื่อสร้างซึ่งจะทำให้การคำนวณง่ายขึ้นลดลงเหลือประมาณสองบรรทัด σ2=1
whuber

ฉันแนะนำให้คุณใช้ S แทนซิกมาในชุดแรกของสมการและขอบคุณสำหรับการมา มันเป็นเรื่องดีที่จะรู้ :)
เธโอเดน

3

ข้อความทำให้งงนั้นให้เงื่อนไขที่จำเป็น แต่ไม่เพียงพอสำหรับค่าเบี่ยงเบนมาตรฐานที่จะเพิ่มขึ้น หากขนาดตัวอย่างเก่าคือค่าเฉลี่ยเดิมคือส่วนเบี่ยงเบนมาตรฐานเก่าคือและเพิ่มจุดใหม่ลงในข้อมูลดังนั้นค่าเบี่ยงเบนมาตรฐานใหม่จะน้อยกว่าเท่ากับหรือมากกว่าตาม เป็นน้อยกว่าเท่ากับหรือมากกว่าn}nmsxs|xm|s1+1/n


1
คุณมีหลักฐานอยู่ในมือหรือไม่?
JohnK

2

ทิ้งพีชคณิต (ซึ่งใช้งานได้) คิดแบบนี้: ส่วนเบี่ยงเบนมาตรฐานคือสแควร์รูทของความแปรปรวน ความแปรปรวนคือค่าเฉลี่ยของระยะกำลังสองจากค่าเฉลี่ย หากเราเพิ่มค่าที่ใกล้เคียงกับค่าเฉลี่ยมากกว่านี้ความแปรปรวนจะลดลง หากเราเพิ่มค่าที่อยู่ห่างจากค่าเฉลี่ยมากกว่านี้มันจะเติบโต

สิ่งนี้เป็นจริงของค่าเฉลี่ยใด ๆ ที่ไม่ใช่ค่าลบ หากคุณเพิ่มค่าที่สูงกว่าค่าเฉลี่ยค่าเฉลี่ยจะเพิ่มขึ้น ถ้าคุณเพิ่มค่าที่น้อยกว่ามันจะลดลง


ฉันชอบที่จะเห็นหลักฐานที่เข้มงวดเช่นกัน ในขณะที่ฉันเข้าใจหลักการที่ฉันสับสนโดยความจริงที่ว่าค่าจะต้องมีอย่างน้อย 1 ส่วนเบี่ยงเบนจากค่าเฉลี่ย ทำไมต้องแม่นยำ 1
JohnK

ฉันไม่เห็นสิ่งที่ทำให้เกิดความสับสน ความแปรปรวนเป็นค่าเฉลี่ย หากคุณเพิ่มสิ่งที่มากกว่าค่าเฉลี่ย (นั่นคือมากกว่า 1 sd) จะเพิ่มขึ้น แต่ฉันไม่ใช่คนเดียวสำหรับการพิสูจน์อย่างเป็นทางการ
Peter Flom - Reinstate Monica

อาจมากกว่าค่าเฉลี่ย 0.2 ส่วนเบี่ยงเบนมาตรฐาน ทำไมมันไม่เพิ่มขึ้น?
JohnK

ไม่ไม่มากกว่าค่าเฉลี่ยของข้อมูลมากกว่าความแปรปรวนซึ่งเป็นค่าเฉลี่ยของระยะทางกำลังสอง
Peter Flom - Reinstate Monica

4
มันเป็นเรื่องที่สับสนเพราะการรวมค่าใหม่เปลี่ยนค่าเฉลี่ยดังนั้นการเปลี่ยนแปลงค่าที่เหลือทั้งหมด เป็นไปได้ว่าแม้เมื่อค่าใหม่อยู่ไกลจากค่าเฉลี่ยเดิมการมีส่วนร่วมใน SD นั้นสามารถชดเชยได้ด้วยการลดผลรวมของกำลังสองของเศษเหลือของค่าอื่น ๆ นี่เป็นหนึ่งในหลาย ๆ เหตุผลที่การพิสูจน์อย่างเข้มงวดมีประโยชน์: ไม่เพียง แต่ให้ความปลอดภัยในความรู้ของตน แต่ยังให้ข้อมูลเชิงลึก (และแม้แต่ข้อมูลใหม่) ด้วย ตัวอย่างเช่นหลักฐานจะแสดงว่าคุณต้องเพิ่มค่าใหม่ที่เกินกว่าหนึ่ง SD จากค่าเฉลี่ยอย่างเคร่งครัดเพื่อเพิ่ม SD
whuber

2

ฉันจะให้คุณเริ่มต้นกับพีชคณิต แต่จะไม่ทำอย่างนั้น ขั้นแรกให้สร้างมาตรฐานข้อมูลของคุณโดยการลบค่าเฉลี่ยและหารด้วยค่าเบี่ยงเบนมาตรฐาน:โปรดทราบว่าถ้าอยู่ในค่าเบี่ยงเบนมาตรฐานหนึ่งค่าเฉลี่ยของคือระหว่าง -1 ถึง 1 Z จะเป็น 1 ถ้าอยู่ห่างจากค่าเฉลี่ยเพียงหนึ่ง sd จากนั้นดูที่สมการของคุณสำหรับค่าเบี่ยงเบนมาตรฐาน:เกิดอะไรขึ้นกับถ้าอยู่ระหว่าง -1 และ 1? xZxσ=

Z=xμσ.
xZx σZN
σ=i=1NZi2N1
σZN

จำนวนที่มีค่าสัมบูรณ์น้อยกว่า 1 เมื่อกำลังสองมันจะน้อยกว่า 1 ใน abs ราคา. แต่สิ่งที่ฉันไม่เข้าใจก็คือแม้ว่า Z_N จะอยู่ในหมวดหมู่นั้นเรากำลังเพิ่มค่าบวกให้กับσดังนั้นมันจะไม่เพิ่มขึ้นใช่ไหม
JohnK

ใช่คุณกำลังเพิ่มค่าเป็นบวก แต่มันจะเล็กกว่าค่าเบี่ยงเบนเฉลี่ยของคุณจากค่าเฉลี่ยและลดซิกม่า บางทีมันอาจจะทำให้ความรู้สึกที่จะต้องพิจารณาค่าเป็น1} ZN+1
wcampbell

1
1) อย่าลืมเมื่อคุณเพิ่มค่าที่คุณจะยังเพิ่มขึ้นโดย 1 2) คุณจะไม่ได้รับการเพิ่มมูลค่าที่คุณจะเพิ่มไป 2 σ Σ Z 2 ฉันNσZi2
jbowman

สิ่งที่ฉันพยายามจะแสดงออก!
wcampbell

มันไม่ง่ายอย่างนั้นในคำตอบนี้คุณได้คำนวณ SD ราวกับว่าค่าใหม่นั้นเป็นส่วนหนึ่งของชุดข้อมูลแล้ว แต่นั้นจะต้องได้มาตรฐานด้วยความเคารพต่อ SD และค่าเฉลี่ยของค่าแรกเท่านั้นไม่ใช่ทั้งหมด N - 1ZiN1
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.