ทำไมเราถึงต้องใช้สแควร์รูทของความแปรปรวนเพื่อสร้างความเบี่ยงเบนมาตรฐาน


26

ขออภัยหากมีการตอบที่อื่นฉันไม่สามารถหาได้

ฉันสงสัยว่าทำไมเราถึงใช้สแควร์รูทโดยเฉพาะความแปรปรวนเพื่อสร้างส่วนเบี่ยงเบนมาตรฐาน มันเกี่ยวกับการรากที่สองที่สร้างมูลค่าที่มีประโยชน์คืออะไร?


เกี่ยวข้องอย่างใกล้ชิด: stats.stackexchange.com/questions/35123/…
Sycorax พูดว่า Reinstate Monica

2
ลองคิดถึงค่าเบี่ยงเบนมาตรฐานว่าเป็นเวกเตอร์แบบยุคลิดแล้วค่าความแปรปรวนเป็นสี่เหลี่ยมจัตุรัส คำจำกัดความของความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานจะมีคุณสมบัติการวิเคราะห์ที่มีประโยชน์
theideasmith

คำตอบ:


44

ในแง่หนึ่งนี่เป็นคำถามที่ไม่สำคัญ แต่ในอีกแง่หนึ่งมันค่อนข้างลึกจริงๆ!

  • เป็นคนอื่นได้กล่าวถึงการใช้รากที่สองหมายถึงมีหน่วยเดียวกับXStdev(X)X

  • การรากที่ช่วยให้คุณมีความเป็นเนื้อเดียวกันแน่นอน aka scalability แน่นอน สำหรับการใด ๆ เกลาและตัวแปรสุ่มเรา: สม่ำเสมอของแอบโซลูทเป็นคุณสมบัติที่จำเป็นของบรรทัดฐาน ค่าเบี่ยงเบนมาตรฐานสามารถตีความได้ว่าเป็นบรรทัดฐาน (บนพื้นที่ว่างของเวกเตอร์ที่มีค่าศูนย์ตัวแปรตัวแปรสุ่ม) ในทำนองเดียวกันที่เป็นบรรทัดฐานมาตรฐาน Euclidian ในสามมิติ ช่องว่าง ค่าเบี่ยงเบนมาตรฐานคือการวัดระยะทางระหว่างตัวแปรสุ่มและค่าเฉลี่ยαX

    Stdev[αX]=|α|Stdev[X]
    x2+y2+z2

ค่าเบี่ยงเบนมาตรฐานและบรรทัดฐานL2

กรณีมิติ จำกัด :

ในปริภูมิเวกเตอร์แบบมิติมาตรฐาน Euclidian norm หรือที่เรียกว่า normนั้นถูกกำหนดเป็น:nL2

x2=ixi2

ในวงกว้างยิ่งขึ้น -normใช้รูทเพื่อรับค่าสัมบูรณ์ ความสม่ำเสมอ:\p xp=(i|xi|p)1ppαxp=(i|αxi|p)1p=|α|(i|xi|p)1p=|α|xp

หากคุณมีน้ำหนักผลรวมน้ำหนักก็เป็นบรรทัดฐานที่ถูกต้องเช่นกัน นอกจากนี้ยังเป็นค่าเบี่ยงเบนมาตรฐานหากแสดงถึงความน่าจะเป็นและqiixi2qiqiE[x]ixiqi=0

กรณีมิติที่ไม่มีที่สิ้นสุด:

ในมิติที่ไม่มีที่สิ้นสุดของ Hilbert Space เราอาจนิยามบรรทัดฐานเช่นเดียวกัน:L2

X2=ωX(ω)2dP(ω)

ถ้าเป็นค่าศูนย์สุ่มตัวแปรและคือการวัดความน่าจะเป็นค่าเบี่ยงเบนมาตรฐานคืออะไร? มันเป็นเรื่องเดียวกัน:omega)}XPωX(ω)2dP(ω)

สรุป:

การรากที่ทำให้วิธีการที่น่าพอใจส่วนเบี่ยงเบนมาตรฐานความเป็นเนื้อเดียวกันแน่นอนเป็นคุณสมบัติที่จำเป็นของบรรทัดฐาน

บนพื้นที่ของตัวแปรสุ่มเป็นผลิตภัณฑ์ภายในและX,Y=E[XY]X 2 = X2=E[X2] Stdev[X]=X-E[X]2E[X]Xมาตรฐานที่เกิดจากผลิตภัณฑ์ภายในนั้น ดังนั้นค่าเบี่ยงเบนมาตรฐานจึงเป็นบรรทัดฐานของตัวแปรสุ่มแบบสุ่ม: มันเป็นการวัดระยะทางจากค่าเฉลี่ยเพื่อX

Stdev[X]=XE[X]2
E[X]X

(จุดทางเทคนิค: ในขณะที่เป็นบรรทัดฐานค่าเบี่ยงเบนมาตรฐานE[X2]E[(XE[X])2]ไม่ใช่กฎเกณฑ์ทั่วไปของตัวแปรสุ่มโดยทั่วไปเนื่องจากข้อกำหนดสำหรับปริภูมิเวกเตอร์เชิงบรรทัดคือถ้าหากเท่านั้นค่าเบี่ยงเบนมาตรฐานของ 0 doesn ' t หมายถึงตัวแปรสุ่มคือองค์ประกอบศูนย์)x=0x=0


1
คำตอบนี้เป็นหัวใจสำคัญของปัญหาทำให้ได้ข้อมูลมากกว่าที่เป็นที่ยอมรับในปัจจุบัน
00prometheus

26

ความแปรปรวนของ Xถูกกำหนดเป็นดังนั้นจึงเป็นความคาดหวังของความแตกต่างกำลังสองระหว่าง X กับค่าที่คาดหวังV(X)=E(XE(X))2

หากคือเวลาเป็นวินาทีเป็นวินาที แต่อยู่ในและอีกครั้งในไม่กี่วินาทีXXE(X)V(X)seconds2V(X)


ฉันเห็นไหมว่ามันเป็นเพียงการยกเลิกการเปลี่ยนแปลงขนาดที่เกิดจากการยกกำลังสองความแตกต่างในการคำนวณความแปรปรวน?
Dave

11
ขวา - แต่เปลี่ยนในมิติไม่ใช่ในสเกล
Jean-François Corbett

แต่มันไม่เหมือนมีคำเดียว: มีจำนวนมากและแต่ละครั้งเมื่ออยู่ในอำนาจ 2 นำมามากกว่าหรือน้อยกว่าเงื่อนไขอื่น ๆ แต่เมื่อเราหาสแควร์รูทเราจะละเลยความแตกต่างนั้นใช่ไหม เราจะไม่ได้ตัวเศษเริ่มต้น, รวมความแตกต่างทั้งหมดในแบบนั้น จะดีกว่าไหมถ้าใช้รากที่สองของคำแต่ละคำ?
parsecer

ดูเหมือนว่าคุณกำลังคิดเกี่ยวกับการประมาณการVอยู่บนพื้นฐานของกลุ่มตัวอย่าง ในกรณีที่ว่าถ้าคุณทำเช่นนั้นความแตกต่างจะเป็นศูนย์ออก: Σ n ฉัน= 1 ( x ฉัน - ˉ x ) = Σ n ฉัน= 1 x ฉัน - Σ n ฉัน= 1 x ฉัน = 0 V^i=1n(xix¯)=i=1nxii=1nxi=0
HStamper

@EricMittman ยกเว้นว่า ไม่ซึ่งในกรณีนี้คุณจะได้รับข้อผิดพลาดแน่นอนค่าเฉลี่ย a2=|a|a
Dougal

6

คำตอบง่ายๆคือหน่วยอยู่ในระดับเดียวกับค่าเฉลี่ย ตัวอย่าง: ฉันประเมินค่าเฉลี่ยสำหรับนักเรียนมัธยมที่ 160 ซม. โดยมีค่าเบี่ยงเบนมาตรฐาน (SD) 20 ซม. มันเป็นอย่างสังหรณ์ใจเรื่องง่ายที่จะได้รับความรู้สึกของการเปลี่ยนแปลงที่มี SD กว่าความแปรปรวนของ 400cm ^ 2 ที่


0

กล่าวง่ายๆคือค่าเบี่ยงเบนมาตรฐานได้รับการออกแบบมาเพื่อให้เรามีจำนวนบวกที่บอกอะไรบางอย่างเกี่ยวกับการแพร่กระจายของข้อมูลของเราเกี่ยวกับมันหมายถึง

หากเราต้องบวกระยะทางของคะแนนทั้งหมดจากค่าเฉลี่ยแล้วคะแนนในทิศทางบวกและลบจะรวมกันในลักษณะที่มีแนวโน้มที่จะย้อนกลับไปสู่ค่าเฉลี่ยและเราจะสูญเสียข้อมูลเกี่ยวกับการแพร่กระจาย นี่คือเหตุผลที่เราวัดความแปรปรวนก่อนเพื่อให้ระยะทางทั้งหมดถูกเก็บไว้เป็นปริมาณบวกผ่านการยกกำลังสองและพวกเขาจะไม่ยกเลิกกัน ในท้ายที่สุดเราต้องการค่าบวกที่แสดงถึงหน่วยที่เราเริ่มต้นด้วย - สิ่งนี้ได้รับการแสดงความคิดเห็นไว้ด้านบนแล้วดังนั้นเราจึงนำสแควร์รูทที่เป็นบวก


-3

มันเป็นความโง่เขลาทางประวัติศาสตร์ที่เราดำเนินต่อไปเนื่องจากความเกียจคร้านทางปัญญา พวกเขาเลือกที่จะยกกำลังสองความแตกต่างจากค่าเฉลี่ยเพื่อกำจัดเครื่องหมายลบ จากนั้นพวกเขาก็เอาสแควร์รูทเพื่อนำมาให้สเกลที่คล้ายกับค่าเฉลี่ย

บางคนควรสร้างสถิติใหม่ความแปรปรวนของการคำนวณและ SD โดยใช้โมดูลัสหรือค่าสัมบูรณ์ของการเบี่ยงเบนจากค่าเฉลี่ย นี่จะกำจัดกำลังสองทั้งหมดแล้วจึงหาสแควร์รูท


1
เรามีสิ่งนั้นอยู่แล้วในรูปแบบของค่าเบี่ยงเบนสัมบูรณ์ (หรือค่ามัธยฐาน) ค่าเบี่ยงเบนมาตรฐาน L1 และสิ่งอื่น อย่างไรก็ตามประโยชน์ที่สำคัญของวิธีการแบบดั้งเดิมคือการที่แตกต่างจากค่าแน่นอนมันเป็นอนุพันธ์ซึ่งช่วยให้คุณสามารถวิเคราะห์และลดสิ่งที่ขยาย
Matt Krause

1
คุณไม่ได้ให้เหตุผลที่สำคัญสำหรับท่าทางของคุณโปรดระบุอาร์กิวเมนต์ทางคณิตศาสตร์ที่ชัดเจน ผลรวมของค่าสัมบูรณ์จะแตกต่างอย่างมากกับสแควร์รูทของผลรวมของกำลังสอง หลังเน้นการมีส่วนร่วมของค่ามากซึ่งเป็นคุณสมบัติที่มีประโยชน์ นอกจากนี้ SSQ ยังเป็นศูนย์กลางของวิธีการวิเคราะห์กำลังสองน้อยที่สุด โปรดสละเวลาในการขยายปัญหาของ SD และเปรียบเทียบตัวเลือกอื่น ๆ เพื่อให้ผู้อ่านเข้าใจมุมมองของคุณ .
ReneBt

(-1) ทุกอย่างง่ายเกินไปที่จะอ่านวลีเช่น "ความโง่เขลาทางประวัติศาสตร์" และ "ความเกียจคร้านทางปัญญา" ว่าเป็นการอ้างอิงตนเอง
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.