ขออภัยหากมีการตอบที่อื่นฉันไม่สามารถหาได้
ฉันสงสัยว่าทำไมเราถึงใช้สแควร์รูทโดยเฉพาะความแปรปรวนเพื่อสร้างส่วนเบี่ยงเบนมาตรฐาน มันเกี่ยวกับการรากที่สองที่สร้างมูลค่าที่มีประโยชน์คืออะไร?
ขออภัยหากมีการตอบที่อื่นฉันไม่สามารถหาได้
ฉันสงสัยว่าทำไมเราถึงใช้สแควร์รูทโดยเฉพาะความแปรปรวนเพื่อสร้างส่วนเบี่ยงเบนมาตรฐาน มันเกี่ยวกับการรากที่สองที่สร้างมูลค่าที่มีประโยชน์คืออะไร?
คำตอบ:
ในแง่หนึ่งนี่เป็นคำถามที่ไม่สำคัญ แต่ในอีกแง่หนึ่งมันค่อนข้างลึกจริงๆ!
เป็นคนอื่นได้กล่าวถึงการใช้รากที่สองหมายถึงมีหน่วยเดียวกับX
การรากที่ช่วยให้คุณมีความเป็นเนื้อเดียวกันแน่นอน aka scalability แน่นอน สำหรับการใด ๆ เกลาและตัวแปรสุ่มเรา:
สม่ำเสมอของแอบโซลูทเป็นคุณสมบัติที่จำเป็นของบรรทัดฐาน ค่าเบี่ยงเบนมาตรฐานสามารถตีความได้ว่าเป็นบรรทัดฐาน (บนพื้นที่ว่างของเวกเตอร์ที่มีค่าศูนย์ตัวแปรตัวแปรสุ่ม) ในทำนองเดียวกันที่เป็นบรรทัดฐานมาตรฐาน Euclidian ในสามมิติ ช่องว่าง ค่าเบี่ยงเบนมาตรฐานคือการวัดระยะทางระหว่างตัวแปรสุ่มและค่าเฉลี่ย
ในปริภูมิเวกเตอร์แบบมิติมาตรฐาน Euclidian norm หรือที่เรียกว่า normนั้นถูกกำหนดเป็น:
ในวงกว้างยิ่งขึ้น -normใช้รูทเพื่อรับค่าสัมบูรณ์ ความสม่ำเสมอ:\
หากคุณมีน้ำหนักผลรวมน้ำหนักก็เป็นบรรทัดฐานที่ถูกต้องเช่นกัน นอกจากนี้ยังเป็นค่าเบี่ยงเบนมาตรฐานหากแสดงถึงความน่าจะเป็นและ
ในมิติที่ไม่มีที่สิ้นสุดของ Hilbert Space เราอาจนิยามบรรทัดฐานเช่นเดียวกัน:
ถ้าเป็นค่าศูนย์สุ่มตัวแปรและคือการวัดความน่าจะเป็นค่าเบี่ยงเบนมาตรฐานคืออะไร? มันเป็นเรื่องเดียวกัน:omega)}
การรากที่ทำให้วิธีการที่น่าพอใจส่วนเบี่ยงเบนมาตรฐานความเป็นเนื้อเดียวกันแน่นอนเป็นคุณสมบัติที่จำเป็นของบรรทัดฐาน
บนพื้นที่ของตัวแปรสุ่มเป็นผลิตภัณฑ์ภายในและ‖ X ‖ 2 = √ Stdev[X]=‖X-E[X]‖2E[X]Xมาตรฐานที่เกิดจากผลิตภัณฑ์ภายในนั้น ดังนั้นค่าเบี่ยงเบนมาตรฐานจึงเป็นบรรทัดฐานของตัวแปรสุ่มแบบสุ่ม:
มันเป็นการวัดระยะทางจากค่าเฉลี่ยเพื่อX
(จุดทางเทคนิค: ในขณะที่เป็นบรรทัดฐานค่าเบี่ยงเบนมาตรฐานไม่ใช่กฎเกณฑ์ทั่วไปของตัวแปรสุ่มโดยทั่วไปเนื่องจากข้อกำหนดสำหรับปริภูมิเวกเตอร์เชิงบรรทัดคือถ้าหากเท่านั้นค่าเบี่ยงเบนมาตรฐานของ 0 doesn ' t หมายถึงตัวแปรสุ่มคือองค์ประกอบศูนย์)
ความแปรปรวนของ ถูกกำหนดเป็นดังนั้นจึงเป็นความคาดหวังของความแตกต่างกำลังสองระหว่าง X กับค่าที่คาดหวัง
หากคือเวลาเป็นวินาทีเป็นวินาที แต่อยู่ในและอีกครั้งในไม่กี่วินาที
คำตอบง่ายๆคือหน่วยอยู่ในระดับเดียวกับค่าเฉลี่ย ตัวอย่าง: ฉันประเมินค่าเฉลี่ยสำหรับนักเรียนมัธยมที่ 160 ซม. โดยมีค่าเบี่ยงเบนมาตรฐาน (SD) 20 ซม. มันเป็นอย่างสังหรณ์ใจเรื่องง่ายที่จะได้รับความรู้สึกของการเปลี่ยนแปลงที่มี SD กว่าความแปรปรวนของ 400cm ^ 2 ที่
กล่าวง่ายๆคือค่าเบี่ยงเบนมาตรฐานได้รับการออกแบบมาเพื่อให้เรามีจำนวนบวกที่บอกอะไรบางอย่างเกี่ยวกับการแพร่กระจายของข้อมูลของเราเกี่ยวกับมันหมายถึง
หากเราต้องบวกระยะทางของคะแนนทั้งหมดจากค่าเฉลี่ยแล้วคะแนนในทิศทางบวกและลบจะรวมกันในลักษณะที่มีแนวโน้มที่จะย้อนกลับไปสู่ค่าเฉลี่ยและเราจะสูญเสียข้อมูลเกี่ยวกับการแพร่กระจาย นี่คือเหตุผลที่เราวัดความแปรปรวนก่อนเพื่อให้ระยะทางทั้งหมดถูกเก็บไว้เป็นปริมาณบวกผ่านการยกกำลังสองและพวกเขาจะไม่ยกเลิกกัน ในท้ายที่สุดเราต้องการค่าบวกที่แสดงถึงหน่วยที่เราเริ่มต้นด้วย - สิ่งนี้ได้รับการแสดงความคิดเห็นไว้ด้านบนแล้วดังนั้นเราจึงนำสแควร์รูทที่เป็นบวก
มันเป็นความโง่เขลาทางประวัติศาสตร์ที่เราดำเนินต่อไปเนื่องจากความเกียจคร้านทางปัญญา พวกเขาเลือกที่จะยกกำลังสองความแตกต่างจากค่าเฉลี่ยเพื่อกำจัดเครื่องหมายลบ จากนั้นพวกเขาก็เอาสแควร์รูทเพื่อนำมาให้สเกลที่คล้ายกับค่าเฉลี่ย
บางคนควรสร้างสถิติใหม่ความแปรปรวนของการคำนวณและ SD โดยใช้โมดูลัสหรือค่าสัมบูรณ์ของการเบี่ยงเบนจากค่าเฉลี่ย นี่จะกำจัดกำลังสองทั้งหมดแล้วจึงหาสแควร์รูท