สัญชาตญาณทั่วไปคือคุณสามารถเชื่อมโยงช่วงเวลาเหล่านี้โดยใช้ทฤษฎีบทพีทาโกรัส (PT) ในพื้นที่เวกเตอร์ที่กำหนดไว้อย่างเหมาะสมโดยแสดงว่าช่วงเวลาสองช่วงนั้นตั้งฉากและฉากที่สามคือด้านตรงข้ามมุมฉาก พีชคณิตเท่านั้นที่จำเป็นคือการแสดงให้เห็นว่าทั้งสองขาเป็นมุมฉากแน่นอน
เพื่อวัตถุประสงค์ดังต่อไปนี้ฉันจะถือว่าคุณหมายถึงตัวอย่างและความแปรปรวนสำหรับจุดประสงค์ในการคำนวณมากกว่าช่วงเวลาสำหรับการแจกแจงแบบเต็ม นั่นคือ:
E[X]E[X2]Var(X)===1n∑xi,1n∑x2i,1n∑(xi−E[X])2,mean,first central sample momentsecond sample moment (non−central)variance,second central sample moment
(ที่ผลรวมทั้งหมดมีมากกว่ารายการ)n
สำหรับการอ้างอิงหลักฐานเบื้องต้นของเป็นเพียงสัญลักษณ์ผลัก:
Var(X)=E[X2]−E[X]2
Var(X)=====1n∑(xi−E[X])21n∑(x2i−2E[X]xi+E[X]2)1n∑x2i−2nE[X]∑xi+1n∑E[X]2E[X2]−2E[X]2+1nnE[X]2E[X2]−E[X]2
มีความหมายเล็ก ๆ น้อย ๆ ที่นี่แค่จัดการพีชคณิตเบื้องต้น บางคนอาจสังเกตว่าเป็นค่าคงที่ในการรวม แต่นั่นเป็นเรื่องเกี่ยวกับมันE[X]
ตอนนี้ในปริภูมิเวกเตอร์ / การตีความเชิงเรขาคณิต / ปรีชาสิ่งที่เราจะแสดงคือสมการที่จัดใหม่เล็กน้อยซึ่งสอดคล้องกับ PT นั่นคือ
Var(X)+E[X]2=E[X2]
เพื่อพิจารณาตัวอย่างของรายการเป็นพาหะใน n และให้สร้างสองเวกเตอร์และ1}XnRnE[X]1X−E[X]1
เวกเตอร์มีค่าเฉลี่ยของตัวอย่างเป็นพิกัดทุกค่าE[X]1
เวกเตอร์เป็นx_n-EX−E[X]1⟨x1−E[X],…,xn−E[X]⟩
เวกเตอร์สองตัวนี้ตั้งฉากเนื่องจากผลคูณดอทของเวกเตอร์สองตัวกลายเป็น 0:
E[X]1⋅(X−E[X]1)=====∑E[X](xi−E[X])∑(E[X]xi−E[X]2)E[X]∑xi−∑E[X]2nE[X]E[X]−nE[X]20
ดังนั้นเวกเตอร์สองตัวนั้นตั้งฉากซึ่งหมายความว่าพวกมันคือสองขาของสามเหลี่ยมมุมฉาก
จากนั้นโดย PT (ซึ่งถือใน ) ผลรวมของกำลังสองของความยาวของสองขาเท่ากับสี่เหลี่ยมของด้านตรงข้ามมุมฉากRn
ด้วยพีชคณิตแบบเดียวกับที่ใช้ในการพิสูจน์พีชคณิตน่าเบื่อที่ด้านบนเราพบว่าเราได้รับเป็นจตุรัสของเวกเตอร์ด้านตรงข้ามมุมฉาก:E[X2]
(X−E[X])2+E[X]2=...=E[X2]โดยการยกกำลังสองเป็นผลคูณของจุด (และเป็นจริงและเป็น(X)E[x]1(X−E[X])2Var(X)
ส่วนที่น่าสนใจเกี่ยวกับความหมายนี้คือการแปลงจากกลุ่มตัวอย่างที่รายการจากการกระจาย univariate ไปยังพื้นที่เวกเตอร์ของมิติ สิ่งนี้คล้ายกับตัวอย่าง bivariate ที่ถูกตีความว่าเป็นสองตัวอย่างจริง ๆ ในตัวแปรnnnn
ในแง่หนึ่งนั่นก็เพียงพอสามเหลี่ยมมุมฉากจากเวกเตอร์และจะปรากฏออกมาเป็นด้านตรงข้ามมุมฉาก เราให้การตีความ (เวกเตอร์) สำหรับค่าเหล่านี้และแสดงให้เห็นว่าสอดคล้องกัน มันเจ๋งพอ แต่ไม่ได้ให้ความสว่างทั้งทางสถิติหรือเชิงเรขาคณิต มันจะไม่พูดจริงๆว่าทำไมและจะเป็นเครื่องจักรแนวความคิดพิเศษมากมายในท้ายที่สุดส่วนใหญ่ทำซ้ำหลักฐานเชิงพีชคณิตอย่างหมดจดที่เรามีอยู่แล้วในตอนเริ่มต้นE[X2]
อีกส่วนหนึ่งที่น่าสนใจก็คือว่าค่าเฉลี่ยและความแปรปรวนแม้ว่าพวกเขาสังหรณ์ใจวัดศูนย์และการแพร่กระจายในอีกมิติหนึ่งเป็นฉากในมิติ นั่นหมายความว่าอะไรพวกเขาตั้งฉากกัน? ฉันไม่รู้! มีช่วงเวลาอื่นที่เป็นมุมฉากหรือไม่? มีระบบความสัมพันธ์ที่ใหญ่กว่าซึ่งรวมถึงความตั้งฉากนี้ไหม? ช่วงเวลากลางกับช่วงเวลาที่ไม่ใช่กลาง? ฉันไม่รู้!n