ความคล้ายคลึงกันนั้นเป็นเพียงผิวเผิน
"อคติ - แปรปรวนการค้าขาย" สามารถตีความได้ว่าทฤษฎีบทพีทาโกรัสนำไปใช้กับสองเวกเตอร์ตั้งฉากแบบยูคลิด: ความยาวของหนึ่งคือค่าเบี่ยงเบนมาตรฐานและความยาวของคนอื่นคืออคติ ความยาวของด้านตรงข้ามมุมฉากคือความคลาดเคลื่อนกำลังสองเฉลี่ยของรูท
ความสัมพันธ์ขั้นพื้นฐาน
เป็นจุดของการเดินทางให้พิจารณานี้คำนวณเปิดเผยที่ถูกต้องสำหรับการใด ๆ ตัวแปรสุ่มกับช่วงเวลาที่สองแน่นอนและจำนวนจริงใด ๆ เนื่องจากวินาทีที่สองนั้นมีค่า จำกัดมีค่าเฉลี่ยที่ จำกัดซึ่งดังนั้นXaXμ=E(X)E(X−μ)=0
E((X−a)2)=E((X−μ+μ−a)2)=E((X−μ)2)+2E(X−μ)(μ−a)+(μ−a)2=Var(X)+(μ−a)2.(1)
นี้แสดงให้เห็นถึงวิธีการเบี่ยงเบนยกกำลังสองเฉลี่ยระหว่างและการใด ๆ "พื้นฐาน" ค่าแตกต่างกันกับ: มันเป็นฟังก์ชันกำลังสองของกับต่ำสุดที่ที่เบี่ยงเบนยกกำลังสองเฉลี่ยความแปรปรวนของXXaaaμX
การเชื่อมต่อกับตัวประมาณค่าและอคติ
ตัวประมาณเป็นตัวแปรสุ่มเพราะ (ตามคำนิยาม) มันเป็นฟังก์ชั่น (วัดได้) ของตัวแปรสุ่ม ปล่อยให้มันเล่นบทบาทของในก่อนหน้าและปล่อยให้การประมาณ (สิ่งที่ควรจะประมาณ) เป็นเรามีθ^Xθ^θ
MSE(θ^)=E((θ^−θ)2)=Var(θ^)+(E(θ^)−θ)2.
ลองกลับไปที่ตอนนี้เราได้เห็นแล้วว่าคำแถลงเกี่ยวกับอคติ + ความแปรปรวนสำหรับตัวประมาณนั้นเป็นกรณีของอย่างไร คำถามค้นหา "การเปรียบเทียบทางคณิตศาสตร์กับวัตถุทางคณิตศาสตร์" เราสามารถทำมากกว่านั้นได้โดยการแสดงให้เห็นว่าตัวแปรสุ่มที่รวมกันเป็นรูปสี่เหลี่ยมจัตุรัสสามารถสร้างขึ้นในพื้นที่ยูคลิด(1)(1)
พื้นหลังทางคณิตศาสตร์
ในความหมายทั่วไปมากตัวแปรสุ่มเป็น (ที่วัด) ฟังก์ชันค่าจริงในพื้นที่น่าจะเป็น{P}) ชุดของฟังก์ชั่นดังกล่าวเป็นรูปสี่เหลี่ยมจัตุรัสซึ่งรวมกันได้ซึ่งมักจะเขียน (ด้วยโครงสร้างความน่าจะเป็นที่เข้าใจ) เกือบเป็นพื้นที่ฮิลแบร์ต ที่จะทำให้มันเป็นหนึ่งเราจะต้อง conflate สองตัวแปรสุ่มและซึ่งไม่ได้จริงๆแตกต่างกันในแง่ของการรวมนั่นคือเราบอกว่าและมีความเทียบเท่าเมื่อใดก็ตามที่(Ω,S,P)L2(Ω)XYXY
E(|X−Y|2)=∫Ω|X(ω)−Y(ω)|2dP(ω)=0.
มันตรงไปตรงมาเพื่อตรวจสอบว่านี่คือความสมดุลจริง: ที่สำคัญที่สุดเมื่อเทียบเท่ากับและเทียบเท่ากับแล้วจำเป็นต้องจะเทียบเท่ากับZดังนั้นเราจึงอาจแบ่งตัวแปรสุ่มแบบสี่เหลี่ยมจัตุรัสทั้งหมดที่รวมอยู่ในคลาสที่เท่ากัน ชั้นเรียนเหล่านี้ในรูปแบบชุดOmega) ยิ่งไปกว่านั้นสืบทอดโครงสร้างพื้นที่เวคเตอร์ของกำหนดโดยการเพิ่มจุดและค่าการคูณสเกลาร์แบบพอยต์ตามจุด บนพื้นที่เวคเตอร์นี้ฟังก์ชันXYYZXZL2(Ω)L2L2
X→(∫Ω|X(ω)|2dP(ω))1/2=E(|X|2)−−−−−−√
เป็นบรรทัดฐานมักจะเขียน||บรรทัดฐานนี้ทำให้กลายเป็นช่องว่างของฮิลแบร์ต ลองนึกถึงช่องว่างของฮิลแบร์ตในฐานะ "ปริภูมิแบบยุคลิดแบบไม่สิ้นสุด" ขอบเขตมิติ จำกัด ใด ๆสืบทอดบรรทัดฐานจากและด้วยบรรทัดฐานนี้คือปริภูมิแบบยุคลิด: เราสามารถทำเรขาคณิตแบบยุคลิดได้||X||2L2(Ω)HV⊂HHV
สุดท้ายเราจำเป็นต้องใช้ความเป็นจริงที่เป็นพิเศษไปที่ช่องว่างความน่าจะเป็น (มากกว่าพื้นที่วัดทั่วไป): เพราะคือความน่าจะเป็นก็เป็นที่สิ้นสุด (โดย ) ดังนั้นฟังก์ชั่นอย่างต่อเนื่อง (สำหรับการใด ๆ จำนวนจริงคงที่ ) เป็นตัวแปรสุ่มสแควร์บูรณาการที่มีบรรทัดฐาน จำกัดP1ω→aa
การตีความทางเรขาคณิต
พิจารณาใด ๆ ตาราง integrable ตัวแปรสุ่ม , คิดว่าเป็นตัวแทนของชั้นสมมูลของมันในOmega) มันมีความหมายซึ่ง (เป็นหนึ่งสามารถตรวจสอบ) ขึ้นอยู่บนชั้นสมมูลของXปล่อยเป็นคลาสของตัวแปรสุ่มแบบคงที่XL2(Ω)μ=E(X)X1:ω→1
Xและสร้างสเปซแบบยุคลิดที่มีมิติที่มากที่สุด2ในพื้นที่ย่อยนี้คือความยาวกำลังสองของและคือ ความยาวยกกำลังสองของตัวแปรสุ่มคงที่ไป มันเป็นพื้นฐานที่ตั้งฉากกับ{1} (หนึ่งคำนิยามของคือมันเป็นหมายเลขที่ไม่ซ้ำกันในกรณีนี้) ความสัมพันธ์อาจถูกเขียน1V⊂L2(Ω)2||X||22=E(X2)X||a1||22=a2ω→aX−μ11μ(1)
||X−a1||22=||X−μ1||22+||(a−μ)1||22.
แน่นอนมันเป็นอย่างแม่นยำพีทาโกรัสทฤษฎีบทในหลักรูปแบบเดียวกันที่รู้จักกันในปี 2500 ที่ผ่านมา วัตถุคือด้านตรงข้ามมุมฉากของสามเหลี่ยมมุมฉากกับขาและ{1}
X−a1=(X−μ1)−(a−μ)1
X−μ1(a−μ)1
หากคุณต้องการความคล้ายคลึงทางคณิตศาสตร์คุณอาจใช้สิ่งใดก็ได้ที่สามารถแสดงออกในรูปสามเหลี่ยมมุมฉากของสามเหลี่ยมมุมฉากในปริภูมิแบบยุคลิด ด้านตรงข้ามมุมฉากจะแสดงถึง "ข้อผิดพลาด" และขาจะแสดงถึงอคติและความเบี่ยงเบนจากค่าเฉลี่ย