การตีความทางเรขาคณิตของการถดถอยกำลังสองน้อยที่สุดให้มุมมองที่จำเป็น
ส่วนใหญ่ของสิ่งที่เราจำเป็นต้องรู้สามารถเห็นได้ในกรณีของสอง regressors x1 และ x2 ด้วยการตอบสนอง Y. สัมประสิทธิ์มาตรฐานหรือ "เบต้า" เกิดขึ้นเมื่อทั้งสามเวกเตอร์มีมาตรฐานความยาวที่พบบ่อย (ซึ่งเราอาจต้องใช้เวลาที่จะเป็นความสามัคคี) ดังนั้น,x1 และ x2 เป็นเวกเตอร์หน่วยในระนาบ E2- พวกเขาอยู่ในวงกลมหน่วย - และ y เป็นเวกเตอร์หน่วยในปริภูมิแบบยุคลิดแบบสามมิติ E3มีเครื่องบินลำนั้น ค่าติดตั้งy^ เป็นมุมฉาก (ตั้งฉาก) การฉายของ y ไปยัง E2. เพราะR2 ความยาวกำลังสองของ y^เราไม่ต้องการแม้แต่จะมองเห็นทั้งสามมิติ: ข้อมูลทั้งหมดที่เราต้องการสามารถวาดลงในระนาบนั้นได้
รีจิสเตอร์แบบมุมฉาก
สถานการณ์ที่ดีที่สุดคือเมื่อรีจีสเตอร์เป็นฉากฉากในรูปแรก
ในภาพนี้และส่วนที่เหลือฉันจะวาดดิสก์ยูนิตเป็นสีขาวและ regressors อย่างต่อเนื่องเป็นลูกศรสีดำ x1จะชี้ไปทางขวาเสมอ ลูกศรสีแดงหนาแสดงถึงองค์ประกอบของy^ ใน x1 และ x2 เส้นทาง: นั่นคือ β1x1 และ β2x2. ความยาวของy^ คือรัศมีของวงกลมสีเทาที่อยู่ - แต่จำไว้ R2เป็นตารางของความยาวที่
พีทาโกรัสทฤษฎีบทอ้าง
R2=|y^|2=|β1x1|2+|β2x2|2=β21(1)+β22(1)=β21+β22.
เนื่องจากทฤษฎีบทพีทาโกรัสมีอยู่ในมิติใด ๆ การใช้เหตุผลนี้ทำให้จำนวนผู้ลงทะเบียนทุกคนยอมให้ผลลัพธ์แรกของเรา:
เมื่อ regressors เป็นมุมฉาก R2 เท่ากับผลรวมของกำลังสองของ betas
ผลทันทีคือเมื่อมีเพียงหนึ่ง regressor - univariate ถดถอย -R2 คือกำลังสองของความชันมาตรฐาน
ความสัมพันธ์
regressors ที่มีความสัมพันธ์เชิงลบจะพบกันที่มุมที่มากกว่ามุมฉาก
เห็นได้ชัดในภาพนี้ว่าผลรวมของกำลังสองของเบต้านั้นมีค่ามากกว่า R2. สิ่งนี้สามารถพิสูจน์ได้เกี่ยวกับพีชคณิตโดยใช้กฎของโคไซน์หรือโดยการทำงานกับเมทริกซ์ของสมการปกติ
โดยการทำให้สองตัวตั้งค่าเกือบขนานกันเราสามารถจัดตำแหน่ง y^ ใกล้แหล่งกำเนิด (สำหรับ R2 ใกล้ 0) ในขณะที่ยังคงมีองค์ประกอบขนาดใหญ่ใน x1 และ x2ทิศทาง. ดังนั้นจึงไม่มีการ จำกัด ขนาดที่เล็กR2 อาจจะ.
เรามารำลึกถึงผลลัพธ์ที่เห็นได้ชัดนี้สิ่งที่เกิดขึ้นทั่วไปครั้งที่สองของเรา:
เมื่อ regressors สัมพันธ์กัน R2 อาจเล็กกว่าผลรวมของกำลังสองของพล
อย่างไรก็ตามนี่ไม่ใช่ความสัมพันธ์ที่เป็นสากลตามที่แสดงให้เห็นต่อไป
ตอนนี้ R2เกินกว่าผลรวมของกำลังสองของเบต้าอย่างเคร่งครัด โดยการวาดสอง regressors ชิดกันและรักษาy^ ระหว่างพวกเขาเราอาจทำให้ betas เข้าใกล้ทั้งคู่ 1/2แม้เมื่อ R2 อยู่ใกล้กับ 1. การวิเคราะห์เพิ่มเติมอาจต้องใช้พีชคณิต: ฉันทำด้านล่าง
ฉันปล่อยให้จินตนาการของคุณสร้างตัวอย่างที่คล้ายกันกับ regressors ที่มีความสัมพันธ์เชิงบวกซึ่งจะพบกันที่มุมแหลม
โปรดสังเกตว่าข้อสรุปเหล่านี้ไม่สมบูรณ์: มีข้อ จำกัด เกี่ยวกับจำนวนที่น้อยลง R2อาจเปรียบเทียบกับผลรวมของกำลังสองของ betas โดยเฉพาะอย่างยิ่งโดยการตรวจสอบความเป็นไปได้อย่างรอบคอบคุณอาจสรุป (สำหรับการถดถอยด้วยสองถดถอย) ว่า
เมื่อ regressors มีความสัมพันธ์เชิงบวกและ betas มีสัญญาณทั่วไปหรือเมื่อ regressors สัมพันธ์เชิงลบและ betas มีอาการต่างกัน R2 อย่างน้อยต้องใหญ่เท่ากับผลรวมของสี่เหลี่ยมจัตุรัส
ผลลัพธ์เกี่ยวกับพีชคณิต
โดยทั่วไปให้ regressors เป็น (เวกเตอร์คอลัมน์) x1,x2,…,xp และการตอบสนองเป็น y. การทำให้เป็นมาตรฐานหมายถึง (a) แต่ละอันตั้งฉากกับเวกเตอร์(1,1,…,1)′ และ (b) มีความยาวหน่วย:
|xi|2=|y|2=1.
รวบรวมเวกเตอร์คอลัมน์ xi เป็น n×p มดลูก X. กฎของการคูณเมทริกซ์บ่งบอกว่า
Σ=X′X
เป็นเมทริกซ์สหสัมพันธ์ของ xi. Betas ได้รับจากสมการปกติ
β=(X′X)−1X′y=Σ−1(X′y).
ยิ่งไปกว่านั้นตามความหมายพอดีคือ
y^=Xβ=X(Σ−1X′y).
ความยาวกำลังสองของมันให้ R2 ตามคำนิยาม:
R2=|y^|2=y^′y^=(Xβ)′(Xβ)=β′(X′X)β=β′Σβ.
การวิเคราะห์ทางเรขาคณิตแนะนำให้เรามองหาความไม่เท่าเทียมที่เกี่ยวข้อง R2 และผลรวมของกำลังสองของ betas
∑i=1pβ2i=β′β.
L2 บรรทัดฐานของเมทริกซ์ใด ๆ A ได้มาจากผลรวมของกำลังสองของสัมประสิทธิ์ (โดยทั่วไปถือว่าเมทริกซ์เป็นเวกเตอร์ของ p2 ส่วนประกอบในปริภูมิแบบยุคลิด)
|A|22=∑i,ja2ij=tr(A′A)=tr(AA′).
ความไม่เท่าเทียมกันของ Cauchy-Schwarz
R2=tr(R2)=tr(β′Σβ)=tr(Σββ′)≤|Σ|2|ββ′|2=|Σ|2β′β.
เนื่องจากสัมประสิทธิ์สหสัมพันธ์กำลังสองต้องไม่เกิน 1 และมีเพียง p2 ของพวกเขาใน p×p มดลูก Σ, |Σ|2 ต้องไม่เกิน 1×p2−−−−−√=p. ดังนั้น
R2≤pβ′β.
ความไม่เท่าเทียมเกิดขึ้นได้เช่นเมื่อทุกสิ่ง xi มีความสัมพันธ์เชิงบวกอย่างสมบูรณ์
มีขีด จำกัด สูงสุดว่าขนาดใหญ่เพียงใด R2อาจจะ. ค่าเฉลี่ยต่อการถดถอยR2/pต้องไม่เกินผลรวมของกำลังสองของสัมประสิทธิ์มาตรฐาน
สรุปผลการวิจัย
โดยทั่วไปแล้วเราจะสรุปอะไรได้บ้าง? เห็นได้ชัดว่าข้อมูลเกี่ยวกับโครงสร้างความสัมพันธ์ของ regressors เช่นเดียวกับสัญญาณของ betasสามารถใช้เพื่อผูกค่าที่เป็นไปได้ของR2หรือแม้กระทั่งการคำนวณอย่างแน่นอน ไม่มีข้อมูลที่สมบูรณ์สามารถพูดได้น้อยกว่าความจริงที่เห็นได้ชัดว่าเมื่อรีจีสเตอร์มีความเป็นอิสระในเชิงเส้นตรงเบต้าที่ไม่ใช่ศูนย์เดียวก็หมายถึงy^ ไม่ใช่ศูนย์แสดงให้เห็น R2 ไม่ใช่ศูนย์
สิ่งหนึ่งที่เราสามารถสรุปได้อย่างแน่นอนจากผลลัพธ์ในคำถามคือข้อมูลมีความสัมพันธ์กัน: เนื่องจากผลรวมของกำลังสองของ betas เท่ากับ 1.1301เกินค่าสูงสุดที่เป็นไปได้ของ R2 (คือ 1) ต้องมีความสัมพันธ์กันบ้าง
อีกสิ่งหนึ่งก็คือเนื่องจากเบต้าที่ใหญ่ที่สุด (ขนาด) คือ −0.83ซึ่งเป็นสี่เหลี่ยมจัตุรัส 0.69- ไกลเกินกว่ารายงาน R2 ของ 0.20- เราอาจสรุปได้ว่าผู้ลงทะเบียนบางรายต้องมีความสัมพันธ์เชิงลบ (ในความเป็นจริง,VO2max มีความสัมพันธ์เชิงลบอย่างมากกับอายุน้ำหนักและไขมันในตัวอย่างใด ๆ ที่ครอบคลุมค่านิยมที่หลากหลายในช่วงหลัง)
หากมีเพียงสอง regressors เราสามารถอนุมานมากขึ้นเกี่ยวกับ R2 จากความรู้เกี่ยวกับสหสัมพันธ์ถดถอยสูงและการตรวจสอบของ betas เพราะสิ่งนี้จะช่วยให้เราสามารถวาดร่างที่ถูกต้องของวิธีการ x1, x2และ y^จะต้องตั้งอยู่ น่าเสียดายที่ผู้ลงทะเบียนเพิ่มเติมในปัญหาหกตัวแปรนี้มีความซับซ้อนมาก ในการวิเคราะห์ตัวแปรสองตัวใด ๆ เราต้อง "take out" หรือ "control for" อีกสี่ regressors ("covariates") ในการทำเช่นนั้นเราย่อทั้งหมดx1, x2และ yตามจำนวนที่ไม่รู้จัก (ขึ้นอยู่กับว่าทั้งสามเกี่ยวข้องกับ covariates อย่างไร) ทำให้เราไม่รู้อะไรเลยเกี่ยวกับขนาดที่แท้จริงของเวกเตอร์ที่เราทำงานด้วย