พิจารณาการถดถอยง่าย (ปกติไม่ได้สันนิษฐาน):ที่คือมีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน\ประมาณการสแควร์น้อยที่สุดของและไม่เกี่ยวข้องกันหรือไม่?
พิจารณาการถดถอยง่าย (ปกติไม่ได้สันนิษฐาน):ที่คือมีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน\ประมาณการสแควร์น้อยที่สุดของและไม่เกี่ยวข้องกันหรือไม่?
คำตอบ:
นี่คือการพิจารณาที่สำคัญในการออกแบบการทดลองที่จะสามารถเป็นที่น่าพอใจจะไม่มี (หรือน้อยมาก) ความสัมพันธ์ระหว่างประมาณการและข ขาดดังกล่าวของความสัมพันธ์สามารถทำได้โดยการควบคุมค่าของx_i
ในการวิเคราะห์ผลกระทบของในการประมาณค่า (ซึ่งเป็นเวกเตอร์แถวของความยาว ) จะถูกรวมเข้าในแนวตั้งเป็นเมทริกซ์ซึ่งเป็นเมทริกซ์การออกแบบซึ่งมีแถวมากเท่าที่มีข้อมูลและ ) สองคอลัมน์ สอดคล้องกันจะถูกรวมเป็นเวกเตอร์ยาวหนึ่งคอลัมน์ ( ) ในข้อตกลงเหล่านี้การเขียนสำหรับค่าสัมประสิทธิ์การประกอบโมเดลคือ
กำลัง (ปกติ) สันนิษฐานว่าจะเป็นตัวแปรสุ่มอิสระที่มีความแปรปรวนเป็นค่าคงที่สำหรับบางอย่างไม่ทราบ0 ขึ้นอยู่กับการสำรวจจะถูกนำไปเป็นหนึ่งในสำนึกของเวกเตอร์ตัวแปรสุ่มY
โซลูชัน OLS คือ
สมมติว่าเมทริกซ์ผกผันนี้มีอยู่ ดังนั้นการใช้คุณสมบัติพื้นฐานของการคูณเมทริกซ์และความแปรปรวนร่วม
เมทริกซ์มีเพียงสองแถวและคอลัมน์ที่สองที่สอดคล้องกับพารามิเตอร์แบบB) ความสัมพันธ์ของกับเป็นสัดส่วนกับองค์ประกอบปิดเส้นทแยงมุมของซึ่งตามกฎของ Cramerเป็นสัดส่วนกับผลิตภัณฑ์จุดของทั้งสองคอลัมน์ของXเนื่องจากหนึ่งในคอลัมน์คือทั้งหมดวินาทีซึ่งผลคูณดอทกับคอลัมน์อื่น ๆ (ประกอบด้วย ) คือผลรวมของพวกเขาเราจึงพบ
และไม่เกี่ยวข้องถ้าเพียงผลรวม (หรือเท่ากับค่าเฉลี่ย) ของเป็นศูนย์
สภาพตั้งฉากนี้มักจะทำได้โดยrecentering (โดยการลบของพวกเขาเฉลี่ยจากกัน) แม้ว่านี่จะไม่เปลี่ยนแปลงประมาณลาดก็ไม่เปลี่ยนประมาณตัดหมวก ไม่ว่าจะมีความสำคัญหรือไม่นั้นขึ้นอยู่กับแอพพลิเคชั่น
การวิเคราะห์นี้นำไปใช้กับการถดถอยหลายครั้ง: เมทริกซ์การออกแบบจะมีคอลัมน์สำหรับตัวแปรอิสระ (คอลัมน์เพิ่มเติมประกอบด้วยวินาที) และจะเป็นเวกเตอร์ที่มีความยาวแต่ไม่เช่นนั้นทุกอย่างจะผ่านเหมือนเดิม
ในภาษาทั่วไปสองคอลัมน์ของเรียกว่าorthogonalเมื่อผลคูณของจุดเป็นศูนย์ เมื่อคอลัมน์หนึ่งของ (พูดคอลัมน์ ) เป็น orthogonal สำหรับคอลัมน์อื่น ๆ ทั้งหมดมันเป็นความจริงเกี่ยวกับพีชคณิตที่แสดงให้เห็นได้อย่างง่ายดายว่ารายการนอกแนวทแยงมุมทั้งหมดในแถวและคอลัมน์ของเป็นศูนย์ (นั่นคือองค์ประกอบของและสำหรับทั้งหมดเป็นศูนย์) ดังนั้น
ค่าสัมประสิทธิ์การถดถอยสองค่าประมาณและไม่ได้รับการเมื่อใดก็ตาม (หรือทั้งสองอย่าง) ของคอลัมน์ที่สอดคล้องกันของเมทริกซ์การออกแบบนั้นมีมุมฉากกับคอลัมน์อื่นทั้งหมด
การออกแบบการทดลองมาตรฐานจำนวนมากประกอบด้วยการเลือกค่าของตัวแปรอิสระเพื่อสร้างคอลัมน์มุมฉากร่วมกัน สิ่งนี้ "แยก" การประมาณผลลัพธ์ที่เกิดจากการรับประกัน - ก่อนที่จะมีการรวบรวมข้อมูลใด ๆ ! - ว่าการประมาณการนั้นจะไม่เกี่ยวข้องกัน (เมื่อคำตอบมีการแจกแจงแบบปกติสิ่งนี้แสดงถึงการประมาณการจะเป็นอิสระซึ่งทำให้การตีความของพวกเขาง่ายขึ้นมาก)