ดังนั้นเมื่อฉันคิดว่าปกติแล้วข้อผิดพลาดจะถูกกระจายในการถดถอยเชิงเส้นมันหมายความว่าอะไรสำหรับตัวแปรตอบสนอง ?
ดังนั้นเมื่อฉันคิดว่าปกติแล้วข้อผิดพลาดจะถูกกระจายในการถดถอยเชิงเส้นมันหมายความว่าอะไรสำหรับตัวแปรตอบสนอง ?
คำตอบ:
บางทีฉันอาจจะปิด แต่ฉันคิดว่าเราควรจะสงสัยเกี่ยวกับซึ่งเป็นวิธีที่ฉันอ่าน OP ในกรณีที่ง่ายที่สุดของการถดถอยเชิงเส้นหากแบบจำลองของคุณคือดังนั้นองค์ประกอบสุ่มเพียงอย่างเดียวในแบบจำลองของคุณคือคำผิดพลาด เป็นเช่นนั้นกำหนดกระจายตัวอย่างของปีหากแล้ว2I) สิ่งที่ @Aniko พูดจริง ๆ แล้วก็คือ (เล็กน้อยเกินX, \ beta ) อย่างไรก็ตาม ดังนั้นเนื่องจากคำถามนี้คลุมเครือเล็กน้อยy = X β + ϵ y ϵ ∼ N ( 0 , σ 2 I ) y | X , β ∼ N ( X β , σ 2 I ) f ( y ) X , β
คำตอบสั้น ๆ คือคุณไม่สามารถสรุปอะไรก็ได้เกี่ยวกับการกระจายตัวของเพราะมันขึ้นอยู่กับการกระจายตัวของและความแข็งแรงและรูปร่างของความสัมพันธ์ อย่างเป็นทางการแล้วจะมีการแจกแจง "ส่วนผสมของบรรทัดฐาน" ซึ่งในทางปฏิบัติอาจเป็นอะไรก็ได้x y
ต่อไปนี้เป็นสองตัวอย่างสุดขีดที่จะอธิบายสิ่งนี้:
ในความเป็นจริงตั้งแต่การจัดจำหน่ายทุกคนสามารถทำได้ใกล้เคียงโดยพลการได้ดีกับส่วนผสมของภาวะปกติจริงๆคุณสามารถได้รับการกระจายใด ๆ สำหรับปี
เราคิดค้นคำผิดพลาดโดยกำหนดรูปแบบที่สมมติขึ้นบนข้อมูลจริง การกระจายของข้อผิดพลาดไม่มีผลต่อการกระจายของการตอบสนอง
เรามักจะสันนิษฐานว่าข้อผิดพลาดนั้นได้รับการกระจายตามปกติและดังนั้นจึงพยายามที่จะสร้างแบบจำลองดังกล่าวซึ่งโดยทั่วไปแล้วเราจะแจกแจงค่าส่วนที่เหลือ นี้อาจเป็นเรื่องยากสำหรับการกระจายของบางปีในกรณีเหล่านี้ฉันคิดว่าคุณสามารถพูดได้ว่าการกระจายคำตอบมีผลต่อคำผิดพลาด
ถ้าคุณเขียนออกมาตอบสนองเป็น ที่ไหนเมตรเป็น "รูปแบบ" (การคาดการณ์สำหรับปี ) และEคือ "ข้อผิดพลาด" แล้วนี้สามารถจัดอีกครั้งเพื่อระบุปี - ม. =อี ดังนั้นการกำหนดการแจกแจงสำหรับข้อผิดพลาดจึงเป็นสิ่งเดียวกับการระบุวิธีที่โมเดลของคุณไม่สมบูรณ์ อีกวิธีคือการบ่งบอกถึงขอบเขตที่คุณไม่รู้ว่าทำไมการตอบสนองที่สังเกตได้คือคุณค่าที่มันเป็นจริงไม่ใช่แบบจำลองที่ทำนายไว้ หากคุณรู้ว่าแบบจำลองของคุณสมบูรณ์แบบคุณจะต้องแจกแจงความน่าจะเป็นกับข้อผิดพลาดทั้งหมด การกำหนดN (
ในแง่หนึ่งการกระจายข้อผิดพลาดนั้นเชื่อมโยงกับตัวแบบมากกว่าการตอบสนอง สิ่งนี้สามารถเห็นได้จากการไม่สามารถระบุตัวตนของสมการข้างต้นได้หากไม่ทราบทั้งและeจากนั้นเพิ่มเวกเตอร์ใดก็ได้ลงในmและลบออกจากeนำไปสู่ค่าเดียวกันของy , y = m + e = ( m + b ) + ( e - b ) = m ′ + e ′. การมอบหมายการแจกแจงความผิดพลาดและสมการของโมเดลนั้นโดยทั่วไปบอกว่าเวกเตอร์ใดที่มีความน่าเชื่อถือมากกว่าคนอื่น