ฉันสับสนเล็กน้อยกับคำตอบข้างต้นดังนั้นฉันจะให้อีกนัด ฉันคิดว่าคำถามไม่ได้เกี่ยวกับการถดถอยเชิงเส้น 'แบบดั้งเดิม' แต่เกี่ยวกับลักษณะของแหล่งข้อมูลนั้น ในส่วนการถดถอยแบบคลาสสิก:
อย่างไรก็ตามสมมติฐานเชิงเส้นโดยตัวมันเองไม่ได้วางโครงสร้างใด ๆ ไว้ในแบบจำลองของเรา
นั่นถูกต้องอย่างแน่นอน ดังที่คุณได้กล่าวไว้อาจฆ่าความสัมพันธ์เชิงเส้นและรวมสิ่งที่เป็นอิสระจากอย่างสมบูรณ์เพื่อที่เราจะไม่สามารถคำนวณแบบจำลองใด ๆ ได้เลยϵX
กรีนเป็นคนเลอะเทอะหรือเปล่า? จริง ๆ แล้วเขาควรจะเขียน:E(y|X)=Xβ
ฉันไม่ต้องการที่จะตอบคำถามแรก แต่ให้ฉันสรุปสมมติฐานที่คุณต้องการสำหรับการถดถอยเชิงเส้นปกติ:
ให้เราสมมติว่าคุณสังเกต (คุณจะได้รับ) จุดข้อมูลและสำหรับ n คุณต้องสมมติว่าข้อมูลคุณสังเกตมานั้นมาจากตัวแปรสุ่มแบบกระจายที่เหมือนกันที่เหมือนกัน...xi∈Rdyi∈Ri=1,...,n(xi,yi)(Xi,Yi)
มีอยู่คงที่ (เป็นอิสระจาก )เช่นนั้นสำหรับทั้งหมดและตัวแปรสุ่มเป็นเช่นนั้นiβ∈RdYi=βXi+ϵiiϵi
จะ IID เป็นอย่างดีและกระจายเป็น (ต้องเป็นอิสระของเช่นกัน)ϵiϵiN(0,σ)σi
สำหรับและตัวแปรมีความหนาแน่นทั่วไปเช่นตัวแปรสุ่มเดียวมีความหนาแน่นX=(X1,...,Xn)Y=(Y1,...,Yn)X,Y(X,Y)fX,Y
ตอนนี้คุณสามารถเรียกใช้เส้นทางและคำนวณได้ตามปกติ
fY|X(y|x)=fY,X(y,x)/fX(x)=(12πd−−−√)nexp(−∑ni=1(yi−βxi)22σ)
เพื่อให้โดย 'คู่' ปกติระหว่างการเรียนรู้เครื่อง (minimalization ของการทำงานผิดพลาด) และทฤษฎีความน่าจะเป็น (สูงสุดควรจะเป็น) คุณเพิ่มในซึ่งในความเป็นจริงจะช่วยให้คุณ สิ่งที่ "RMSE" ปกติβ−logfY|X(y|x)β
ตอนนี้ตามที่ระบุไว้: หากผู้เขียนหนังสือที่คุณกำลังอ้างถึงต้องการทำให้ประเด็นนี้ (ซึ่งคุณต้องทำถ้าคุณเคยต้องการที่จะคำนวณบรรทัดการถดถอย 'ที่ดีที่สุด' ในการตั้งค่าพื้นฐาน) ใช่แล้วเขาจะต้องทำให้สมมติฐานนี้เป็นเรื่องปกติของที่ไหนสักแห่งในหนังสือϵ
มีความเป็นไปได้ที่แตกต่างกันในขณะนี้:
เขาไม่ได้เขียนสมมติฐานนี้ลงในหนังสือ มันเป็นข้อผิดพลาดในหนังสือ
เขาเขียนมันลงในรูปแบบของคำพูด 'โกลบอล' เช่น 'เมื่อใดก็ตามที่ฉันเขียนดังนั้นจะเป็น iid กระจายตามปกติด้วยค่าเฉลี่ยศูนย์เว้นแต่จะระบุไว้เป็นอย่างอื่น' จากนั้น IMHO มันเป็นสไตล์ที่ไม่ดีเพราะมันทำให้เกิดความสับสนอย่างที่คุณรู้สึกตอนนี้ นั่นคือเหตุผลที่ฉันมักจะเขียนสมมติฐานในบางรูปแบบที่สั้นลงในทุกทฤษฎีบท เฉพาะ Building Block เท่านั้นที่สามารถดูได้อย่างหมดจดในสิทธิ์ของตนเองϵ+ϵϵ
- เขาเขียนมันลงไปอย่างใกล้ชิดในส่วนที่คุณอ้างและคุณ / เราก็ไม่ได้สังเกตเห็น (เช่นความเป็นไปได้ :-))
อย่างไรก็ตามในความหมายทางคณิตศาสตร์ที่เข้มงวดข้อผิดพลาดปกติก็เป็นสิ่งที่ยอมรับได้ (การกระจายที่มีเอนโทรปีสูงสุด [เมื่อความแปรปรวนได้รับการแก้ไข] ดังนั้นการสร้างแบบจำลองที่แข็งแกร่งที่สุด) ดังนั้นผู้เขียนบางคนมักจะข้ามสมมติฐานนี้ . อย่างเป็นทางการคุณพูดถูก: พวกเขาใช้คณิตศาสตร์ในทางที่ผิด เมื่อใดก็ตามที่พวกเขาต้องการสมการความหนาแน่นตามที่ระบุไว้ข้างต้นพวกเขาจำเป็นต้องรู้ค่อนข้างดีมิฉะนั้นคุณก็จะมีคุณสมบัติของมันลอยไปรอบ ๆ ในสมการที่สมเหตุสมผลทุกครั้งที่คุณพยายามจด . ϵfY|Xϵ