ฉันจะบอกว่าจำนวนของแต่ละบุคคล (เช่นที่เหลือ) ซึ่งเป็นผลจากการสุ่มดึงจากการกระจายความน่าจะเป็นเป็นมูลค่าตระหนักถึงไม่ได้เป็นตัวแปรสุ่ม ฉันจะบอกว่าชุดของจำนวนเหลือซึ่งคำนวณจากข้อมูลของคุณและแบบจำลองของคุณเหมาะสมกับการใช้เป็นชุดของค่าที่รับรู้ ชุดของตัวเลขนี้อาจจะหลวมแนวความคิดเป็นอิสระดึงออกมาจากการกระจายพื้นฐาน ~2) (อย่างไรก็ตามน่าเสียดายที่มีความซับซ้อนเพิ่มเติมหลายประการที่นี่ตัวอย่างเช่นคุณไม่มียังไม่มีข้อความe = y -Y^εยังไม่มีข้อความ( μ ,σ2)ยังไม่มีข้อความ ข้อมูลที่เป็นอิสระเพราะส่วนที่เหลือ อีต้องเป็นไปตามเงื่อนไขสองข้อ: Σอีผม=0และ Σxผมอีผม= 0.)
ทีนี้เมื่อได้ตัวเลขบางชุดไม่ว่าจะเป็นส่วนที่เหลือหรืออะไรก็ตามมันเป็นความจริงแน่นอนว่าพวกเขามีความแปรปรวน ∑ (อีผม-อี¯)2/ Nแต่นี่ไม่น่าสนใจ สิ่งที่เราใส่ใจคือการสามารถพูดอะไรบางอย่างเกี่ยวกับกระบวนการสร้างข้อมูล (ตัวอย่างเช่นเพื่อประเมินความแปรปรวนของการกระจายตัวของประชากร) เมื่อใช้สูตรก่อนหน้านี้เราสามารถประมาณค่าได้โดยแทนที่ยังไม่มีข้อความด้วยองศาอิสระที่เหลือ แต่นี่อาจไม่ใช่การประมาณที่ดี นี่คือหัวข้อที่สามารถซับซ้อนได้อย่างรวดเร็วมาก แต่เหตุผลสองข้อที่อาจเป็นไปได้คือheteroscedasticity (กล่าวคือความแปรปรวนของประชากรแตกต่างกันในระดับต่าง ๆ ของx) และการปรากฏตัวของค่าผิดปกติ (เช่นที่เหลือที่ได้รับมาจากประชากรที่แตกต่างกันอย่างสิ้นเชิง) ในทางปฏิบัติคุณแทบจะไม่สามารถประมาณความแปรปรวนของประชากรที่ดึงค่าผิดปกติ แต่อย่างไรก็ตามในทางทฤษฎีมันมีความแปรปรวน ฉันสงสัยว่ามีบางอย่างตามบรรทัดเหล่านี้คือสิ่งที่ผู้เขียนมีอยู่ในใจอย่างไรก็ตามฉันควรทราบว่าฉันยังไม่ได้อ่านหนังสือเล่มนั้น
อัปเดต: เมื่ออ่านคำถามอีกครั้งฉันสงสัยว่าคำพูดอาจอ้างถึงวิธีการที่x- ค่าของจุดมีผลต่อเส้นการถดถอยที่ติดตั้งและทำให้ค่าของส่วนที่เหลือที่เกี่ยวข้องกับจุดนั้น ความคิดที่สำคัญที่จะเข้าใจนี่คือการใช้ประโยชน์จาก ผมอภิปรายในหัวข้อเหล่านี้ในคำตอบของฉันที่นี่: ล่าม plot.lm ()