เป็นที่ทราบหรือไม่ว่าในความแปรปรวนของมาตรฐานในขณะที่อยู่ในการทำให้เป็นนักเรียนมันไม่เป็นที่รู้จัก ขอขอบคุณ.
เป็นที่ทราบหรือไม่ว่าในความแปรปรวนของมาตรฐานในขณะที่อยู่ในการทำให้เป็นนักเรียนมันไม่เป็นที่รู้จัก ขอขอบคุณ.
คำตอบ:
สรุปสั้น ๆ กำหนดรูปแบบที่คือ , β = ( X ' X ) - 1 X ' YและY = X β = X ( X ' X ) - 1 X ' Y = H yโดยที่H = X ( X ′ Xคือ "hat matrix" เหลือใช้เป็น
สารตกค้างกึ่งแบบกึ่งกลางถูกกำหนดเป็น แต่เนื่องจากความแปรปรวนของที่เหลือขึ้นอยู่กับทั้งสองσ2และXแปรปรวนประมาณของพวกเขาคือ: V(อีฉัน)=MSE(1-เอชฉันฉัน) ที่ชั่วโมงฉันฉันเป็นฉันTH องค์ประกอบในแนวทแยง ของหมวกเมทริกซ์
ค่ามาตรฐานที่เหลือเรียกอีกอย่างหนึ่งว่าค่าส่วนที่เหลือภายในนักเรียนคือ:
อย่างไรก็ตามเดียวและM S Eจะไม่อิสระดังนั้นr ฉันไม่สามารถมีเสื้อกระจาย ขั้นตอนแล้วจะลบผมสังเกต, th พอดีกับฟังก์ชั่นการถดถอยเพื่อที่เหลือn - 1สังเกตและได้รับใหม่Y 's ซึ่งสามารถแสดงโดยปีฉัน( ฉัน ) ความแตกต่าง: d ฉัน = Y ฉัน- Yฉัน( ฉัน) จะเรียกว่า
ดู Kutner et al. โมเดลเชิงสถิติเชิงเส้นประยุกต์บทที่ 10
แก้ไข: ฉันต้องบอกว่าคำตอบโดย rpierce นั้นสมบูรณ์แบบ ฉันคิดว่า OP เป็นเรื่องเกี่ยวกับค่ามาตรฐานและค่าส่วนของนักเรียน(และหารด้วยค่าเบี่ยงเบนมาตรฐานประชากรเพื่อให้ได้ค่ามาตรฐานที่เหลือดูแปลกสำหรับฉันแน่นอน) แต่ฉันคิดผิด ฉันหวังว่าคำตอบของฉันสามารถช่วยใครบางคนแม้ว่า OT
อย่างไรก็ตามปรากฏว่ามีความแตกต่างทางคำศัพท์ข้ามฟิลด์ (โปรดดูความคิดเห็นในคำตอบนี้) ดังนั้นเราควรดำเนินการด้วยความระมัดระวังในการสร้างความแตกต่างเหล่านี้ ยิ่งไปกว่านั้นคะแนนของนักเรียนมักจะถูกเรียกเช่นนี้และมักจะเห็นค่า 'ที่ทำให้เป็นนักเรียน' ในบริบทของการถดถอย @Sergio ให้รายละเอียดเกี่ยวกับประเภทของเศษซากที่ถูกลบไปแล้วที่ได้รับการคัดนักเรียน
ฉันสายเกินไปที่จะตอบคำถามนี้ !! แต่ไม่สามารถหาคำตอบได้ในภาษาที่ง่ายมากดังนั้นพยายามที่จะตอบคำถามนี้อย่างถ่อมใจ
ทำไมเราถึงต้องสร้างมาตรฐาน? ลองนึกภาพคุณมีสองแบบจำลองหนึ่งทำนายความบ้าคลั่งจากระยะเวลาที่ใช้ในการศึกษาสถิติในขณะที่สถิติทำนายอื่น ๆ (บ้า) ด้วยจำนวนเวลาที่สถิติ
มันจะยากที่จะเข้าใจสารตกค้างที่อยู่ในหน่วยต่าง ๆ ดังนั้นเราจึงสร้างมาตรฐานให้พวกเขา (ทฤษฎีที่คล้ายกันกับ Z-score)
ค่ามาตรฐานที่เหลืออยู่: - เมื่อค่าส่วนที่เหลือถูกหารด้วยค่าประมาณของค่าเบี่ยงเบนมาตรฐาน โดยทั่วไปหากค่าสัมบูรณ์> 3 แล้วมันเป็นสาเหตุของความกังวล
เราใช้สิ่งนี้เพื่อตรวจสอบค่าผิดปกติในรูปแบบ
Studentized Residual: เราใช้สิ่งนี้เพื่อศึกษาความมั่นคงของแบบจำลอง
กระบวนการนั้นง่าย เราลบกรณีทดสอบออกจากแบบจำลองและค้นหาค่าที่คาดการณ์ใหม่ ความแตกต่างระหว่างค่าใหม่และค่าดั้งเดิมที่สังเกตได้สามารถเป็นมาตรฐานโดยการหารข้อผิดพลาดมาตรฐาน ค่านี้เป็น Studentized Residual
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการค้นพบสถิตยศาสตร์โดยใช้ R - http://www.statisticshell.com/html/dsur.html
Wikipedia มีภาพรวมที่ดีที่https://en.wikipedia.org/wiki/Normalization_(statistics) :
คะแนนมาตรฐาน
: การทำให้ค่าส่วนที่เหลือเป็นปกติเมื่อไม่ทราบพารามิเตอร์ประชากร (โดยประมาณ)