วิธีการทำความเข้าใจมาตรฐานที่เหลืออยู่ในการวิเคราะห์การถดถอย


9

ตามการวิเคราะห์การถดถอยโดยตัวอย่างที่เหลือคือความแตกต่างระหว่างการตอบสนองและมูลค่าที่คาดการณ์จากนั้นจะกล่าวว่าทุกที่เหลือมีความแปรปรวนที่แตกต่างกันดังนั้นเราจึงต้องพิจารณาที่เหลือมาตรฐาน

แต่ความแปรปรวนมีไว้สำหรับกลุ่มของค่าวิธีการที่ค่าเดียวอาจมีความแปรปรวนได้อย่างไร


2
มันจะช่วยในการอ้างอิงตำราเรียนโดยตรงหรือ (ถ้ามีออนไลน์) เพื่อให้ลิงก์ไปยังมัน หลายคนอาจหลงทางได้แม้กระทั่งคำเดียวที่ไม่เป็นระเบียบหรือไม่อยู่ในบริบท (ตัวอย่างเช่นส่วนที่เหลือมักถูกนิยามว่าเป็นความแตกต่างระหว่างการทำนายและการตอบสนองไม่ใช่วิธีอื่น ๆ )
whuber

ตัวแปรสุ่มเดี่ยวมีความแปรปรวน ส่วนที่เหลือเป็นตัวแปรสุ่ม - เป็นฟังก์ชั่นของข้อมูล ดังนั้นค่าคงค้างเดียว (มาตรฐานหรือไม่) จะมีความแปรปรวน
แขกที่เข้าพัก

#whuber ตำราเรียนคือ "Regression.Analysis.by.Example", หน้า, 89 มันพูดถึงประเภทของสารตกค้าง ส่วนที่เหลือสามัญคือการตอบสนองการทำนาย @guest "ตัวแปรสุ่มเดี่ยวมีความแปรปรวน" นี่คือสิ่งที่ฉันไม่เข้าใจตัวแปรเป็นคุณสมบัติสำหรับตัวอย่างใช่ไหม ทำไมค่าเดี่ยวในตัวอย่าง (เช่นส่วนที่เหลือ) มีความแปรปรวน
ccshao

หนังสือเล่มนี้มีผู้แต่งหรือไม่? ซึ่งมักจะทำให้ค้นหาได้ง่ายขึ้น ฉันคิดว่าคุณได้รับความแปรปรวนตัวอย่างและความแปรปรวนของประชากรสับสน ยังไม่ทราบสิ่งตกค้างก่อนดำเนินการทดสอบ การตอบสนองเป็นแบบสุ่มและเป็นสิ่งตกค้างเนื่องจากเป็นฟังก์ชันของการตอบสนอง เมื่อเราพูดถึงความแปรปรวนของส่วนที่เหลือเราพูดถึงความแปรปรวนของตัวแปรสุ่มพื้นฐาน
MånsT

ขออภัยในความไม่สะดวกผู้เขียนคือ SAMPRIT CHATTEFUEE และ ALI S. HADI, การวิเคราะห์การถดถอยตามตัวอย่างฉบับที่สี่
ccshao

คำตอบ:


9

ฉันจะบอกว่าจำนวนของแต่ละบุคคล (เช่นที่เหลือ) ซึ่งเป็นผลจากการสุ่มดึงจากการกระจายความน่าจะเป็นเป็นมูลค่าตระหนักถึงไม่ได้เป็นตัวแปรสุ่ม ฉันจะบอกว่าชุดของจำนวนเหลือซึ่งคำนวณจากข้อมูลของคุณและแบบจำลองของคุณเหมาะสมกับการใช้เป็นชุดของค่าที่รับรู้ ชุดของตัวเลขนี้อาจจะหลวมแนวความคิดเป็นอิสระดึงออกมาจากการกระจายพื้นฐาน ~2) (อย่างไรก็ตามน่าเสียดายที่มีความซับซ้อนเพิ่มเติมหลายประการที่นี่ตัวอย่างเช่นคุณไม่มียังไม่มีข้อความอี=Y-Y^εยังไม่มีข้อความ(μ,σ2)ยังไม่มีข้อความ ข้อมูลที่เป็นอิสระเพราะส่วนที่เหลือ อีต้องเป็นไปตามเงื่อนไขสองข้อ: Σอีผม=0และ Σxผมอีผม=0.)

ทีนี้เมื่อได้ตัวเลขบางชุดไม่ว่าจะเป็นส่วนที่เหลือหรืออะไรก็ตามมันเป็นความจริงแน่นอนว่าพวกเขามีความแปรปรวน Σ(อีผม-อี¯)2/ยังไม่มีข้อความแต่นี่ไม่น่าสนใจ สิ่งที่เราใส่ใจคือการสามารถพูดอะไรบางอย่างเกี่ยวกับกระบวนการสร้างข้อมูล (ตัวอย่างเช่นเพื่อประเมินความแปรปรวนของการกระจายตัวของประชากร) เมื่อใช้สูตรก่อนหน้านี้เราสามารถประมาณค่าได้โดยแทนที่ยังไม่มีข้อความด้วยองศาอิสระที่เหลือ แต่นี่อาจไม่ใช่การประมาณที่ดี นี่คือหัวข้อที่สามารถซับซ้อนได้อย่างรวดเร็วมาก แต่เหตุผลสองข้อที่อาจเป็นไปได้คือheteroscedasticity (กล่าวคือความแปรปรวนของประชากรแตกต่างกันในระดับต่าง ๆ ของx) และการปรากฏตัวของค่าผิดปกติ (เช่นที่เหลือที่ได้รับมาจากประชากรที่แตกต่างกันอย่างสิ้นเชิง) ในทางปฏิบัติคุณแทบจะไม่สามารถประมาณความแปรปรวนของประชากรที่ดึงค่าผิดปกติ แต่อย่างไรก็ตามในทางทฤษฎีมันมีความแปรปรวน ฉันสงสัยว่ามีบางอย่างตามบรรทัดเหล่านี้คือสิ่งที่ผู้เขียนมีอยู่ในใจอย่างไรก็ตามฉันควรทราบว่าฉันยังไม่ได้อ่านหนังสือเล่มนั้น

อัปเดต: เมื่ออ่านคำถามอีกครั้งฉันสงสัยว่าคำพูดอาจอ้างถึงวิธีการที่x- ค่าของจุดมีผลต่อเส้นการถดถอยที่ติดตั้งและทำให้ค่าของส่วนที่เหลือที่เกี่ยวข้องกับจุดนั้น ความคิดที่สำคัญที่จะเข้าใจนี่คือการใช้ประโยชน์จาก ผมอภิปรายในหัวข้อเหล่านี้ในคำตอบของฉันที่นี่: ล่าม plot.lm ()


1
ขอบคุณ! เลเวอเรจคือสิ่งที่ฉันไม่เข้าใจมาก่อน ไม่มีผลการถดถอยน้อยหรือน้อยสำหรับข้อมูลที่มี x ใกล้กับ avg (x) จึงมีความแปรปรวนสูง
ccshao
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.