ส่วนที่เหลือดิบกับส่วนที่เหลือมาตรฐานเมื่อเทียบกับส่วนที่เหลือ studentized - สิ่งที่จะใช้เมื่อไหร่?


31

นี่ดูเหมือนคำถามที่คล้ายกันและไม่ได้รับคำตอบมากมาย

ละเว้นการทดสอบเช่น Cook's D และเพียงแค่ดูเศษเป็นกลุ่มฉันสนใจในวิธีที่คนอื่นใช้เศษเหลือใช้เมื่อประเมินความดีงามพอดี ฉันใช้ของเหลือใช้ดิบ:

  1. ใน QQ-plot เพื่อประเมินภาวะปกติ
  2. ในรูปแบบกระจายของเทียบกับส่วนที่เหลือสำหรับการตรวจลูกตาของ (a) hetereoscedasticity และ (b) autocorrelation ต่อเนื่องy

สำหรับพล็อตเมื่อเทียบกับที่เหลือเพื่อตรวจสอบค่าสำหรับปีที่ผิดปกติอาจเกิดขึ้นฉันชอบที่จะใช้เหลือ studentized เหตุผลในการตั้งค่าของฉันคือมันช่วยให้ดูได้ง่ายว่าค่าที่เหลือซึ่งค่าyนั้นเป็นตัวปัญหาหรือไม่แม้ว่าค่าส่วนที่เหลือมาตรฐานจะให้ผลลัพธ์ที่คล้ายกันมาก ทฤษฎีของฉันที่ใช้คือมันขึ้นอยู่กับมหาวิทยาลัยที่เราไปyyy

สิ่งนี้คล้ายกับวิธีที่คนอื่นใช้สารตกค้างหรือไม่ คนอื่น ๆ ใช้กราฟจำนวนนี้ร่วมกับสถิติสรุปหรือไม่


3
ส่วนที่เหลือของนักเรียนจะดีกว่าอย่างไม่ต้องสงสัยในการตรวจจับค่าผิดปกติและอาจจะดีขึ้นเล็กน้อยในการตรวจสอบความแตกต่าง สำหรับวัตถุประสงค์อื่น ๆ ฉันไม่ได้ใช้อะไรเลย
ttnphns

หากต้องการให้ความสนใจกับคำถามมิเชลหรือขอการเปลี่ยนแปลงสถานะ (เช่น CW) โปรดไปที่ลิงก์ "ตั้งค่าสถานะ" ใต้คำถาม นี่จะแจ้งผู้ดูแลทั้งหมดโดยอัตโนมัติ การฝังคำขอในคำถามความคิดเห็นหรือคำตอบนั้นเป็นเรื่องที่พลาดไม่ได้เพราะขึ้นอยู่กับความหวังว่าผู้ดำเนินรายการ (หรือผู้ใช้ระดับสูงอื่น ๆ ) จะอ่านได้ภายในเวลาอันสมควร!
whuber

@whuber อ่าฉันคิดว่าคงมีใครซักคนที่อ่านมันในที่สุด :) ขอบคุณสำหรับเคล็ดลับในการใช้ธง
มิเชล

1
สวัสดี @ttnphns ทำไมพวกเขาถึงดีกว่า โดยเฉพาะอย่างยิ่งทำไมนักเรียนถึงดีกว่ามาตรฐาน? (ฉันไม่เคยรู้จักคำตอบจริงๆที่นี่)
Peter Flom - Reinstate Monica

4
@ Peter, เหลือ Studentized จะน้อย "บิดเบือน" โดย OLS กระชับอัลโกและมีความใกล้ชิดกับความคิดทางทฤษฎีของ"ข้อผิดพลาด" พวกเขาสามารถเปรียบเทียบได้โดยตรงในภูมิภาคต่าง ๆ ของเส้นพอดีจากนั้นจะดีกว่าในการตัดสินใจถ้าจุดเป็นค่าเริ่มต้น
ttnphns

คำตอบ:


8

นี่ไม่ใช่คำตอบที่ชัดเจนในคำศัพท์ คำถามของคุณถามเกี่ยวกับสิ่งที่เหลืออยู่แบบสแตนด์อโลนและแบบเป็นนักเรียน อย่างไรก็ตามนี่ไม่ใช่คำศัพท์ที่นักสถิติส่วนใหญ่ใช้ แต่ฉันสังเกตว่าบันทึกย่อในชั้นเรียนของคุณระบุว่าเป็น

ดิบ:เหมือนกับที่คุณมี

มาตรฐาน:นี่คือส่วนที่เหลือดิบจริงหารด้วยค่าเบี่ยงเบนมาตรฐานจริงของส่วนที่เหลือ เนื่องจากค่าเบี่ยงเบนมาตรฐานที่แท้จริงไม่ค่อยเป็นที่รู้จักจึงไม่มีการใช้สารตกค้างที่เป็นมาตรฐาน

รับการศึกษาภายใน:เนื่องจากค่าเบี่ยงเบนมาตรฐานจริงของส่วนที่เหลือไม่เป็นที่รู้จักโดยทั่วไปค่าเบี่ยงเบนมาตรฐานโดยประมาณจะใช้แทน นี่คือสิ่งที่เหลืออยู่ระหว่างนักเรียนและมันคือสิ่งที่คุณเรียกว่าเป็นมาตรฐาน

Studentized ภายนอก:เหมือนกับนักเรียนที่เหลือภายในยกเว้นว่าการประเมินค่าเบี่ยงเบนมาตรฐานของส่วนที่เหลือจะคำนวณจากการถดถอยโดยไม่สังเกตจากคำถาม

เพียร์สัน:ส่วนที่เหลือดิบหารด้วยค่าเบี่ยงเบนมาตรฐานของตัวแปรตอบสนอง (ตัวแปร y) มากกว่าส่วนที่เหลือ คุณไม่มีรายการนี้

"ปล่อยหนึ่งออก":ไม่มีชื่ออย่างเป็นทางการ แต่มันเป็นเช่นเดียวกับบันทึกย่อของชั้นเรียน

standarized "ปล่อยหนึ่งออก":ยังไม่มีชื่ออย่างเป็นทางการ แต่นี่ไม่ใช่สิ่งที่บันทึกในชั้นเรียนเรียกว่า studentized

แหล่งที่มา:

  1. ลิงก์วิกิเดียวกันกับที่คุณมีเกี่ยวกับเศษเหลือของนักเรียน ("เศษเหลือของนักเรียนคือผลหารที่เกิดจากการหารเศษเหลือจากค่าเบี่ยงเบนมาตรฐาน")

  2. เอกสารประกอบสำหรับการคำนวณที่เหลือใน SAS


2
+1 แน่นอนว่านักสถิติบางคนใช้เงื่อนไขในคำถามของ OP (และมักจะไม่สอดคล้องกับผู้อื่นโดยใช้คำเดียวกัน) ฉันคิดว่าคำที่คุณใช้นั้นเป็นเรื่องธรรมดามากขึ้น แต่ฉันไม่แน่ใจว่าพื้นฐานที่เราสามารถคาดเดาได้ว่าการใช้ทั่วโลกของพวกเขาค่อนข้างมากในหมู่นักสถิติ - กระดาษเช่นไม่จำเป็นต้องช่วยเพราะนักสถิติเฉลี่ยจะไม่กระตือรือร้น การประกาศ คุณอาจจะถูก - แต่เราจะรู้ได้อย่างไร? [หากคุณบังเอิญแก้ไขอีกครั้งคุณอาจต้องการแทนที่ "
สแตนด์บาย

2

เรื่องแปลง

มีสิ่งต่าง ๆ มากมายเช่น overfitting แต่ overplotting ไม่สามารถทำอันตรายได้มากโดยเฉพาะในขั้นตอนการวินิจฉัย พล็อตความน่าจะเป็นแบบปกติที่เป็นมาตรฐานไม่สามารถทำอันตรายได้ถัดจาก QQ-plot ของคุณ ฉันคิดว่าการประเมินค่ากลางของการกระจาย

เรื่องเหลือใช้

ฉันเรียกใช้ทั้งเศษที่ได้มาตรฐานและเป็นนักเรียนในขั้นตอนการร่างและมักจะจบลงด้วยการเขียนรหัสที่ได้มาตรฐาน ฉันไม่ทราบว่าคนอื่นทำงานอะไรจริง ๆ เพราะการวินิจฉัยนั้นได้รับการเข้ารหัสในเนื้อหาการจำลองที่ฉันพบทางออนไลน์

เรื่องการวินิจฉัย

vifhettestR2

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.