เหตุใด R จึงวางแผนส่วนที่เหลือเป็นมาตรฐานเทียบกับปริมาณเชิงทฤษฎีในพล็อต QQ


9

ใน R ทำไมการตั้งค่าเริ่มต้นของการqqplot(linear model)ใช้ค่ามาตรฐานในแกน y? เหตุใด R จึงไม่ใช้ส่วนที่เหลือ "ปกติ"

คำตอบ:


13

เมื่อคุณใช้ค่ามาตรฐานที่เหลืออยู่ค่าคาดหวังของค่าส่วนที่เหลือจะเป็นศูนย์และค่าความแปรปรวนเท่ากับ (โดยประมาณ) หนึ่งค่า นี่มีสองประโยชน์:

  1. หากคุณขายหนึ่งในตัวแปรของคุณ (เช่นเปลี่ยนกิโลเมตรเป็นไมล์) พล็อตที่เหลือยังคงไม่เปลี่ยนแปลง
  2. ใน qqplot ส่วนที่เหลือควรอยู่บนบรรทัด y = x
  3. คุณคาดว่า 95% ของจำนวนที่เหลือจะอยู่ระหว่าง -1.96 และ 1.96 ทำให้ง่ายต่อการมองเห็นค่าผิดปกติ

คุณช่วยให้ฉันอ้างอิงได้ไหมว่า 95% ควรอยู่ระหว่าง -1.96; 1.96 ในคำอื่น ๆ ทำไมเหลือมาตรฐานควรจะ ? diN(0,1)
MarkDollar

@ Mark: เพียงแค่ google "ส่วนที่เหลือมาตรฐาน" และดูที่ความนิยมไม่กี่ครั้งแรก
csgillespie

4

ส่วนที่เหลือตามทฤษฎีในแบบจำลองเชิงเส้นมีความเป็นอิสระแบบกระจายตัวตามปกติ อย่างไรก็ตามค่าสังเกตที่เหลือไม่เป็นอิสระและไม่มีความแปรปรวนเท่ากัน ดังนั้นการกำหนดค่าส่วนที่เหลือให้เป็นมาตรฐานนั้นหารด้วยค่าเบี่ยงเบนมาตรฐานโดยประมาณที่เกี่ยวข้องกับค่าส่วนที่เหลือทำให้พวกมันมีค่าเท่ากันในความแปรปรวน (โดยใช้ข้อมูลจากเมทริกซ์ของหมวกเพื่อคำนวณสิ่งนี้) นี่คือส่วนที่เหลือที่มีความหมายมากกว่าที่จะดูใน qqplot

คุณยังใช้ qqplot กับรุ่นที่ติดตั้งจริงหรือไม่ หรือนี่คือ qqplot จากการรันพล็อตกับโมเดลหรือไม่?


1
เฮ้! ฉันกำลังพูดถึง qqplot จากการรันพล็อต (> lm <) ขอบคุณสำหรับคำตอบ. ฉันต้องการให้เครื่องหมาย cs เพราะคำตอบของเขาเร็วขึ้น ผมหวังว่าจะ ok สำหรับคุณ :)
MarkDollar
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.