การตีความพล็อต. lm ()


89

ฉันมีคำถามเกี่ยวกับการตีความกราฟที่สร้างขึ้นโดยพล็อต (lm) ในอาร์ฉันสงสัยว่าพวกคุณจะบอกวิธีการตีความสเกลตำแหน่งและพล็อตที่เหลือ? ความคิดเห็นใด ๆ ที่จะได้รับการชื่นชม สมมติว่ามีความรู้พื้นฐานเกี่ยวกับสถิติการถดถอยและเศรษฐมิติ


คุณดูที่นี่ไหม
user603

6
และที่นี่ (จากหน้า 72) ที่นี่
COOLSerdash

คำตอบ:


139

ตามที่ระบุในเอกสาร , plot.lm()สามารถกลับ 6 แปลงที่แตกต่างกัน

[1]พล็อตเรื่องค่าติดตั้งที่เหมาะสม, [2]พล็อตสเกลตำแหน่งของ sqrt (| ส่วนที่เหลือ |) กับค่าติดตั้ง, [3]พล็อต QQ ปกติ, [4]พล็อตระยะทางของแม่ครัวกับฉลากแถว[5]พล็อตเรื่องค่าใช้จ่ายต่อเลเวอเรจและ[6]พล็อตเรื่องระยะทางของ Cook เทียบกับเรเวอเรจ / (1-leverage) ตามค่าเริ่มต้นจะมีการระบุสามและ 5 ตัวแรก ( หมายเลขของฉัน )

พล็อต[1] , [2] , [3] & [5]จะถูกส่งกลับโดยค่าเริ่มต้น แปลความหมาย[1]มีการกล่าวถึงใน CV ที่นี่: เหลือล่ามกับพล็อตที่ติดตั้งในการตรวจสอบสมมติฐานของรูปแบบเชิงเส้น ฉันอธิบายสมมติฐานของ homoscedasticity และพล็อตที่สามารถช่วยคุณประเมินได้ (รวมถึง scale-location plots [2] ) ใน CV ที่นี่: อะไรคือความแปรปรวนคงที่ในตัวแบบถดถอยเชิงเส้นหมายความว่าอย่างไร ฉันได้กล่าว QQ แปลง[3]ใน CV ที่นี่: พล็อต QQ ไม่ตรงกับ histogramและนี่: PP-แปลงเทียบกับ QQ นอกจากนี้ยังมีภาพรวมที่ดีมากที่นี่: จะแปลความหมาย QQ-plot ได้อย่างไร? ดังนั้นสิ่งที่เหลืออยู่ส่วนใหญ่เป็นเพียงการทำความเข้าใจ[5]พล็อตเรื่องการใช้ประโยชน์จากส่วนที่เหลือ

เพื่อให้เข้าใจสิ่งนี้เราต้องเข้าใจสามสิ่ง:

  • การงัด,
  • เศษตกค้างมาตรฐานและ
  • ระยะทางของแม่ครัว

(X¯, Y¯)Xไม่ว่าจะเป็นผลลัพธ์ที่คุณได้รับจะถูกขับเคลื่อนด้วยจุดข้อมูลไม่กี่; นั่นคือสิ่งที่พล็อตนี้มีจุดประสงค์เพื่อช่วยคุณในการพิจารณา

XX¯X

ยังไม่มีข้อความ

ด้วยข้อเท็จจริงเหล่านี้ในใจให้พิจารณาแผนการที่เชื่อมโยงกับสถานการณ์ที่แตกต่างกันสี่สถานการณ์:

  1. ชุดข้อมูลที่ทุกอย่างเรียบร้อย
  2. ชุดข้อมูลที่มีเลเวอเรจสูง แต่มีจุดตกค้างต่ำกว่ามาตรฐาน
  3. ชุดข้อมูลที่มีเลเวอเรจต่ำ แต่มีจุดตกค้างมาตรฐานสูง
  4. ชุดข้อมูลที่มีจุดตกค้างสูงและได้มาตรฐาน

ป้อนคำอธิบายรูปภาพที่นี่ ป้อนคำอธิบายรูปภาพที่นี่

(X¯, Y¯)21

                              leverage std.residual   cooks.d
high leverage,  low residual 0.3814234    0.0014559 0.0000007
low leverage,  high residual 0.0476191    3.4456341 0.2968102
high leverage, high residual 0.3814234   -3.8086475 4.4722437

ด้านล่างเป็นรหัสที่ฉันใช้ในการสร้างแปลงเหล่านี้:

set.seed(20)

x1 = rnorm(20, mean=20, sd=3)
y1 = 5 + .5*x1 + rnorm(20)

x2 = c(x1, 30);        y2 = c(y1, 20.8)
x3 = c(x1, 19.44);     y3 = c(y1, 20.8)
x4 = c(x1, 30);        y4 = c(y1, 10)

* สำหรับความช่วยเหลือในการทำความเข้าใจว่าการถดถอยของ OLS พยายามหาเส้นที่ลดระยะห่างในแนวดิ่งระหว่างข้อมูลและบรรทัดให้ดูคำตอบของฉันที่นี่: อะไรคือความแตกต่างระหว่างการถดถอยเชิงเส้นบน y กับ x และ x กับ y


คำตอบที่ดีที่ชี้ไปในทุกทิศทางการเขียนเพื่อการเรียนรู้เพิ่มเติม (ต้องสงสัยว่าทำไมถึงมีคำอธิบายที่สมบูรณ์และชัดเจนเกี่ยวกับแผนการเหล่านี้)
บรรพตวิทยา

แม้ว่านี่คือตัวอย่างของคำอธิบายโดยย่อสำหรับแต่ละพล็อต
วิทยาศาสตร์ด้านป่าไม้
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.