ฉันมีคำถามเกี่ยวกับการตีความกราฟที่สร้างขึ้นโดยพล็อต (lm) ในอาร์ฉันสงสัยว่าพวกคุณจะบอกวิธีการตีความสเกลตำแหน่งและพล็อตที่เหลือ? ความคิดเห็นใด ๆ ที่จะได้รับการชื่นชม สมมติว่ามีความรู้พื้นฐานเกี่ยวกับสถิติการถดถอยและเศรษฐมิติ
ฉันมีคำถามเกี่ยวกับการตีความกราฟที่สร้างขึ้นโดยพล็อต (lm) ในอาร์ฉันสงสัยว่าพวกคุณจะบอกวิธีการตีความสเกลตำแหน่งและพล็อตที่เหลือ? ความคิดเห็นใด ๆ ที่จะได้รับการชื่นชม สมมติว่ามีความรู้พื้นฐานเกี่ยวกับสถิติการถดถอยและเศรษฐมิติ
คำตอบ:
ตามที่ระบุในเอกสาร , plot.lm()
สามารถกลับ 6 แปลงที่แตกต่างกัน
[1]พล็อตเรื่องค่าติดตั้งที่เหมาะสม, [2]พล็อตสเกลตำแหน่งของ sqrt (| ส่วนที่เหลือ |) กับค่าติดตั้ง, [3]พล็อต QQ ปกติ, [4]พล็อตระยะทางของแม่ครัวกับฉลากแถว[5]พล็อตเรื่องค่าใช้จ่ายต่อเลเวอเรจและ[6]พล็อตเรื่องระยะทางของ Cook เทียบกับเรเวอเรจ / (1-leverage) ตามค่าเริ่มต้นจะมีการระบุสามและ 5 ตัวแรก ( หมายเลขของฉัน )
พล็อต[1] , [2] , [3] & [5]จะถูกส่งกลับโดยค่าเริ่มต้น แปลความหมาย[1]มีการกล่าวถึงใน CV ที่นี่: เหลือล่ามกับพล็อตที่ติดตั้งในการตรวจสอบสมมติฐานของรูปแบบเชิงเส้น ฉันอธิบายสมมติฐานของ homoscedasticity และพล็อตที่สามารถช่วยคุณประเมินได้ (รวมถึง scale-location plots [2] ) ใน CV ที่นี่: อะไรคือความแปรปรวนคงที่ในตัวแบบถดถอยเชิงเส้นหมายความว่าอย่างไร ฉันได้กล่าว QQ แปลง[3]ใน CV ที่นี่: พล็อต QQ ไม่ตรงกับ histogramและนี่: PP-แปลงเทียบกับ QQ นอกจากนี้ยังมีภาพรวมที่ดีมากที่นี่: จะแปลความหมาย QQ-plot ได้อย่างไร? ดังนั้นสิ่งที่เหลืออยู่ส่วนใหญ่เป็นเพียงการทำความเข้าใจ[5]พล็อตเรื่องการใช้ประโยชน์จากส่วนที่เหลือ
เพื่อให้เข้าใจสิ่งนี้เราต้องเข้าใจสามสิ่ง:
ไม่ว่าจะเป็นผลลัพธ์ที่คุณได้รับจะถูกขับเคลื่อนด้วยจุดข้อมูลไม่กี่; นั่นคือสิ่งที่พล็อตนี้มีจุดประสงค์เพื่อช่วยคุณในการพิจารณา
ด้วยข้อเท็จจริงเหล่านี้ในใจให้พิจารณาแผนการที่เชื่อมโยงกับสถานการณ์ที่แตกต่างกันสี่สถานการณ์:
21
leverage std.residual cooks.d
high leverage, low residual 0.3814234 0.0014559 0.0000007
low leverage, high residual 0.0476191 3.4456341 0.2968102
high leverage, high residual 0.3814234 -3.8086475 4.4722437
ด้านล่างเป็นรหัสที่ฉันใช้ในการสร้างแปลงเหล่านี้:
set.seed(20)
x1 = rnorm(20, mean=20, sd=3)
y1 = 5 + .5*x1 + rnorm(20)
x2 = c(x1, 30); y2 = c(y1, 20.8)
x3 = c(x1, 19.44); y3 = c(y1, 20.8)
x4 = c(x1, 30); y4 = c(y1, 10)
* สำหรับความช่วยเหลือในการทำความเข้าใจว่าการถดถอยของ OLS พยายามหาเส้นที่ลดระยะห่างในแนวดิ่งระหว่างข้อมูลและบรรทัดให้ดูคำตอบของฉันที่นี่: อะไรคือความแตกต่างระหว่างการถดถอยเชิงเส้นบน y กับ x และ x กับ y