วิธีการหาที่เหลือและพล็อตพวกเขา


14

ฉันได้รับข้อมูลแล้ว

x = c(21,34,6,47,10,49,23,32,12,16,29,49,28,8,57,9,31,10,21,26,31,52,21,8,18,5,18,26,27,26,32,2,59,58,19,14,16,9,23,28,34,70,69,54,39,9,21,54,26)
y = c(47,76,33,78,62,78,33,64,83,67,61,85,46,53,55,71,59,41,82,56,39,89,31,43,29,55, 
     81,82,82,85,59,74,80,88,29,58,71,60,86,91,72,89,80,84,54,71,75,84,79)

ฉันจะได้รับส่วนที่เหลือและพล็อตกับอย่างไร? และฉันจะทดสอบว่าส่วนที่เหลือดูเหมือนจะเป็นปกติโดยประมาณได้อย่างไรx

ฉันไม่แน่ใจว่าถ้าฉันทำแบบเชิงเส้นพอดีอย่างถูกต้องเมื่อฉันได้สมการแต่บันทึกการบรรยายบอกว่าเส้นการถดถอยเชิงเส้นควรอยู่ในรูปแบบy i = β 0 + β 1 x + ϵ .Y=6.9x-5.5Yผม=β0+β1x+ε


คุณใช้แพ็คเกจอะไร ตัวอย่างเช่นฟังก์ชัน 'regress' ของ Matlab จะคืนค่าส่วนที่เหลือเป็นเอาต์พุตและคุณสามารถสร้างกราฟโดยใช้ฮิสโตแกรม
BGreene

ฉันใช้ Sagemath ฉันสามารถใช้ R ผ่านมันได้ แต่ฉันมีประสบการณ์น้อยมาก
แขกที่เข้าพัก

เกี่ยวกับสมการ 2 ตัวที่คุณมีอยู่ หากเส้นถดถอย (เป็นฟังก์ชันเชิงเส้น) อยู่ในรูปแบบดังนั้นโมเดลเชิงเส้นคือE [ Y | X ] = a + k Xและการใช้คำผิดพลาดนี่คือY = a + k X + ϵโดยที่ϵเป็นคำข้อผิดพลาดที่ไม่มีความคาดหวังเป็นศูนย์ นี่คือความหมายที่สมการทั้งสองเข้ากัน Y=a+kxE[Y|X]=a+kXY=a+kX+εε
Ric

1
สมการที่คุณได้เป็นรูปแบบที่กล่าวถึงในบันทึกของคุณด้วยและ^ β 1 = 6.9 เหลือเป็นเพียงr ฉัน = Y Y - Yฉัน = Y ฉัน - ( - 5.5 + 6.9 x ฉัน )β0^=-5.5β1^=6.9Rผม=YY-Y^ผม=Yผม-(-5.5+6.9xผม)
Glen_b -Reinstate โมนิกา

คำตอบ:


29

แก้ไข: คุณมีRแท็ก แต่ในความคิดเห็นบอกว่าคุณไม่ได้รู้อะไรเกี่ยวกับมันมากนัก นี่คือRรหัส ฉันไม่รู้อะไรเกี่ยวกับปราชญ์ สิ้นสุดการแก้ไข

คุณสามารถทำได้

x = c(21,34,6,47,10,49,23,32,12,16,29,49,28,8,57,9,31,10,21,
      26,31,52,21,8,18,5,18,26,27,26,32,2,59,58,19,14,16,9,23,
      28,34,70,69,54,39,9,21,54,26)
y = c(47,76,33,78,62,78,33,64,83,67,61,85,46,53,55,71,59,41,82,
      56,39,89,31,43,29,55, 81,82,82,85,59,74,80,88,29,58,71,60,
      86,91,72,89,80,84,54,71,75,84,79)

m1 <- lm(y~x)  #Create a linear model
resid(m1) #List of residuals
plot(density(resid(m1))) #A density plot
qqnorm(resid(m1)) # A quantile normal plot - good for checking normality
qqline(resid(m1))

+1 @guest โค้ดข้างต้นใช้สำหรับ R ซึ่งมีให้บริการฟรี
BGreene

ตกลง. ดังนั้นฉันจึงเห็นภาพพร้อมคำบรรยายภาพความหนาแน่นเริ่มต้น (x = ส่วนที่เหลือ (m1)) รหัสนี้ควรส่งกราฟสองกราฟหรือไม่ และฉันควรตรวจสอบจากกราฟว่ามีสารตกค้างเหลืออยู่ประมาณปกติหรือไม่?
แขกที่เข้าพัก

รหัสจะแสดงกราฟสองกราฟ - อันหนึ่งเป็นพล็อตความหนาแน่น ถ้าค่าตกค้างเป็นปกติอย่างสมบูรณ์แบบคะแนนจะอยู่ในแนวเส้นตรง
Peter Flom - Reinstate Monica

ขวา. โค้ดทำงานได้ถ้าคุณเปลี่ยนบรรทัดสุดท้ายเป็นพล็อต (qqnorm (ส่วนที่เหลือ (m1))) และพล็อต (qqline (ส่วนที่เหลือ (m1))) ดังนั้นฉันคิดว่าส่วนที่เหลือไม่พอใจการกระจายตัวแบบปกติเนื่องจากมีจุดที่ต่ำกว่าเส้นมากกว่าเส้นตรง มีเกณฑ์เชิงตัวเลขใด ๆ ในการตรวจสอบความเป็นมาตรฐานหรือไม่?
แขกรับเชิญ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.