สรุปห้าจุด
ใช่ความคิดคือการให้การสรุปอย่างรวดเร็วของการกระจาย มันควรจะมีความสมมาตรเกี่ยวกับค่าเฉลี่ยโดยประมาณค่ามัธยฐานควรอยู่ใกล้กับ 0, ค่า 1Q และ 3Q ควรเป็นค่าที่ใกล้เคียงกัน
ค่าสัมประสิทธิ์และβi^s
สัมประสิทธิ์แต่ละแบบคือตัวแปรสุ่มแบบเกาส์ (ปกติ) เป็นประมาณการของค่าเฉลี่ยของการกระจายของตัวแปรสุ่มที่และข้อผิดพลาดมาตรฐานคือรากที่สองของความแปรปรวนของการกระจายว่า มันเป็นตัวชี้วัดของความไม่แน่นอนในการประมาณการของที่beta_i}βi^βi^
คุณสามารถดูวิธีการเหล่านี้จะคำนวณ (ดีสูตรทางคณิตศาสตร์ที่ใช้) บนวิกิพีเดีย โปรดทราบว่าโปรแกรมสถิติการเคารพตนเองจะไม่ใช้สมการทางคณิตศาสตร์มาตรฐานเพื่อคำนวณเพราะการทำสิ่งเหล่านี้บนคอมพิวเตอร์สามารถนำไปสู่การสูญเสียความแม่นยำอย่างมากในการคำนวณβi^
t -statistics
สถิติที่มีการประมาณการไว้ ( ) หารด้วยข้อผิดพลาดมาตรฐาน ( ) เช่นsigma_i}} สมมติว่าคุณมีโมเดลเดียวกันในวัตถุเป็น Q ของคุณ:tβi^σi^ti=βi^σi^mod
> mod <- lm(Sepal.Width ~ Petal.Width, data = iris)
ดังนั้นค่ารายงาน R จะถูกคำนวณดังนี้:t
> tstats <- coef(mod) / sqrt(diag(vcov(mod)))
(Intercept) Petal.Width
53.277950 -4.786461
ที่ไหนcoef(mod)
เป็นและช่วยให้รากขององค์ประกอบเส้นทแยงมุมของเมทริกซ์ความแปรปรวนของพารามิเตอร์แบบซึ่งเป็นข้อผิดพลาดมาตรฐานของพารามิเตอร์ ( )βi^sqrt(diag(vcov(mod)))
σi^
p-value คือความน่าจะเป็นที่จะได้ค่ามีขนาดใหญ่เป็นหรือมีขนาดใหญ่กว่าที่สังเกตค่าทีแน่นอนถ้าสมมติฐาน ( ) เป็นความจริงที่เป็น0 พวกเขาคำนวณเป็น (ใช้จากด้านบน):|t|H0H0βi=0tstats
> 2 * pt(abs(tstats), df = df.residual(mod), lower.tail = FALSE)
(Intercept) Petal.Width
1.835999e-98 4.073229e-06
ดังนั้นเราคำนวณความน่าจะเป็นหางส่วนบนของการได้ค่าเราได้จากการแจกแจงแบบกับองศาอิสระเท่ากับองศาอิสระที่เหลือของแบบจำลอง นี้แสดงให้เห็นความน่าจะเป็นของความสำเร็จที่ค่ามากกว่าค่าที่แน่นอนของการสังเกต s มันคูณด้วย 2 เพราะแน่นอนว่าสามารถมีขนาดใหญ่ในทิศทางลบได้เช่นกันttttt
ข้อผิดพลาดมาตรฐานที่เหลือ
ข้อผิดพลาดมาตรฐานที่เหลือเป็นค่าประมาณของพารามิเตอร์\สมมติฐานในสี่เหลี่ยมน้อยสามัญที่เหลือจะมีคำอธิบายเป็นรายบุคคลโดยการกระจายแบบเกาส์ (ปกติ) ที่มีค่าเฉลี่ย 0 และส่วนเบี่ยงเบนมาตรฐาน\เกี่ยวข้องกับสมมติฐานแปรปรวนคงที่ แต่ละที่เหลือมีความแปรปรวนเหมือนกันและความแปรปรวนที่เท่ากับ 2σσσσ2
ปรับR2
ปรับคำนวณเป็น:R2
1−(1−R2)n−1n−p−1
การปรับนั้นเหมือนกับแต่ปรับสำหรับความซับซ้อน (เช่นจำนวนพารามิเตอร์) ของแบบจำลอง กำหนดโมเดลที่มีพารามิเตอร์เดียวโดยมีค่าแน่นอนหากเราเพิ่มพารามิเตอร์อื่นลงในโมเดลนี้โมเดลใหม่ของจะต้องเพิ่มขึ้นแม้ว่าพารามิเตอร์ที่เพิ่มเข้ามาจะไม่มีกำลังทางสถิติ ปรับแล้วทำสิ่งนี้โดยรวมถึงจำนวนพารามิเตอร์ในโมเดลR2R2R2R2R2
Fสถิติ
คืออัตราส่วนของความแปรปรวนสอง (คน ) ความแปรปรวนอธิบายโดยพารามิเตอร์ในรูปแบบ (ผลรวมของกำลังสองของการถดถอย SSR) และความแปรปรวนที่เหลือหรือไม่ได้อธิบาย (ผลรวมของกำลังสองของข้อผิดพลาด SSE) คุณสามารถดูได้ดีกว่านี้หากเราได้รับตาราง ANOVA สำหรับรุ่นผ่าน:FSSR/SSEanova()
> anova(mod)
Analysis of Variance Table
Response: Sepal.Width
Df Sum Sq Mean Sq F value Pr(>F)
Petal.Width 1 3.7945 3.7945 22.91 4.073e-06 ***
Residuals 148 24.5124 0.1656
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
s จะเหมือนกันในการส่งออก ANOVA และเอาท์พุท คอลัมน์มีสองความแปรปรวนและ22.91 เราสามารถคำนวณความน่าจะเป็นที่จะได้รับที่มีขนาดใหญ่ภายใต้สมมติฐานว่างเปล่าที่ไม่มีผลกระทบจากการแจกแจงแบบกับ 1 และ 148 องศาอิสระ นี่คือสิ่งที่ถูกรายงานในคอลัมน์สุดท้ายของตาราง ANOVA ในกรณีที่ง่าย ๆ ของตัวทำนายแบบต่อเนื่องตัวเดียว (ตามตัวอย่างของคุณ),ซึ่งเป็นเหตุผลที่ค่า p เหมือนกัน ความเท่าเทียมกันนี้มีไว้ในกรณีง่าย ๆ นี้เท่านั้นFsummary(mod)
Mean Sq
3.7945/0.1656=22.91FFF=t2Petal.Width