ฉันพยายามที่จะเข้าใจว่าปัจจัยการทำงานในอาร์ว่ากันว่าฉันต้องการที่จะเรียกใช้การถดถอยโดยใช้ข้อมูลตัวอย่างบางอย่างใน R:
> data(CO2)
> colnames(CO2)
[1] "Plant" "Type" "Treatment" "conc" "uptake"
> levels(CO2$Type)
[1] "Quebec" "Mississippi"
> levels(CO2$Treatment)
[1] "nonchilled" "chilled"
> lm(uptake ~ Type + Treatment, data = CO2)
Call:
lm(formula = uptake ~ Type + Treatment, data = CO2)
Coefficients:
(Intercept) TypeMississippi Treatmentchilled
36.97 -12.66 -6.86
ฉันเข้าใจว่าTypeMississippi
และTreatmentchilled
ได้รับการปฏิบัติเหมือนเป็นบูลีน: สำหรับแต่ละแถวการดูดซับเริ่มต้นคือ36.97
และเราลบ12.66
ถ้ามันเป็นประเภทมิสซิสซิปปี้และ6.86
ถ้ามันเย็น ฉันมีปัญหาในการทำความเข้าใจบางสิ่งเช่นนี้:
> lm(uptake ~ Type * Treatment, data = CO2)
Call:
lm(formula = uptake ~ Type * Treatment, data = CO2)
Coefficients:
(Intercept) TypeMississippi
35.333 -9.381
Treatmentchilled TypeMississippi:Treatmentchilled
-3.581 -6.557
การคูณสองปัจจัยเข้าด้วยกันหมายความว่าlm
อะไร