ฉันมีชุดข้อมูลที่มี 365 การสังเกตของสามตัวแปรคือpm
, และtemp
rain
ตอนนี้ฉันต้องการตรวจสอบพฤติกรรมของpm
การตอบสนองต่อการเปลี่ยนแปลงในอีกสองตัวแปร ตัวแปรของฉันคือ:
pm10
= การตอบสนอง (ขึ้นอยู่กับ)temp
= ตัวทำนาย (อิสระ)rain
= ตัวทำนาย (อิสระ)
ต่อไปนี้เป็นเมทริกซ์สหสัมพันธ์สำหรับข้อมูลของฉัน:
> cor(air.pollution)
pm temp rainy
pm 1.00000000 -0.03745229 -0.15264258
temp -0.03745229 1.00000000 0.04406743
rainy -0.15264258 0.04406743 1.00000000
ปัญหาคือเมื่อฉันกำลังศึกษาการสร้างตัวแบบการถดถอยมันเขียนว่าวิธีการเติมแต่งคือการเริ่มต้นด้วยตัวแปรที่เกี่ยวข้องกับตัวแปรตอบสนองมากที่สุด ในชุดข้อมูลของฉันrain
มีความสัมพันธ์อย่างมากกับpm
(เมื่อเทียบกับtemp
) แต่ในเวลาเดียวกันมันเป็นตัวแปรจำลอง (ฝน = 1, ไม่มีฝน = 0) ดังนั้นตอนนี้ฉันจึงได้รู้ว่าควรเริ่มจากที่ใด ผมได้แนบภาพสองภาพที่มีคำถาม: ที่แรกก็คือ scatterplot ของข้อมูลและภาพที่สองเป็น scatterplot ของpm10
กับrain
ผมยังไม่สามารถที่จะแปลความหมายของ scatterplot เทียบกับpm10
rain
บางคนสามารถช่วยฉันเริ่มต้นได้บ้าง