ฉันมีคำถามง่ายๆ 2 ข้อเกี่ยวกับการถดถอยเชิงเส้น:
- เมื่อใดควรที่จะสร้างมาตรฐานของตัวแปรอธิบาย?
- เมื่อการประมาณค่าดำเนินการด้วยค่ามาตรฐานแล้วหนึ่งคนจะคาดการณ์ด้วยค่าใหม่ได้อย่างไร (ควรประเมินค่ามาตรฐานใหม่อย่างไร)
การอ้างอิงบางอย่างจะเป็นประโยชน์
ฉันมีคำถามง่ายๆ 2 ข้อเกี่ยวกับการถดถอยเชิงเส้น:
การอ้างอิงบางอย่างจะเป็นประโยชน์
คำตอบ:
แม้ว่าคำศัพท์จะเป็นหัวข้อที่ถกเถียงกัน แต่ฉันชอบเรียกตัวแปร "อธิบาย", "ตัวแปรทำนาย"
ฉันยังคิดว่าการใช้ตัวแปรมาตรฐานอาจให้ความสนใจกับความจริงที่ว่าเราไม่ได้คิดเกี่ยวกับวิธีทำให้ตัวชี้วัดของตัวแปรมีความหมายกับผู้อ่านมากขึ้น
Andrew Gelman มีเหตุผลพอสมควรที่จะพูดในหัวข้อนี้ ดูหน้าของเขาเกี่ยวกับมาตรฐานเช่นGelman (2008, Stats Med, PDF ฟรี)โดยเฉพาะ
ให้ฉันตอบด้วยแป้งคำตอบสั้น ๆ มันอาจทับซ้อนกับคำตอบที่เขียนก่อนหน้านี้
ให้คะแนนที่สม่ำเสมอซึ่งช่วยให้คุณสามารถตีความการถดถอยได้โดยเฉพาะสัมประสิทธิ์การถดถอยที่ดีกว่า
สำหรับข้อมูลใหม่ที่ไม่ได้มาตรฐานฉันขอแนะนำให้คุณเก็บค่าที่คุณใช้สำหรับแต่ละตัวแปรให้อยู่ในสถานะสแตนด์อะโลนเช่นค่าสูงสุดและค่าต่ำสุดจากนั้นทำการแปลงแบบเดียวกันกับที่คุณทำในชุดข้อมูลรูมาก่อน อินสแตนซ์เดียว