ถาม: "... ฉันจะตีความค่า x2" High "ได้อย่างไรตัวอย่างเช่น" High "x2s จะมีผลอย่างไรต่อตัวแปรตอบกลับในตัวอย่างที่ให้ไว้ที่นี่ ??
ตอบ: คุณไม่ต้องสงสัยเลยว่ามีการเอ่ยถึง x2 = "สูง" ในผลลัพธ์ ในขณะนี้ x2 สูงได้รับเลือกเป็น "กรณีฐาน" นั่นเป็นเพราะคุณเสนอตัวแปรปัจจัยพร้อมการเข้ารหัสเริ่มต้นสำหรับระดับแม้ว่าการสั่งซื้อจะเป็น L / M / H ตามธรรมชาติมากขึ้นต่อจิตใจมนุษย์ แต่คำว่า "H" นั้นเป็นคำศัพท์ก่อนตัวอักษร "L" และ "M" ทั้งสองตัวถูกเลือกโดย R เป็นตัวพิมพ์ใหญ่
เนื่องจากไม่ได้รับคำสั่ง 'x2' ความแตกต่างที่รายงานแต่ละรายการจึงสัมพันธ์กับ x2 = "สูง" และ x2 == "ต่ำ" จึงประมาณที่ -0.78 เมื่อเทียบกับ x2 = "สูง" ในขณะนี้การสกัดกั้นคือค่าโดยประมาณของ "Y" เมื่อ x2 = "สูง" และ x1 = 0 คุณอาจต้องการเรียกใช้การถดถอยของคุณอีกครั้งหลังจากเปลี่ยนระดับการสั่งซื้อ (แต่ไม่ใช่ปัจจัยที่สั่ง)
x2a = factor(x2, levels=c("Low", "Medium", "High"))
จากนั้นประมาณการ 'ปานกลาง' และ 'สูง' ของคุณจะสอดคล้องกับสิ่งที่คุณคาดหวังมากขึ้น
แก้ไข: มีการจัดเรียงการเข้ารหัสทางเลือก (หรือการจัดเรียงอย่างแม่นยำมากกว่าของเมทริกซ์โมเดล) ตัวเลือกเริ่มต้นสำหรับความแตกต่างใน R คือ "การรักษาแตกต่าง" ซึ่งระบุระดับปัจจัยหนึ่ง (หรือการรวมกันของระดับปัจจัย) เป็นระดับ ความแตกต่างของค่าเฉลี่ยโดยประมาณสำหรับระดับหรือชุดค่าผสมอื่น ๆ อย่างไรก็ตามคุณสามารถมีระดับการอ้างอิงเป็นค่าเฉลี่ยโดยการบังคับให้ Intercept เป็น 0 (ไม่แนะนำ) หรือใช้หนึ่งในตัวเลือกความคมชัดอื่น ๆ :
?contrasts
?C # which also means you should _not_ use either "c" or "C" as variable names.
คุณสามารถเลือกความแตกต่างที่แตกต่างกันสำหรับปัจจัยต่าง ๆ แม้ว่าการทำเช่นนั้นดูเหมือนจะกำหนดภาระการตีความเพิ่มเติม S-Plus ใช้ความแตกต่างของ Helmert โดยค่าเริ่มต้นและ SAS ใช้ความแตกต่างของการรักษา แต่เลือกระดับปัจจัยสุดท้ายมากกว่าระดับแรกเป็นระดับอ้างอิง