วิธีการตีความคำศัพท์ในสูตร lm ใน R?


9

ใน R ถ้าฉันเรียกใช้lm()ฟังก์ชันด้วยวิธีต่อไปนี้:

lm.1 = lm(response ~ var1 + var2 + var1 * var2)
summary(lm.1)

นี้ทำให้ผมรูปแบบเชิงเส้นของตัวแปรตอบสนองด้วยvar1, var2และการมีปฏิสัมพันธ์ระหว่างพวกเขา อย่างไรก็ตามเราจะตีความคำศัพท์การโต้ตอบได้อย่างไร?

เอกสารบอกว่านี่คือ "cross" ระหว่างvar1และvar2แต่ไม่ได้ให้คำอธิบายว่า "cross" คืออะไร

มันจะมีประโยชน์สำหรับฉันที่จะรู้ว่าตัวเลขที่แน่นอน R คือการคำนวณเพื่อรวมการทำงานร่วมกันระหว่างตัวแปรทั้งสอง


คุณต้องการที่จะรู้ว่า R สร้างเมทริกซ์การออกแบบสำหรับสูตรนี้โดยเฉพาะหรือคุณสนใจในวงกว้างในการตีความคำที่มีหลายคำ ("การโต้ตอบ") ในรูปแบบของการติดตั้งหรือไม่?
Momo

ฉันสนใจวิธีตีความคำศัพท์ทวีคูณมากขึ้น ตัวอย่างเช่นถ้าฉันต้องการเขียนสูตรเชิงเส้น (สูตรทางคณิตศาสตร์ไม่ใช่สูตร R ... ) ฉันจะใส่อะไรลงในคำพหุคูณ
Enzo

เพื่ออธิบายความหมายของกากบาทลองดูการคำนวณvar3 <- var 1 * var2แล้วสร้างlm.2 <- lm(response ~ var1 + var2 + var3)
James Stanley เมื่อ

1
ดังนั้นมันจึงเป็นการคูณที่ชาญฉลาดใช่ไหม
Enzo

1
@Enzo ใช่ไม้กางเขนเป็นสองเงื่อนไขคูณ - การตีความจะขึ้นอยู่กับว่าvar1และvar2ทั้งสองอย่างต่อเนื่อง (ค่อนข้างยากที่จะตีความในความคิดของฉัน) หรือว่าหนึ่งในเหล่านี้เป็นเช่นหมวดหมู่ไบนารี (ง่ายต่อการพิจารณา) ดูคำตอบนี้สำหรับตัวอย่างการตีความโดย Peter Flom: stats.stackexchange.com/a/45512/16974
James Stanley

คำตอบ:


8

วิธีมาตรฐานในการเขียนสมการทำนายสำหรับโมเดลของคุณคือ:

Y^=0+1* * * *x1+2* * * *x2+12* * * *x1* * * *x2

แต่การเข้าใจการมีปฏิสัมพันธ์นั้นง่ายขึ้นเล็กน้อยหากเราแยกปัจจัยนี้ออกจากกัน:

Y^=(0+2* * * *x2)+(1+12* * * *x2)* * * *x1

ด้วยแฟคตอริ่งนี้เราจะเห็นว่าสำหรับมูลค่าที่กำหนดของ x2 ค่าตัดแกน y สำหรับ x1 คือ 0+2* * * *x2 และความลาดเอียงบน x1 คือ (1+12* * * *x2). ดังนั้นความสัมพันธ์ระหว่างY และ x1 ขึ้นอยู่กับ x2.

อีกวิธีในการทำความเข้าใจนี้คือการพล็อตเส้นที่ทำนายระหว่าง Y และ x1 สำหรับค่าที่แตกต่างกันของ x2(หรือวิธีอื่น ๆ ) Predict.PlotและTkPredictฟังก์ชั่นในแพคเกจสำหรับ TeachingDemos R ถูกออกแบบมาเพื่อความช่วยเหลือเกี่ยวกับประเภทนี้ของแปลง


3

สมมติว่าคุณได้รับการประเมินจุด 4 สำหรับ x12 สำหรับ x2และ 1.5 สำหรับการโต้ตอบ จากนั้นสมการจะบอกว่าlmพอดีคือ

Y=4x1+2x2+1.5x1x2

นั่นคือสิ่งที่คุณต้องการ?


3

เป็นการง่ายที่สุดที่จะคิดถึงการโต้ตอบในแง่ของตัวแปรที่ไม่ต่อเนื่อง บางทีคุณอาจศึกษา ANOVAs แบบสองทางซึ่งเรามีตัวแปรการจัดกลุ่มสองแบบ (เช่นหมวดหมู่เพศและอายุที่มีสามระดับอายุ) และกำลังดูว่าพวกมันเกี่ยวข้องกับการวัดแบบต่อเนื่องอย่างไร (ตัวแปรตามเช่น IQ)

ถ้าเป็นนัยสำคัญสามารถเข้าใจได้ว่าเทอม x1 * x2 (ในตัวอย่างที่น่าสนใจและทำขึ้นนี้) เนื่องจาก IQ มีพฤติกรรมที่แตกต่างกันไปตามระดับอายุของเพศที่แตกต่างกัน ตัวอย่างเช่นบางที IQ อาจมีเสถียรภาพสำหรับผู้ชายในกลุ่มอายุทั้งสาม แต่หญิงสาวเริ่มด้านล่างชายหนุ่มและมีวิถีขึ้น (กับกลุ่มอายุที่มีค่าเฉลี่ยสูงกว่ากลุ่มอายุสำหรับผู้ชาย) ในพล็อตค่าเฉลี่ยนี่จะหมายถึงเส้นแนวนอนสำหรับผู้ชายที่อยู่ตรงกลางของกราฟและอาจเป็นเส้น 45 องศาสำหรับผู้หญิงที่เริ่มต้นด้านล่างเพศชาย แต่จบลงเหนือเพศชาย

ส่วนสำคัญคือเมื่อคุณเลื่อนไปตามระดับของตัวแปรหนึ่งตัว (หรือ "ถือค่าคงที่ X1") สิ่งที่เกิดขึ้นในการเปลี่ยนแปลงตัวแปรอื่น ๆ การตีความนี้ยังทำงานร่วมกับตัวแปรทำนายอย่างต่อเนื่อง แต่ไม่ใช่เรื่องง่ายที่จะแสดงให้เห็นอย่างชัดเจน ในกรณีนี้คุณอาจต้องการค่าเฉพาะของ X1 และ X2 และดูว่าเกิดอะไรขึ้นกับ Y

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.