ดังที่คนอื่น ๆ ตั้งข้อสังเกตสิ่งนี้สามารถจำลองแบบเชิงเส้นด้วยการโต้ตอบ คุณกำลังโต้ตอบกับหุ่นสองตัวและไม่มีสิ่งใดเป็นเส้นตรงเกี่ยวกับเรื่องนี้ ให้แบบจำลอง:
ผลกระทบส่วนเพิ่ม 'เพศ' เป็นอนุพันธ์บางส่วน:
wt=α+b1age+b2gender+b3age∗gender+ϵ
∂wt∂gender=b2+b3age
มาดูกันว่าเพศและอายุสามารถรับค่า 0 หรือ 1 ได้หรือไม่เรากำลังมองหาความแตกต่างของกลุ่มสี่กลุ่มเท่านั้น? นั่นคือเรามีเพียงสี่แตกต่างกันเราสามารถเสียบเข้ากับสมการข้างต้น (1) และกรัมE = 0 (2) กรัมE n d อีR = 1และกรัมe = 1 , (3) g e n d e r = 0และa g egender=0age=0gender=1age=1gender=0และ (4)กรัมE n d อีR = 1และกรัมE = 0 ดังนั้นตัวอย่างเฉพาะของคุณเทียบเท่ากับการเปรียบเทียบระหว่างค่าเฉลี่ยสี่กลุ่มage=1gender=1age=0
นอกจากนี้ยังอาจเป็นประโยชน์ในการดูการสนทนานี้เพื่อทำความเข้าใจว่าข้างต้นเทียบเท่ากับ ANOVA กับตัวแปรระบุสองแบบ เป็นวิธีที่จะย้ำความจริงที่ว่ามีตัวอย่างที่เฉพาะเจาะจงของคุณ (อีกครั้งเพราะมีเพียงสี่ผสมเป็นไปได้ของอายุและเพศ) เราสามารถระบุรูปแบบเช่นต่อไปนี้โดยไม่ต้องเป็นคำที่มีปฏิสัมพันธ์อย่างชัดเจนอื่น:
wt=α+b1young.male+b2old.male+b3young.female+ϵ
ที่ไหนถูกละไว้เป็นหมวดหมู่การอ้างอิงของคุณและสำหรับตัวอย่างเช่นค่าสัมประสิทธิ์ข1จะมีความแตกต่างในวิธีการระหว่างo L d ฉอีเอ็มลิตรอีและY o U n กรัม ม. ลิตรอี ที่ตัดαยังจะเท่ากับค่าเฉลี่ยW Tภายในo L d f eo l d. ฉe m a l eข1o l d. ฉe m a l eYo คุณn g. m a l eαw t (อีกครั้งคือหมวดอ้างอิง)o l d. ฉe m a l e
ลองใช้กับข้อมูลของคุณเอง ด้วยโมเดลเชิงเส้นที่มีการโต้ตอบ ANOVA ที่มีการโต้ตอบหรือใช้หุ่นสำหรับแต่ละกลุ่มที่ไม่มีการโต้ตอบคุณจะได้รับผลลัพธ์เดียวกัน ค่อนข้างเท่ห์ใช่มั้ย หนังสือสถิติอาจอภิปรายวิธีการเหล่านี้ในบทที่แตกต่างกันแต่ถนนทุกสายนำไปสู่กรุงโรม จริงๆแล้วการดูว่าการทำงานกับข้อมูลของคุณเป็นวิธีที่ดีที่สุดในการเรียนรู้ ...
ตัวอย่างข้างต้นจึงเป็นวิธีที่ซับซ้อนเกินกว่าที่จะได้ข้อสรุปนี้ (ซึ่งเราแค่เปรียบเทียบค่าเฉลี่ยสี่กลุ่ม) แต่สำหรับการเรียนรู้เกี่ยวกับวิธีการทำงานของการโต้ตอบฉันคิดว่านี่เป็นการออกกำลังกายที่มีประโยชน์ มีโพสต์ที่ดีมากเกี่ยวกับประวัติส่วนตัวเกี่ยวกับการโต้ตอบตัวแปรต่อเนื่องกับตัวแปรที่กำหนดหรือการโต้ตอบสองตัวแปรต่อเนื่อง แม้ว่าคำถามของคุณจะได้รับการแก้ไขเพื่อระบุการทดสอบแบบไม่อิงพารามิเตอร์ แต่ฉันคิดว่ามันมีประโยชน์ที่จะคิดผ่านปัญหาของคุณจากวิธีการทั่วไปที่มากขึ้น (เช่นพาราเมตริก) เพราะวิธีการที่ไม่ใช่พารามิเตอร์มากที่สุดในการทดสอบสมมติฐานมีตรรกะเดียวกัน สมมติฐานน้อยลงเกี่ยวกับการแจกแจงเฉพาะ
แต่คำถามที่ถามเฉพาะสำหรับวิธีการที่ไม่ใช่ตัวแปรซึ่งอาจจะมีความเหมาะสมมากขึ้นตัวอย่างเช่นถ้าเราไม่ต้องการที่จะทำให้สมมติฐานบางอย่างเกี่ยวกับภาวะปกติของ T การทดสอบไม่ใช่ตัวแปรที่เหมาะสมจะทดสอบดันน์ การทดสอบนี้คล้ายกับการทดสอบยศรวมของ Wilcoxon-Mann-Whitney แต่มีมากกว่าสองประเภทw t
o l d. ม. จnYo คุณn g. w o m e n
สั้น ๆ ที่การโต้ตอบ "สำคัญ"
x1x2x1x2แต่อีกครั้งถ้าเรามี covariates สองตัวเท่านั้นที่สามารถรับค่าเป็น 0 หรือ 1 นั่นหมายความว่าเรากำลังดูที่กลุ่มสี่ค่าเฉลี่ย
ตัวอย่างการทำงาน
ลองเปรียบเทียบผลลัพธ์จากโมเดลปฏิสัมพันธ์กับผลลัพธ์จากการทดสอบของ Dunn อันดับแรกให้สร้างข้อมูลบางส่วนที่ (a) ผู้ชายมีน้ำหนักมากกว่าผู้หญิง (b) น้ำหนักของชายที่อายุน้อยกว่าผู้ชายที่มีอายุมากกว่าและ (c) ไม่มีความแตกต่างระหว่างผู้หญิงที่อายุน้อยกว่าและผู้หญิงที่มีอายุมากกว่า
set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))
w t
mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)
model: wt ~ age * gender
age*gender effect
gender
age male female
old 80.61897 57.70635
young 67.78351 56.01228
ต้องการคำนวณข้อผิดพลาดมาตรฐานหรือช่วงความมั่นใจสำหรับเอฟเฟ็กต์เล็กน้อยของคุณหรือไม่ แพ็คเกจ 'เอฟเฟกต์' ที่อ้างถึงด้านบนสามารถทำสิ่งนี้ให้คุณได้ แต่ที่ดีกว่าไอเคนและเวสต์ (1991) ให้สูตรแก่คุณแม้จะเป็นรูปแบบปฏิสัมพันธ์ที่ซับซ้อนมากขึ้น ตารางของพวกเขาถูกพิมพ์อย่างสะดวกที่นี่พร้อมคำอธิบายที่ดีมากโดย Matt Golder
ตอนนี้ใช้การทดสอบของ Dunn
#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")
Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0
Comparison of x by group
(Benjamini-Hochberg)
Col Mean-|
Row Mean | old.men young.me young.wo
---------+---------------------------------
young.me | 3.662802
| 0.0002*
|
young.wo | 7.185657 3.522855
| 0.0000* 0.0003*
|
old.wome | 6.705346 3.042544 -0.480310
| 0.0000* 0.0014* 0.3155
ค่า p ของผลการทดสอบ Kruskal-Wallis chi-squared แสดงให้เห็นว่าอย่างน้อยหนึ่งในกลุ่มของเรา 'มาจากประชากรที่แตกต่างกัน' สำหรับการเปรียบเทียบแบบกลุ่มต่อกลุ่มหมายเลขบนสุดคือสถิติการทดสอบ z ของ Dunn และหมายเลขด้านล่างคือค่า p ซึ่งได้รับการปรับสำหรับการเปรียบเทียบหลายรายการ เนื่องจากข้อมูลตัวอย่างของเราค่อนข้างถูกประดิษฐ์จึงไม่น่าแปลกใจที่เรามีค่า p จำนวนน้อยมาก แต่ให้สังเกตการเปรียบเทียบด้านล่างขวาระหว่างผู้หญิงที่อายุน้อยกว่าและผู้หญิงที่มีอายุมากกว่า การทดสอบอย่างถูกต้องสนับสนุนสมมติฐานว่างว่าไม่มีความแตกต่างระหว่างสองกลุ่มนี้
...
UPDATE: เมื่อได้รับคำตอบอื่น ๆ คำตอบนี้ได้รับการปรับปรุงเพื่อโต้แย้งความคิดที่ว่าสิ่งนี้ต้องการรูปแบบของการสร้างแบบจำลองที่ไม่เป็นเชิงเส้นหรือ - ได้รับตัวอย่างที่เฉพาะเจาะจงของ OP ของไบนารีโควาเรียตสองกลุ่มคือสี่กลุ่ม การเปลี่ยนแปลงสัญญาณเพื่อ asesses นี้ไม่ใช่พารามิเตอร์ ตัวอย่างเช่นถ้าอายุต่อเนื่องจะมีวิธีอื่นในการแก้ไขปัญหานี้ แต่นั่นไม่ใช่ตัวอย่างที่ OP กำหนด