มีสองวิธีในการตีความคำถามแรกของคุณซึ่งสะท้อนให้เห็นในสองวิธีที่คุณถาม:“ สปีชีส์เกี่ยวข้องกับพืชอาศัยหรือไม่” และ“ ชนิดพันธุ์ที่เป็นอิสระต่อพืชเป็นเจ้าภาพได้รับผลกระทบจากฝนหรือไม่”
การตีความครั้งแรกสอดคล้องกับรูปแบบของความเป็นอิสระแบบร่วมซึ่งระบุว่าสปีชีส์และโฮสต์นั้นขึ้นอยู่กับ แต่การรวมกันเป็นอิสระจากการที่ฝนตกลงมา:
pshr=pshpr
โดยที่คือความน่าจะเป็นที่การสังเกตตกลงไปในเซลล์ที่ดัชนีสปีชีส์, ชนิดของโฮสต์ , และค่า rain,คือความน่าจะเป็นที่ขอบของเซลล์ที่เรายุบลงไปในตัวแปรฝนและคือความน่าจะเป็นเล็กน้อยของฝนpshr(s,h,r)shrpsh(s,h,⋅)pr
การตีความที่สองสอดคล้องกับรูปแบบของความเป็นอิสระตามเงื่อนไขซึ่งระบุว่าสปีชีส์และโฮสต์มีความเป็นอิสระไม่ว่าฝนจะตกลงมาหรือไม่:
psh|r=ps|rph|rหรือpshr=psrphr/pr
ที่เป็นน่าจะเป็นเงื่อนไขของมือถือที่กำหนดค่าของR ( s , h , r ) rpsh|r(s,h,r)r
คุณสามารถทดสอบแบบจำลองเหล่านี้ใน R ( loglin
จะทำงานได้ดีเช่นกัน แต่ฉันคุ้นเคยมากกว่าglm
):
count <- c(12,15,10,13,11,12,12,7)
species <- rep(c("a", "b"), 4)
host <- rep(c("c","c", "d", "d"), 2)
rain <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)
my.data <- as.data.frame.table(my.table)
mod0 <- glm(Freq ~ species + host + rain, data=my.data, family=poisson())
mod1 <- glm(Freq ~ species * host + rain, data=my.data, family=poisson())
mod2 <- glm(Freq ~ (species + host) * rain, data=my.data, family=poisson())
anova(mod0, mod1, test="Chi") #Test of joint independence
anova(mod0, mod2, test="Chi") #Test of conditional independence
ข้างต้นmod1
สอดคล้องกับความเป็นอิสระร่วมกันและmod2
สอดคล้องกับความเป็นอิสระตามเงื่อนไขในขณะที่mod0
สอดคล้องกับความเป็นอิสระซึ่งกันและกันรุ่นp_r คุณสามารถดูการประมาณค่าพารามิเตอร์ที่ใช้เป็นต้นตามปกติคุณควรตรวจสอบเพื่อดูว่าเป็นไปตามสมมติฐานของรุ่นหรือไม่ ในข้อมูลที่คุณให้มาโมเดลตัวจริงพอดีพอสมควรpshr=psphprsummary(mod2)
วิธีการที่แตกต่างกันในการเข้าถึงคำถามแรกของคุณคือทำการทดสอบที่แม่นยำของ Fischer's ( fisher.test(xtabs(count ~ host + species))
) บนตาราง 2x2 ที่ยุบ (การตีความครั้งแรก) หรือการทดสอบ Mantel-Haenszel ( mantelhaen.test(xtabs(count ~ host + species + rain))
) สำหรับตาราง 2x2 แบบแบ่งชั้น 2 หรือเขียนการทดสอบการเรียงสับเปลี่ยน (การตีความที่สอง)
ในการถอดความคำถามที่สองของคุณความสัมพันธ์ระหว่างเผ่าพันธุ์และโฮสต์นั้นขึ้นอยู่กับว่าฝนตกหรือไม่?
mod3 <- glm(Freq ~ species*host*rain - species:host:rain, data=my.data, family=poisson())
mod4 <- glm(Freq ~ species*host*rain, data=my.data, family=poisson())
anova(mod3, mod4, test=”Chi”)
pchisq(deviance(mod3), df.residual(mod3), lower=F)
แบบจำลองเต็มmod4
อิ่ม แต่คุณสามารถทดสอบเอฟเฟกต์ที่เป็นปัญหาได้โดยดูที่ความเบี่ยงเบนmod3
เหมือนกับที่ฉันได้ทำไปแล้ว