การตีความแบบจำลองค่าเฉลี่ยผลลัพธ์ใน R


11

ฉันพยายามที่จะเข้าใจและรู้ว่าจะรายงานอะไรจากการวิเคราะห์ข้อมูลบางอย่างของฉันโดยใช้แบบจำลองค่าเฉลี่ยใน R

ฉันใช้สคริปต์ต่อไปนี้เพื่อวิเคราะห์ผลกระทบของวิธีการวัดค่าตัวแปรที่กำหนด: นี่คือชุดข้อมูล: https://www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0

รูปแบบที่จะติดตั้ง:

LM.1 <- gls(VMTf ~ turn+sex+method, na.action="na.fail", method = "ML",VMT4)

ขุดแบบเต็ม

require(MuMIn)
d=dredge(LM.1)
print(d)
coefficients(d)

รับข้อมูลสรุปของทุกรุ่นเพื่อรับค่าประมาณพารามิเตอร์

summary(model.avg(d))

ฉันรู้ว่าแบบจำลองทั้งหมดสามารถเฉลี่ย (ค่าเฉลี่ยเต็มรูปแบบแบบจำลอง) หรือเพียงแค่ส่วนย่อยของพวกเขา (ค่าเฉลี่ยแบบมีเงื่อนไข) ตอนนี้ฉันต้องการทราบว่า: เมื่อใดควรใช้การหาค่าเฉลี่ยแบบเต็มหรือแบบเงื่อนไขเพื่อทำการอนุมาน ฉันควรรายงานเรื่องทั้งหมดนี้สำหรับบทความทางวิทยาศาสตร์อย่างไร หมายความว่าค่า Z และ p ที่เกี่ยวข้องสำหรับสถานการณ์เฉลี่ยแบบจำลองคืออะไร?

เพื่อให้ง่ายต่อการมองเห็นคำถามของฉัน นี่คือตารางผลลัพธ์

> summary(model.avg(d))# now, there are effects

Call:
model.avg(object = d)

Component model call: 
gls(model = VMT ~ <8 unique rhs>, data = VMT4, method = ML, na.action = 
 na.fail)

Component models: 
       df  logLik   AICc delta weight
1       4 -247.10 502.52  0.00   0.34
12      5 -246.17 502.83  0.31   0.29
13      5 -246.52 503.52  1.01   0.20
123     6 -245.60 503.88  1.36   0.17
(Null)  2 -258.62 521.33 18.81   0.00
3       3 -258.38 522.95 20.43   0.00
2       3 -258.60 523.39 20.88   0.00
23      4 -258.36 525.05 22.53   0.00

Term codes: 
method    sex   turn 
     1      2      3 

Model-averaged coefficients:  
(full average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)            42.63521    0.37170     0.37447 113.856  < 2e-16 ***
methodlight chamber    -1.05276    0.36098     0.36440   2.889  0.00386 ** 
methodthermal gradient -1.80567    0.36103     0.36445   4.955    7e-07 ***
sex2                    0.19023    0.29403     0.29548   0.644  0.51970    
turn                    0.05005    0.10083     0.10141   0.494  0.62165    

(conditional average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)             42.6352     0.3717      0.3745 113.856  < 2e-16 ***
methodlight chamber     -1.0528     0.3609      0.3643   2.890  0.00386 ** 
methodthermal gradient  -1.8058     0.3608      0.3642   4.958  7.1e-07 ***
sex2                     0.4144     0.3089      0.3119   1.328  0.18402    
turn                     0.1337     0.1264      0.1276   1.047  0.29492    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Relative variable importance: 
                     method sex  turn
Importance:          1.00   0.46 0.37
N containing models:    4      4    4

คำตอบ:


5

ดูที่ Grueber และคณะ 2554, "การอนุมานหลายมิติในระบบนิเวศและวิวัฒนาการ: ความท้าทายและการแก้ปัญหา" ชีววิทยาวิวัฒนาการ 24: 699-711

มันขึ้นอยู่กับเป้าหมายว่าคุณต้องการใช้ข้อมูลแบบเต็มหรือแบบมีเงื่อนไข ในสาขาของฉันเราจะใช้เกณฑ์เช่น AICC เพื่อกำหนดว่ารุ่นใดได้รับการสนับสนุนมากที่สุดจากนั้นใช้โมเดลเหล่านั้นเป็นชุดย่อยที่มีเงื่อนไขของคุณ ข้อมูลนี้จะถูกรายงาน ตัวอย่างเช่นสี่โมเดลแรกของคุณทั้งหมดอยู่ใน 2 AIC หน่วยของกันและกันดังนั้นโมเดลทั้งหมดจะรวมอยู่ในชุดย่อยของคุณ คนอื่น ๆ กำลังหาทางออก (AIC ที่สูงขึ้น) ดังนั้นการรวมข้อมูลจากพวกเขาจะลดคุณภาพของการประมาณค่าเบต้าของคุณ


2
แม้ว่าในตัวอย่างที่คุณแนะนำจะมีคำศัพท์บางคำที่ปรากฏในแบบจำลอง "ดีที่สุด" สองในสี่รูปแบบ คุณใช้ค่าสัมประสิทธิ์สองค่าเหล่านั้นหรือค่าสองค่าและค่าศูนย์สองค่าสำหรับสองรุ่นที่ไม่ปรากฏหรือไม่
user2390246

5

ฉันคิดว่าหลักฐานเกี่ยวกับความแตกต่างระหว่างสิ่งที่ค่าเฉลี่ยเต็มและเงื่อนไขผิด หนึ่งคือค่าเฉลี่ยที่มีศูนย์ (เต็ม) และหนึ่งไม่รวมศูนย์ (เงื่อนไข) จากไฟล์ช่วยเหลือสำหรับคำสั่ง model.avg ():

บันทึก

ค่าเฉลี่ย 'เซ็ต' (หรือ 'ตามเงื่อนไข') จะหาค่าเฉลี่ยเฉพาะโมเดลที่มีพารามิเตอร์ปรากฏ อีกทางเลือกหนึ่งค่าเฉลี่ย 'เต็ม' จะถือว่าตัวแปรรวมอยู่ในทุกรุ่น แต่ในบางรุ่นค่าสัมประสิทธิ์ที่สอดคล้องกัน (และความแปรปรวนตามลำดับ) จะถูกตั้งค่าเป็นศูนย์ ซึ่งแตกต่างจาก 'ค่าเฉลี่ยเซ็ตย่อย' มันไม่มีแนวโน้มที่จะให้น้ำหนักค่าที่อยู่ห่างจากศูนย์ ค่าเฉลี่ย 'เต็ม' เป็นประเภทของตัวประมาณการหดตัวและสำหรับตัวแปรที่มีความสัมพันธ์ที่อ่อนแอต่อการตอบสนองพวกเขาจะเล็กกว่าตัวประมาณ 'เซตย่อย'

หากคุณต้องการใช้ชุดย่อยของแบบจำลอง (ขึ้นอยู่กับ delta AIC เป็นต้น) ให้ใช้อาร์กิวเมนต์ชุดย่อยใน model.avg () คุณจะยังคงได้รับการประเมินตามเงื่อนไขและครบถ้วนตราบใดที่แบบจำลองที่รวมอยู่นั้นขาดตัวแปรบางตัวที่คนอื่นมี


ใช่. ฉันเห็นด้วย. นั่นคือการตีความที่เหมาะสม
นักนิเวศวิทยา
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.