การจำลองข้อมูลให้พอดีกับรูปแบบสื่อกลาง


9

ฉันสนใจที่จะค้นหาขั้นตอนเพื่อจำลองข้อมูลที่สอดคล้องกับรูปแบบการไกล่เกลี่ยที่ระบุ ตามการเชิงเส้นกรอบโครงสร้างโมเดลสมการทั่วไปสำหรับการทดสอบแบบจำลองการไกล่เกลี่ยที่ระบุไว้เป็นครั้งแรกโดยBarron และเคนนี (1986)และอธิบายอื่น ๆ เช่นจัดด์ Yzerbyt และมุลเลอร์ (2013) , รุ่นไกล่เกลี่ยสำหรับผลคนกลาง\ newcommand {\ med} {\ rm med} \ medและตัวทำนายXและอยู่ภายใต้สมการการถดถอยสามแบบต่อไปนี้: \ start {align} Y & = b_ {11} + b_ {12} X + e_1 \ tag {1} \\ \ med & = b_ {21} + b_ {22} X + e_2 \ tag {2} \\ Y & = b_ {31} + b_ {32} X + b_ {32} \ med + e_3 \ tag {3} \ end {} ชิดYmedX

(1)Y=b11+b12X+e1(2)med=b21+b22X+e2(3)Y=b31+b32X+b32med+e3
ผลกระทบทางอ้อมหรือผลการไกล่เกลี่ยของXในYผ่านmedสามารถกำหนดเป็นb22b32หรือเท่ากันเป็นb12b32{32} ภายใต้กรอบการทดสอบแบบเก่าสำหรับการไกล่เกลี่ยการไกล่เกลี่ยได้ถูกสร้างขึ้นโดยการทดสอบb12ในสมการ 1, b22ในสมการ 2 และb32ในสมการ 3

จนถึงตอนนี้ฉันได้พยายามจำลองค่าของmedและYที่สอดคล้องกับค่าของสัมประสิทธิ์การถดถอยต่างๆที่ใช้rnormในRเช่นรหัสด้านล่าง:

x   <- rep(c(-.5, .5), 50)
med <- 4 + .7 * x + rnorm(100, sd = 1) 

# Check the relationship between x and med
mod <- lm(med ~ x)
summary(mod)

y <- 2.5 + 0 * x + .4 * med + rnorm(100, sd = 1)

# Check the relationships between x, med, and y
mod <- lm(y ~ x + med)
summary(mod)

# Check the relationship between x and y -- not present
mod <- lm(y ~ x)
summary(mod)

อย่างไรก็ตามดูเหมือนว่าการสร้างและตามลำดับโดยใช้สมการที่ 2 และ 3 นั้นไม่เพียงพอเนื่องจากฉันไม่มีความสัมพันธ์ระหว่างและในสมการถดถอย 1 (ซึ่งเป็นแบบจำลองความสัมพันธ์แบบแบ่งสองส่วนอย่างง่ายระหว่างและ ) โดยใช้วิธีนี้ . สิ่งนี้มีความสำคัญเนื่องจากคำจำกัดความหนึ่งของผลกระทบทางอ้อม (เช่นการทำหน้าที่เป็นสื่อกลาง) คือดังที่ฉันได้อธิบายไว้ข้างต้นmedYXYXYb12b32

ทุกคนสามารถช่วยฉันค้นหาโพรซีเดอร์ใน R เพื่อสร้างตัวแปร ,และที่ตอบสนองข้อ จำกัด ที่ฉันตั้งไว้โดยใช้สมการ 1, 2 และ 3 ได้หรือไม่XmedY

คำตอบ:


4

ค่อนข้างตรงไปตรงมา เหตุผลที่คุณไม่มีความสัมพันธ์ระหว่างและโดยใช้วิธีการของคุณเป็นเพราะรหัส: xy

y <- 2.5 + 0 * x + .4 * med + rnorm(100, sd = 1)

หากคุณต้องการความสัมพันธ์ระหว่างและแม้ว่าจะรวม (นั่นคือคุณต้องการสื่อกลางบางส่วน ) คุณเพียงแค่ใช้ค่าที่ไม่เป็นศูนย์สำหรับแทน ตัวอย่างเช่นคุณสามารถแทนที่รหัสต่อไปนี้สำหรับด้านบน: xymedb32

y <- 2.5 + 3 * x + .4 * med + rnorm(100, sd = 1)

ดังนั้นถูกเปลี่ยนจากที่จะ3(แน่นอนว่าบางค่าเฉพาะอาจจะมีความเกี่ยวข้องมากขึ้นขึ้นอยู่กับสถานการณ์ของคุณฉันเพิ่งเลือกจากด้านบนของหัวของฉัน) b32033


แก้ไข:
ด้วยความเคารพร่อแร่ความสัมพันธ์เป็นไม่เป็นอย่างมีนัยสำคัญที่เป็นเพียงการทำงานของอำนาจทางสถิติ เนื่องจากแรงเชิงสาเหตุของถูกส่งผ่านทั้งหมดในการตั้งค่าดั้งเดิมของคุณคุณจึงมีพลังงานต่ำกว่าที่คุณอาจเป็นอย่างอื่น อย่างไรก็ตามผลกระทบยังคงเป็นจริงในบางแง่มุม เมื่อฉันรันโค้ดต้นฉบับของคุณ (หลังจากตั้งค่าเมล็ดโดยใช้เป็นค่าที่ฉันเพิ่งหยิบออกมาจากหัวของฉันอีกครั้ง) ฉันได้รับผลกระทบที่สำคัญ: xyxmed90

set.seed(90)
x <- rep(c(-.5, .5), 50)
med <- 4 + .7 * x + rnorm(100, sd = 1) 

# Check the relationship between x and med
mod <- lm(med ~ x)
summary(mod)

y <- 2.5 + 0 * x + .4 * med + rnorm(100, sd = 1)

# Check the relationships between x, med, and y
mod <- lm(y ~ x + med)
summary(mod)

# Check the relationship between x and y -- not present
mod <- lm(y ~ x)
summary(mod)

...
Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   3.8491     0.1151  33.431   <2e-16 ***
x             0.5315     0.2303   2.308   0.0231 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

...

เพื่อให้ได้พลังงานมากขึ้นคุณสามารถเพิ่มคุณกำลังใช้หรือใช้ค่าความผิดพลาดน้อยลง (เช่นใช้ค่าน้อยกว่าค่าเริ่มต้นในการโทร) Nsd=1rnorm()


gung ขอบคุณสำหรับคำตอบของคุณ ฉันคิดว่าคำถามของฉันอาจจะคลุมเครือเล็กน้อย สิ่งที่ฉันต้องการไม่ใช่ความสัมพันธ์ระหว่าง x และ y ในรุ่น 3 (ซึ่งเป็นสิ่งที่คุณทำ) แต่ในรุ่น 1 (Y = b11 + b12 * X + e1) ฉันได้ชี้แจงคำถามของฉันเกี่ยวกับผลกระทบนี้
Patrick S. Forscher

ขอบคุณสำหรับการแก้ไข เป็นไปได้หรือไม่ที่จะระบุขนาดของเอฟเฟกต์ประชากรสำหรับค่าสัมประสิทธิ์ b12 โดยตรง?
Patrick S. Forscher

คำถามของคุณ ณ จุดนี้คืออะไร: ความสัมพันธ์ของประชากรระหว่าง &โดยทั่วไปคืออะไร ฉันสงสัยว่าคำถามนั้นอาจถูกถามดีที่สุดเป็นคำถามใหม่เพราะฉันไม่แน่ใจว่าอยู่ด้านบนของหัวหรือไม่ ในกรณีที่ง่ายที่สุดโดยที่ตัวแปร 3 ตัวทั้งหมด ( , , ) จะถูกแจกจ่ายตามปกติและความสัมพันธ์ b / t &นั้นเป็นสื่อกลางอย่างสมบูรณ์แล้วy} แต่ก็มีความซับซ้อนมากขึ้นถ้าการกระจายจะไม่ปกติ (เช่นคุณเป็นความถี่ที่เท่ากันของ & ) หรือ w / สถานการณ์ mediational ที่ซับซ้อนมากขึ้นxyxmedyxyρx,y=ρx,medρmed,yx.5+.5
gung - Reinstate Monica

0

นี่คือบทความเกี่ยวกับวิธีจำลองแบบการไกล่เกลี่ยอย่างง่ายในCaron & Valois (2018) : มีรหัส R อยู่

  x <- rnorm(n)
  em <- sqrt(1-a^2)
  m <- a*x + em*rnorm(n)
  ey2 <- sqrt(ey)
  y <- cp*x + b*m + ey2*rnorm(n)
  data <- as.data.frame(cbind(x, m, y))

คุณเพียงแค่ต้องระบุ (ขนาดตัวอย่าง), ,และ (ผลกระทบโดยตรง) ข้อได้เปรียบที่นี่คือคุณจะจำลองสัมประสิทธิ์มาตรฐานเพื่อให้คุณทราบขนาดของเอฟเฟกต์ พวกเขายังรวมถึงรหัสที่ไม่ได้มาตรฐานพกพา Baron & Kenny, Sobel และ Bca bootstrapnabc

อ้างอิง

Caron, P.-O. , & Valois, P. (2018) คำอธิบายการคำนวณของการวิเคราะห์การไกล่เกลี่ยอย่างง่าย วิธีเชิงปริมาณสำหรับจิตวิทยา, 14, 147-158 ดอย: 10.20982 / tqmp.14.2.p147

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.