เราสามารถเปรียบเทียบความสัมพันธ์ระหว่างกลุ่มโดยการเปรียบเทียบความชันถดถอยได้หรือไม่?


10

ในคำถามนี้พวกเขาถามวิธีเปรียบเทียบ Pearson r สำหรับกลุ่มอิสระสองกลุ่ม (เช่นเพศชายและหญิง) ตอบและแสดงความคิดเห็นแนะนำสองวิธี:

  1. ใช้สูตรที่รู้จักกันดีของฟิชเชอร์โดยใช้ "z-tranformation" ของ r;
  2. ใช้การเปรียบเทียบความชัน (สัมประสิทธิ์การถดถอย)

หลังสามารถทำได้อย่างง่ายดายเพียงแค่ผ่านโมเดลเชิงเส้นอิ่มตัว: Y=a+bX+cG+dXGที่ไหน X และ Y เป็นตัวแปรที่มีความสัมพันธ์และ Gเป็นตัวแปรดัมมี่ (0 vs 1) ที่ระบุถึงสองกลุ่ม ขนาดของd (ค่าสัมประสิทธิ์การโต้ตอบ) คือความแตกต่างของสัมประสิทธิ์ b หลังจากรูปแบบ Y=a+bX ดำเนินการในสองกลุ่มเป็นรายบุคคลและ (dความสำคัญ) จึงเป็นการทดสอบความแตกต่างของความชันระหว่างกลุ่ม

ทีนี้, ค่าความชันหรือการถดถอย ยังไม่เป็นความสัมพันธ์ที่มีค่า แต่ถ้าเราสร้างมาตรฐานX และ Y- แยกเป็นสองกลุ่ม - จากนั้นdจะเท่ากับความแตกต่างr ในกลุ่ม 1 ลบ r ในกลุ่ม 0และดังนั้นความสำคัญของมันจะทดสอบความแตกต่างระหว่างสองสหสัมพันธ์: เรากำลังทดสอบความลาดชัน แต่ปรากฏว่า [ราวกับ -?] เรากำลังทดสอบความสัมพันธ์กัน

ที่ฉันเขียนถูกต้องหรือไม่

ถ้าใช่มีคำถามที่เหลืออยู่ซึ่งเป็นการทดสอบความสัมพันธ์ที่ดีกว่า - อันนี้บรรยายหรือฟิชเชอร์เป็นคำถาม? สำหรับพวกเขาจะให้ผลลัพธ์ที่ไม่เหมือนกัน คุณคิดอย่างไร?

แก้ไขภายหลัง:ขอบคุณ@Wolfgangสำหรับคำตอบของเขาฉันยังคงรู้สึกพลาดการเข้าใจว่าทำไมการทดสอบของฟิชเชอร์จึงเป็นการทดสอบที่ถูกต้องมากกว่าวิธีเปรียบเทียบความลาดชัน - ต่ำกว่ามาตรฐานที่อธิบายไว้ข้างต้น ดังนั้นคำตอบเพิ่มเติมยินดีต้อนรับ ขอบคุณ.

คำตอบ:


10

ทุกสิ่งที่คุณเขียนนั้นถูกต้อง คุณสามารถทดสอบสิ่งต่าง ๆ เช่นนั้นได้โดยใช้ตัวอย่างของเล่น นี่คือตัวอย่างของ R:

library(MASS)

rho <- .5  ### the true correlation in both groups

S1 <- matrix(c( 1,   rho,   rho, 1), nrow=2)
S2 <- matrix(c(16, 4*rho, 4*rho, 1), nrow=2)

cov2cor(S1)
cov2cor(S2)

xy1 <- mvrnorm(1000, mu=c(0,0), Sigma=S1)
xy2 <- mvrnorm(1000, mu=c(0,0), Sigma=S2)

x <- c(xy1[,1], xy2[,1])
y <- c(xy1[,2], xy2[,2])
group <- c(rep(0, 1000), rep(1, 1000))

summary(lm(y ~ x + group + x:group))

สิ่งที่คุณจะพบว่าการโต้ตอบนั้นสำคัญมากแม้ว่าความสัมพันธ์ที่แท้จริงจะเหมือนกันในทั้งสองกลุ่ม ทำไมถึงเกิดขึ้น? เพราะค่าสัมประสิทธิ์การถดถอยแบบดิบในทั้งสองกลุ่มนั้นไม่เพียง แต่สะท้อนถึงความแข็งแกร่งของสหสัมพันธ์ แต่ยังเป็นการปรับขนาดของ X (และ Y) ในทั้งสองกลุ่ม เนื่องจากการขยายเหล่านั้นแตกต่างการโต้ตอบจึงมีความสำคัญ นี่เป็นประเด็นสำคัญเนื่องจากบ่อยครั้งที่เชื่อกันว่าการทดสอบความแตกต่างในความสัมพันธ์คุณเพียงแค่ต้องทดสอบการทำงานร่วมกันในโมเดลด้านบน มาต่อกันที่:

summary(lm(xy2[,2] ~ xy2[,1]))$coef[2] - summary(lm(xy1[,2] ~ xy1[,1]))$coef[2]

สิ่งนี้จะแสดงให้คุณเห็นว่าความแตกต่างของสัมประสิทธิ์การถดถอยสำหรับโมเดลที่ติดตั้งแยกกันในสองกลุ่มจะให้ค่าเหมือนกับคำศัพท์ในการโต้ตอบ

สิ่งที่เราสนใจจริงๆคือความแตกต่างของความสัมพันธ์:

cor(xy1)[1,2]
cor(xy2)[1,2]
cor(xy2)[1,2] - cor(xy1)[1,2]

คุณจะพบว่าความแตกต่างนี้เป็นศูนย์ มาสร้างมาตรฐาน X และ Y ภายในสองกลุ่มแล้วปรับโมเดลเต็ม:

x <- c(scale(xy1[,1]), scale(xy2[,1]))
y <- c(scale(xy1[,2]), scale(xy2[,2]))
summary(lm(y ~ x + x:group - 1))

โปรดทราบว่าฉันไม่ได้รวมการสกัดกั้นหรือเอฟเฟกต์หลักของกลุ่มไว้ที่นี่เพราะมันเป็นศูนย์โดยคำจำกัดความ คุณจะพบว่าสัมประสิทธิ์สำหรับ x เท่ากับสหสัมพันธ์ของกลุ่ม 1 และสัมประสิทธิ์สำหรับการโต้ตอบเท่ากับความแตกต่างในความสัมพันธ์ของทั้งสองกลุ่ม

ตอนนี้สำหรับคำถามของคุณว่าจะดีกว่าหรือไม่ที่จะใช้วิธีนี้กับการทดสอบที่ใช้การแปลง r-to-z ของ Fisher

แก้ไข

ข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอยที่คำนวณได้เมื่อคุณกำหนดมาตรฐานค่า X และ Y ภายในกลุ่มจะไม่นำมาตรฐานนี้มาพิจารณา ดังนั้นจึงไม่ถูกต้อง ดังนั้น t-test สำหรับการโต้ตอบไม่ได้ควบคุมอัตราความผิดพลาด Type I อย่างเพียงพอ ฉันทำการศึกษาแบบจำลองเพื่อตรวจสอบสิ่งนี้ เมื่อไหร่ρ1=ρ2=0ดังนั้นข้อผิดพลาด Type I จะถูกควบคุม อย่างไรก็ตามเมื่อไหร่ρ1=ρ20จากนั้นข้อผิดพลาด Type I ของการทดสอบ t มีแนวโน้มที่จะอนุรักษ์มากเกินไป (กล่าวคือมันไม่ได้ปฏิเสธบ่อยครั้งเพียงพอสำหรับการทดสอบที่กำหนด αราคา). ในทางกลับกันการทดสอบที่ใช้การแปลง r-to-z ของฟิชเชอร์นั้นทำงานได้อย่างเพียงพอโดยไม่คำนึงถึงขนาดของความสัมพันธ์ที่แท้จริงในทั้งสองกลุ่ม (ยกเว้นเมื่อขนาดกลุ่มมีขนาดเล็กมากและความสัมพันธ์จริงในทั้งสองกลุ่ม เข้าใกล้มาก ๆ±1.

สรุป: หากคุณต้องการทดสอบความแตกต่างของสหสัมพันธ์ให้ใช้การแปลง r-to-z ของฟิชเชอร์และทดสอบความแตกต่างระหว่างค่าเหล่านั้น


การเปลี่ยนแปลงของฟิชเชอร์มีข้อได้เปรียบเหนือการทดสอบอื่นหรือไม่
mark999

ปรากฎว่าฉันเร็วไปหน่อย ดูการแก้ไขของฉัน หวังว่าจะตอบคำถามของคุณ
Wolfgang

ดังนั้น @ Wolfgang คุณถือได้ว่าวิธีการเปรียบเทียบความชัน - ต่ำกว่ามาตรฐานคือการเปรียบเทียบที่ถูกต้องของ r ทางเลือกที่มีชื่อเสียงของฟิชเชอร์เป็นจริงการประมาณของที่ ฉันเข้าใจคุณถูกไหม
ttnphns

ดูการแก้ไขของฉัน ฉันเร็วเกินไปกับบทสรุปเริ่มต้นของฉัน
Wolfgang

@Wolfgang ต่อมาแก้ไขการตอบกลับของคุณในการระบุว่า Fisher ดีกว่า วิธีการเปรียบเทียบความชัน - ต่ำกว่ามาตรฐานนั้นไม่เพียงพอเพราะ "ข้อผิดพลาดมาตรฐาน ... เมื่อคุณสร้างมาตรฐาน ... อย่านำมาตรฐานนี้มาพิจารณา" โปรดอธิบายฉันว่าพวกเขาควรคำนึงถึงมาตรฐานเพื่อให้วิธีการเปรียบเทียบความชัน - ต่ำกว่ามาตรฐานกลายเป็นวิธีการทดสอบฟิชเชอร์ที่ถูกต้อง
ttnphns
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.