ยังไม่ได้พยายามเก็บข้อมูลเพื่อคาดการณ์ แต่ปรีชาญาณของฉันคือการแก้ไขค่า covariances ให้เป็นศูนย์ในแบบจำลองของคุณนั้นคล้ายคลึงกับการทำนาย DV โดยการรวมชุดของสมการถดถอยเชิงเส้นเดียว -iv ซึ่งแตกต่างจากวิธีการนี้บัญชีถดถอยหลายรายการสำหรับความแปรปรวนร่วมใน IV เมื่อสร้างแบบจำลองของสมการเพื่อทำนาย DV สิ่งนี้จะช่วยเพิ่มความสามารถในการตีความได้อย่างชัดเจนโดยแยกผลกระทบโดยตรงจากผลกระทบทางอ้อมที่เกิดขึ้นทั้งหมดภายในชุดของ IV สุจริตฉันไม่แน่ใจว่าสิ่งนี้จำเป็นต้องปรับปรุงการทำนายของ DV แม้ว่า ในฐานะผู้ใช้สถิติและไม่ใช่นักสถิติฉันได้รวมฟังก์ชันการทดสอบการจำลองต่อไปนี้เพื่อให้คำตอบที่ไม่สมบูรณ์ (เห็นได้ชัดว่า "ใช่ความแม่นยำในการทำนายจะปรับปรุงเมื่อแบบจำลองประกอบด้วยความแปรปรวนร่วม IV") ในกรณีนี้
simtestit=function(Sample.Size=100,Iterations=1000,IV.r=.3,DV.x.r=.4,DV.z.r=.4) {
require(psych); output=matrix(NA,nrow=Iterations,ncol=6); for(i in 1:Iterations) {
x=rnorm(Sample.Size); z=rnorm(Sample.Size)+x*IV.r
y=rnorm(Sample.Size)+x*DV.x.r+z*DV.z.r
y.predicted=x*lm(y~x+z)$coefficients[2]+z*lm(y~x+z)$coefficients[3]
bizarro.y.predicted=x*lm(y~x)$coefficients[2]+z*lm(y~z)$coefficients[2]
output[i,]=c(cor(y.predicted,y)^2,cor(bizarro.y.predicted,y)^2,
cor(y.predicted,y)^2>cor(bizarro.y.predicted,y)^2,cor(x,z),cor(x,y),cor(y,z))}
list(output=output,percent.of.predictions.improved=100*sum(output[,3])/Iterations,
mean.improvement=fisherz2r(mean(fisherz(output[,1])-fisherz(output[,2]))))}
# Wrapping the function in str( ) gives you the gist without filling your whole screen
str(simtestit())
N= Iterations
nSample.Size
z
= x
+y
= x
+ z
+y
x
z
1y.predicted
2bizarro.y.predicted
output
Iterations
R2121>2rx
y
z
output
simtestit()
str( )
R21rpsych
R2R2IV.r
) มีขนาดใหญ่กว่า เนื่องจากคุณอาจคุ้นเคยกับฟังก์ชั่น GLM มากกว่าที่ฉันเป็น (ซึ่งไม่ใช่ทั้งหมด) คุณอาจเปลี่ยนฟังก์ชั่นนี้หรือใช้แนวคิดพื้นฐานเพื่อเปรียบเทียบการทำนาย GLM ใน IV ที่คุณต้องการโดยไม่มีปัญหามากเกินไป สมมติว่าจะ (หรือไม่) กลายเป็นแบบเดียวกันดูเหมือนว่าคำตอบพื้นฐานสำหรับคำถามที่สองของคุณน่าจะใช่ แต่ก็ขึ้นอยู่กับว่าความอุดมสมบูรณ์ของ IV เป็นอย่างมาก ความแตกต่างในการสุ่มตัวอย่างข้อผิดพลาดระหว่างข้อมูลที่ถูกดึงออกมาและข้อมูลที่ใช้เพื่อให้พอดีกับแบบจำลองอาจทำให้การปรับปรุงในความแม่นยำในการทำนายของมันอยู่ในชุดข้อมูลหลังเนื่องจากการปรับปรุงอีกครั้งดูเหมือนจะมีขนาดเล็ก กรณีพื้นฐานที่สุดที่มีเพียงสอง IV)