คำถามติดแท็ก multiple-regression

การถดถอยที่มีตัวแปรอิสระไม่คงที่สองตัวหรือมากกว่า

1
R / mgcv: เพราะเหตุใดผลิตภัณฑ์ te () และ ti () เทนเซอร์จึงให้พื้นผิวที่แตกต่างกัน
mgcvแพคเกจสำหรับการRมีสองฟังก์ชั่นสำหรับการปฏิสัมพันธ์กระชับเมตริกซ์ผลิตภัณฑ์: และte() ti()ฉันเข้าใจการแบ่งขั้นพื้นฐานของการใช้แรงงานระหว่างคนทั้งสอง (ปรับให้เหมาะสมกับการทำงานแบบไม่เป็นเชิงเส้นเปรียบเทียบกับการย่อยสลายการโต้ตอบนี้เป็นผลกระทบหลักและการโต้ตอบ) สิ่งที่ฉันไม่เข้าใจคือสาเหตุte(x1, x2)และti(x1) + ti(x2) + ti(x1, x2)อาจให้ผลลัพธ์ที่แตกต่าง (เล็กน้อย) MWE (ดัดแปลงมาจาก?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
สูตร y ~ x + 0 ใน R คำนวณอะไรจริง ๆ
ความแตกต่างทางสถิติระหว่างการทำการถดถอยเชิงเส้นใน R กับformulaชุดเป็นy ~ x + 0แทนที่จะเป็นy ~ xอะไร? ฉันจะตีความผลลัพธ์ที่แตกต่างกันสองแบบได้อย่างไร

2
จะทำการวิเคราะห์ส่วนที่เหลือสำหรับตัวทำนายอิสระไบนารี / คู่ในการถดถอยเชิงเส้นได้อย่างไร?
ฉันกำลังดำเนินการถดถอยเชิงเส้นหลายครั้งด้านล่างใน R เพื่อทำนายผลตอบแทนของกองทุนที่จัดการ reg <- lm(formula=RET~GRI+SAT+MBA+AGE+TEN, data=rawdata) GRI & MBA เท่านั้นที่นี่เป็นตัวทำนายแบบไบนารี / สองขั้ว ตัวพยากรณ์ที่เหลืออยู่จะต่อเนื่อง ฉันใช้รหัสนี้เพื่อสร้างแปลงที่เหลือสำหรับตัวแปรไบนารี plot(rawdata$GRI, reg$residuals) abline(lm(reg$residuals~rawdata$GRI, data=rawdata), col="red") # regression line (y~x) plot(rawdata$MBA, reg$residuals) abline(lm(reg$residuals~rawdata$MBA, data=rawdata), col="red") # regression line (y~x) คำถามของฉัน: ฉันรู้วิธีตรวจพล็อตที่เหลือสำหรับตัวทำนายอย่างต่อเนื่อง แต่คุณจะทดสอบสมมติฐานของการถดถอยเชิงเส้นเช่น homoscedasticity อย่างไรเมื่อตัวแปรอิสระเป็นไบนารี แปลงที่เหลือ:

4
เส้นตรงในแนวทแยงในส่วนที่เหลือเทียบกับพล็อตค่าติดตั้งสำหรับการถดถอยหลายครั้ง
ฉันกำลังสังเกตรูปแบบแปลก ๆ ที่เหลืออยู่สำหรับข้อมูลของฉัน: [แก้ไข] นี่คือพล็อตการถดถอยบางส่วนสำหรับตัวแปรสองตัว: [EDIT2] เพิ่มแผนการของ PP การกระจายดูเหมือนจะทำได้ดี (ดูด้านล่าง) แต่ฉันไม่มีเงื่อนงำที่เส้นตรงนี้อาจมาจาก ความคิดใด ๆ [อัพเดท 31.07] มันกลับกลายเป็นว่าคุณพูดถูกฉันมีหลายกรณีที่จำนวนทวีตซ้ำเป็น 0 อย่างแน่นอนและ 15 รายนี้ส่งผลให้มีรูปแบบที่เหลือแปลก ๆ ส่วนที่เหลือดูดีขึ้นมากในขณะนี้: ฉันได้รวมการถดถอยบางส่วนเข้ากับเส้นเหลือง

3
ทำไมคนเราถึงใช้อายุที่เท่ากันในการศึกษาความสัมพันธ์ทางพันธุกรรม?
ทำไมคนเราถึงใช้อายุและอายุเท่ากันในการศึกษาความสัมพันธ์ทางพันธุกรรม? ฉันสามารถเข้าใจการใช้อายุถ้ามันได้รับการระบุว่าเป็นตัวแปรสำคัญ

3
ปัญหาเกี่ยวกับการเข้ารหัสแบบร้อนและการเข้ารหัสแบบจำลอง
ฉันตระหนักถึงความจริงที่ว่าตัวแปรเด็ดขาดที่มีระดับ k ควรถูกเข้ารหัสด้วยตัวแปร k-1 ในการเข้ารหัสดัมมี่ (คล้ายกับตัวแปรเด็ดขาดหลายค่า) ฉันสงสัยว่าปัญหาหนึ่งเกิดขึ้นกับการเข้ารหัสแบบร้อนแรงเพียงใด (เช่นการใช้ตัวแปร k แทน) ผ่านการเข้ารหัสแบบจำลองสำหรับวิธีการถดถอยที่แตกต่างกันส่วนใหญ่เป็นการถดถอยเชิงเส้นการถดถอยเชิงเส้นที่ถูกลงโทษ (Lasso, Ridge, ElasticNet) เครื่องเร่งการไล่ระดับสี) ฉันรู้ว่าในการถดถอยเชิงเส้นปัญหาความหลากหลายเชิงเส้นเกิดขึ้น (แม้ว่าในทางปฏิบัติฉันได้ติดตั้งการถดถอยเชิงเส้นโดยใช้ OHE โดยไม่มีปัญหาใด ๆ ) อย่างไรก็ตามการเข้ารหัสแบบจำลองไม่จำเป็นต้องใช้ในพวกเขาทั้งหมดและผลลัพธ์ที่ได้จะผิดไปอย่างไรหากใช้การเข้ารหัสแบบร้อนแรง? การมุ่งเน้นของฉันอยู่ที่การคาดการณ์ในตัวแบบการถดถอยที่มีตัวแปรหมวดหมู่ (ความสำคัญสูง) จำนวนมากดังนั้นฉันจึงไม่สนใจช่วงความมั่นใจ

2
B-Splines VS พหุนามลำดับสูงในการถดถอย
ฉันไม่มีตัวอย่างหรืองานเฉพาะในใจ ฉันเพิ่งใหม่ในการใช้ b-splines และฉันต้องการทำความเข้าใจกับฟังก์ชันนี้ในบริบทการถดถอย สมมติว่าเราต้องการที่จะประเมินความสัมพันธ์ระหว่างตัวแปรตอบสนองและพยากรณ์บางx 1 , x 2 , . . , xพี ตัวทำนายประกอบด้วยตัวแปรตัวเลขบางตัวและตัวแปรบางตัวyyyx1,x2,...,xpx1,x2,...,xpx_1, x_2,...,x_p สมมติว่าหลังจากปรับโมเดลการถดถอยแล้วหนึ่งในตัวแปรตัวเลขเช่นนั้นมีความสำคัญ ตรรกะขั้นตอนหลังจากนั้นคือการประเมินว่าคำสั่งชื่อพหุนามที่สูงขึ้นเช่น: x 2 1และx 3 1จะต้องอธิบายความสัมพันธ์อย่างเพียงพอโดยไม่ต้อง overfittingx1x1x_1x21x12x_1^2x31x13x_1^3 คำถามของฉันคือ: คุณเลือกจุดไหนระหว่าง b-splines หรือพหุนามคำสั่งที่สูงขึ้นอย่างง่าย เช่นใน R: y ~ poly(x1,3) + x2 + x3 VS y ~ bs(x1,3) + x2 + x3 คุณจะใช้พล็อตเพื่อแจ้งการเลือกระหว่างสองสิ่งนี้กับสิ่งที่เกิดขึ้นได้อย่างไรหากไม่ชัดเจนจากพล็อต (เช่น: เนื่องจากจุดข้อมูลจำนวนมาก) คุณจะประเมินเงื่อนไขการโต้ตอบแบบสองทางระหว่างและสมมุติว่าx 3x2x2x_2x3x3x_3 …

2
ค่าเฉลี่ยความหมายแบบมีเงื่อนไขหมายถึงความเป็นกลางและความสอดคล้องของตัวประมาณค่า OLS
พิจารณาโมเดลการถดถอยหลายแบบต่อไปนี้:Y=Xβ+Zδ+U.(1)(1)Y=Xβ+Zδ+U.Y=X\beta+Z\delta+U.\tag{1} นี่คือคือคอลัมน์เวกเตอร์ aเมทริกซ์ ; aคอลัมน์เวกเตอร์ aเมทริกซ์; aเวกเตอร์คอลัมน์; และ , ข้อผิดพลาด, เวกเตอร์คอลัมน์YYYn×1n×1n\times 1XXXn×(k+1)n×(k+1)n\times (k+1)ββ\beta(k+1)×1(k+1)×1(k+1)\times 1ZZZn×ln×ln\times lδδ\deltal×1l×1l\times 1UUUn×1n×1n\times1 คำถาม อาจารย์ของฉันหนังสือแนะนำเศรษฐมิติฉบับที่ 3 โดย James H. Stock and Mark W. Watson, p. 281 และเศรษฐมิติ: Honor's Exam Review Session (PDF) , p. 7 ได้แสดงต่อไปนี้กับฉัน หากเราถือว่าสิ่งที่เรียกว่าความเป็นอิสระแบบมีเงื่อนไขซึ่งตามคำจำกัดความหมายความว่าE(U|X,Z)=E(U|Z),(2)(2)E(U|X,Z)=E(U|Z),E(U|X,Z)=E(U|Z),\tag{2} และถ้าการสันนิษฐานของสี่เหลี่ยมจัตุรัสน้อยที่สุดเป็นไปตามเงื่อนไขยกเว้นค่าศูนย์ที่เป็นเงื่อนไข (ดังนั้นเราจึงถือว่า ) (ดู 1 -3 ด้านล่าง),E(U|X,Z)=0E(U|X,Z)=0E(U|X,Z)=0E(U|X,Z)=E(U|Z)≠0E(U|X,Z)=E(U|Z)≠0E(U|X,Z)=E(U|Z) \neq 0 จากนั้นตัวประมาณ …

1
ชี้แจงเกี่ยวกับการอ่านคำย่อ
ต่อไปนี้เป็น Nomogram ที่สร้างขึ้นจากชุดข้อมูล mtcars พร้อมแพ็กเกจ rms สำหรับสูตร: mpg ~ wt + am + qsec ตัวแบบนั้นดูดีด้วย R2 ที่ 0.85 และ P <0.00001 > mod Linear Regression Model ols(formula = mpg ~ wt + am + qsec, data = mtcars) Model Likelihood Discrimination Ratio Test Indexes Obs 32 LR chi2 60.64 R2 …

2
วิธีรับตาราง ANOVA พร้อมข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพ?
ฉันใช้การถดถอย OLS แบบรวมกลุ่มโดยใช้แพ็คเกจ plm ใน R แม้ว่าคำถามของฉันจะเกี่ยวกับสถิติพื้นฐานมากขึ้นดังนั้นฉันจึงลองโพสต์ที่นี่ก่อน) เนื่องจากผลการถดถอยของฉันให้ผลตกค้างแบบ heteroskedastic ฉันต้องการลองใช้ข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพแบบ เป็นผลมาจากcoeftest(mod, vcov.=vcovHC(mod, type="HC0"))ฉันได้รับตารางที่มีการประมาณการข้อผิดพลาดมาตรฐานค่า t และค่า p สำหรับตัวแปรอิสระแต่ละตัวซึ่งโดยทั่วไปแล้วเป็นผลการถดถอยที่ "แข็งแกร่ง" ของฉัน สำหรับการพูดคุยถึงความสำคัญของตัวแปรต่าง ๆ ฉันต้องการพล็อตการแบ่งปันความแปรปรวนที่อธิบายโดยตัวแปรอิสระแต่ละตัวดังนั้นฉันต้องการผลรวมกำลังสองตามลำดับ อย่างไรก็ตามการใช้ฟังก์ชั่นaov()ฉันไม่รู้ว่าจะบอกให้ R ใช้ข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพได้อย่างไร ตอนนี้คำถามของฉันคือฉันจะรับตาราง ANOVA / ผลรวมของกำลังสองที่อ้างถึงข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพได้อย่างไร เป็นไปได้หรือไม่ที่จะคำนวณตามตาราง ANOVA จากการถดถอยด้วยข้อผิดพลาดมาตรฐานปกติ แก้ไข: กล่าวอีกนัยหนึ่งและไม่สนใจปัญหา R- ของฉัน: หาก Rไม่ได้รับผลกระทบจากการใช้ข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพการสนับสนุนที่เกี่ยวข้องเพื่ออธิบายความแปรปรวนโดยตัวแปรอธิบายที่แตกต่างกันจะไม่เปลี่ยนแปลงหรือไม่22^2 แก้ไข: ใน R aov(mod)ให้ตาราง ANOVA ที่ถูกต้องสำหรับ panelmodel (plm) จริงหรือไม่?

2
การถดถอยหลายครั้งและการเปรียบเทียบหลายรายการ
ว่าฉันพอดีกับการถดถอยหลายตัวแปร p อธิบาย การทดสอบ t จะช่วยให้ฉันตรวจสอบว่าหนึ่งในนั้นมีความสำคัญ ( ) ฉันสามารถทำการทดสอบ F บางส่วนเพื่อตรวจสอบว่าเซตย่อยบางชุดมีความสำคัญหรือไม่ ( )H 0 : β ฉัน = β J = . . = β k = 0H0: βผม= 0H0:βi=0H_0: \beta_i = 0H0: βผม= βJ= . . . = βk= 0H0:βi=βj=...=βk=0H_0: \beta_i=\beta_j=...=\beta_k=0 สิ่งที่ฉันมักจะเห็นก็คือบางคนได้รับ 5 p-values ​​จาก 5 t-tests (สมมติว่าพวกเขามี covariates …

3
ความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรอธิบายในการถดถอยพหุคูณ
ฉันกำลังอ่านบทการถดถอยหลายบทของการวิเคราะห์ข้อมูลและกราฟิกโดยใช้ R: วิธีการแบบอิงตัวอย่างและสับสนเล็กน้อยที่พบว่ามันแนะนำให้ตรวจสอบความสัมพันธ์เชิงเส้นระหว่างตัวแปรอธิบาย (ใช้แบบกระจาย) และในกรณีที่เกิดขึ้น ' t ใด ๆ เปลี่ยนพวกเขาจึงไม่กลายเป็นที่เกี่ยวข้องกับเส้นตรง นี่คือข้อความที่ตัดตอนมาบางส่วนของนี้: 6.3 กลยุทธ์สำหรับการปรับโมเดลการถดถอยหลายแบบ ( ... ) ตรวจสอบ scatterplot matrix ที่เกี่ยวข้องกับตัวแปรอธิบายทั้งหมด (รวมถึงตัวแปรตามคือ ณ ตอนนี้ทางเลือก ) มองหาหลักฐานของการไม่เป็นเชิงเส้นในแปลงของตัวแปรอธิบายซึ่งกันและกัน ( ... ) จุดนี้จะระบุกลยุทธ์รูปแบบการค้นหา - แสวงหารูปแบบซึ่งในความสัมพันธ์ระหว่างตัวแปรถดถอยอธิบายตาม "ง่าย" รูปแบบเชิงเส้น ดังนั้นถ้าบางแปลงคู่แสดงหลักฐานของการไม่เชิงเส้นพิจารณาการใช้ของการเปลี่ยนแปลง (s) เพื่อให้มากขึ้นเกือบเชิงเส้นความสัมพันธ์ แม้ว่ามันอาจจะไม่สามารถพิสูจน์ได้ว่าเป็นไปได้ตามกลยุทธ์นี้เพื่อสร้างแบบจำลองความสัมพันธ์การถดถอยอย่างเพียงพอ แต่นี่เป็นกลยุทธ์ที่ดีสำหรับเหตุผลที่ให้ไว้ด้านล่างเพื่อติดตามในการเริ่มการค้นหา ( ... ) หากความสัมพันธ์ระหว่างตัวแปรอธิบายเป็นเส้นตรงประมาณบางทีหลังจากการเปลี่ยนแปลงมันก็เป็นไปได้ที่จะตีความแปลงของตัวแปรทำนายกับตัวแปรตอบสนองด้วยความมั่นใจ ( ... ) อาจไม่สามารถค้นหาการเปลี่ยนแปลงของตัวแปรอธิบายอย่างน้อยหนึ่งตัวที่รับรองความสัมพันธ์ (คู่) ที่แสดงในพาเนลปรากฏเป็นเส้นตรง สิ่งนี้สามารถสร้างปัญหาได้ทั้งสำหรับการตีความแผนการวินิจฉัยสำหรับสมการการถดถอยที่เหมาะสมและการตีความสัมประสิทธิ์ในสมการที่พอดี ดู …

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

4
เหตุใดจึงต้องใช้ตัวแปรควบคุมในส่วนที่แตกต่าง
ฉันมีคำถามเกี่ยวกับวิธีแยกความแตกต่างด้วยสมการมาตรฐานต่อไปนี้: โดยที่ treat เป็นตัวแปรจำลองสำหรับกลุ่มและโพสต์ที่ได้รับการรักษา y=a+b1treat+b2post+b3treat⋅post+uy=a+b1treat+b2post+b3treat⋅post+u y= a + b_1\text{treat}+ b_2\text{post} + b_3\text{treat}\cdot\text{post} + u ตอนนี้คำถามของฉันง่าย: ทำไมกระดาษส่วนใหญ่ยังคงใช้ตัวแปรควบคุมเพิ่มเติม? ฉันคิดว่าหากการคาดการณ์แนวโน้มแบบขนานนั้นถูกต้องเราไม่ควรกังวลเกี่ยวกับการควบคุมเพิ่มเติม ฉันคิดเพียง 2 เหตุผลที่เป็นไปได้ว่าทำไมถึงใช้ตัวแปรควบคุม: หากไม่มีพวกเขาแนวโน้มจะไม่ขนานกัน เนื่องจากสเปค DnD นั้นมีความแตกต่างในแนวโน้มระหว่างกลุ่มการรักษาและกลุ่มควบคุม ณ เวลาที่ทำการรักษากับการแทรกแซง (เช่นคำศัพท์ที่ปฏิบัติต่อการรักษา * โพสต์) - เมื่อเราไม่ได้ควบคุมตัวแปรอื่น ๆ สัมประสิทธิ์ของการโต้ตอบอาจจบลง - / understated มีใครบ้างไหมที่ให้ความกระจ่างเกี่ยวกับปัญหานี้ เหตุผลของฉัน 1) หรือ 2) สมเหตุสมผลไหม? ฉันไม่เข้าใจการใช้ตัวแปรควบคุมใน DnD อย่างสมบูรณ์

1
การโต้ตอบของคำอิสระและไม่เป็นอิสระหมายความว่าอย่างไร
ถ้าฉันพอดีข้อมูลของฉันกับสิ่งที่ชอบlm(y~a*b)ในไวยากรณ์ R ซึ่งaเป็นตัวแปรไบนารีและbเป็นตัวแปรตัวเลขa:bคำศัพท์การโต้ตอบคือความแตกต่างระหว่างความชันของy~bที่a= 0 และที่a= 1 ตอนนี้สมมติว่าความสัมพันธ์ระหว่างyและbคือ curvilinear ถ้าตอนนี้ผมพอดีlm(y~a*poly(b,2))แล้วa:poly(b,2)1คือการเปลี่ยนแปลงในการเปลี่ยนแปลงที่y~bมีเงื่อนไขในระดับaดังกล่าวข้างต้นและa:poly(b,2)2การเปลี่ยนแปลงในเงื่อนไขในระดับของy~b^2 aต้องใช้การถักด้วยมือ แต่หากค่าสัมประสิทธิ์การโต้ตอบแตกต่างจากศูนย์อย่างใดอย่างหนึ่งฉันสามารถยืนยันได้ว่ามันหมายถึงaไม่เพียง แต่ส่งผลกระทบในแนวดิ่งyแต่ยังรวมถึงตำแหน่งของจุดสูงสุดและความชันของความy~b+b^2โค้ง แล้วถ้าฉันพอดีlm(y~a*bs(b,df=3))ล่ะ ฉันจะตีความอย่างไรa:bs(b,df=3)1, a:bs(b,df=3)2และa:bs(b,df=3)3เงื่อนไข? การกระจัดตามแนวดิ่งของyเส้นโค้งเหล่านี้เกิดจากaที่แต่ละส่วนในสามส่วนหรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.