คำถามติดแท็ก interaction

สถานการณ์ที่ผลกระทบของตัวแปรอธิบายอาจขึ้นอยู่กับมูลค่าของตัวแปรอธิบายอื่น

3
การโต้ตอบมีประโยชน์เฉพาะในบริบทของการถดถอยหรือไม่
ฉันมักจะอ่านคำว่าปฏิสัมพันธ์ในบริบทของการถดถอย เราควรพิจารณาปฏิสัมพันธ์กับรุ่นอื่นเช่น knn หรือ svm หรือไม่ หากมีฟีเจอร์ , 100หรือมากกว่าและปล่อยให้การสังเกต1,000ครั้งเป็นวิธีปกติในการค้นหาการโต้ตอบที่มีประโยชน์ ลองชุดค่าผสมทั้งหมดหรือไม่ หรือใช้เฉพาะชุดค่าผสมที่เหมาะสม505050100100100100010001000

2
วิธีการวาดพล็อตปฏิสัมพันธ์ที่มีช่วงความมั่นใจได้อย่างไร
ความพยายามของฉัน: ฉันไม่สามารถรับช่วงความมั่นใจได้ interaction.plot() และในทางตรงกันข้ามplotmeans()จากแพ็คเกจ 'gplot' จะไม่แสดงกราฟสองกราฟ นอกจากนี้ฉันไม่สามารถกำหนดplotmeans()กราฟสองกราฟที่ด้านบนของอีกอันหนึ่งได้เนื่องจากโดยค่าเริ่มต้นแกนจะแตกต่างกัน ฉันประสบความสำเร็จในการใช้plotCI()จากแพ็คเกจ 'gplot' และวางกราฟสองตัวไว้ แต่การจับคู่ของแกนยังไม่สมบูรณ์ คำแนะนำเกี่ยวกับวิธีการทำพล็อตการโต้ตอบกับช่วงความมั่นใจ? ทั้งโดยฟังก์ชั่นเดียวหรือคำแนะนำเกี่ยวกับวิธีการวางซ้อนplotmeans()หรือplotCI()กราฟ ตัวอย่างรหัส br=structure(list(tangle = c(140L, 50L, 40L, 140L, 90L, 70L, 110L, 150L, 150L, 110L, 110L, 50L, 90L, 140L, 110L, 50L, 60L, 40L, 40L, 130L, 120L, 140L, 70L, 50L, 140L, 120L, 130L, 50L, 40L, 80L, 140L, 100L, 60L, 70L, …

2
หนึ่งพล็อตจะต่อเนื่องโดยการโต้ตอบอย่างต่อเนื่องใน ggplot2 ได้อย่างไร
สมมติว่าฉันมีข้อมูล: x1 <- rnorm(100,2,10) x2 <- rnorm(100,2,10) y <- x1+x2+x1*x2+rnorm(100,1,2) dat <- data.frame(y=y,x1=x1,x2=x2) res <- lm(y~x1*x2,data=dat) summary(res) ฉันต้องการพล็อตแบบต่อเนื่องโดยการโต้ตอบแบบต่อเนื่องเช่นที่ x1 อยู่บนแกน X และ x2 แทนด้วย 3 เส้นเส้นหนึ่งซึ่งแทน x2 ที่ Z-score เป็น 0 หนึ่งที่ Z-+1 ที่ +1 Z-score ที่ -1 โดยแต่ละบรรทัดจะมีสีแยกกันและติดป้ายกำกับ ฉันจะทำสิ่งนี้โดยใช้ ggplot2 ได้อย่างไร ตัวอย่างเช่นอาจมีลักษณะเช่นนี้ (แต่แน่นอนว่ามีเส้นสีต่างกันแทนที่จะเป็นประเภทเส้นต่างกัน):

2
จะทำการเปรียบเทียบโพสต์เฉพาะกิจในคำที่ใช้โต้ตอบกับแบบจำลองเอฟเฟกต์ผสมได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูลเพื่อประเมินผลกระทบของการทำแห้งต่อกิจกรรมของจุลินทรีย์ในตะกอน มีวัตถุประสงค์เพื่อตรวจสอบว่าผลกระทบของการอบแห้งแตกต่างกันไปตามประเภทของตะกอนและ / หรือความลึกภายในตะกอนหรือไม่ การออกแบบการทดลองมีดังนี้: ตะกอนปัจจัยแรกสอดคล้องกับตะกอนสามประเภท (รหัส Sed1, Sed2, Sed3) สำหรับตะกอนแต่ละประเภทการสุ่มตัวอย่างดำเนินการในสามไซต์ (3 ไซต์สำหรับ Sed1, 3 ไซต์สำหรับ Sed2, 3 ไซต์สำหรับ Sed3) มีการเข้ารหัสเว็บไซต์ : ไซต์ 1, ไซต์ 2, ... , ไซต์ 9 ปัจจัยต่อไปคืออุทกวิทยา : ภายในแต่ละไซต์ทำการสุ่มตัวอย่างในพื้นที่แห้งและในแปลงเปียก (แปลงแห้ง / เปียก) ภายในแต่ละพล็อตก่อนหน้าการสุ่มตัวอย่างจะดำเนินการที่สองความลึก (D1, D2) เป็นสามเท่า มีทั้งหมด n = 108 ตัวอย่าง = 3 ตะกอน * 3 …

2
เป็นไปได้หรือไม่ที่จะมีตัวแปรที่ทำหน้าที่เป็นทั้งตัวปรับแต่งเอฟเฟกต์และ Confounder
เป็นไปได้หรือไม่ที่จะมีตัวแปรที่ทำหน้าที่เป็นทั้งตัวปรับเอฟเฟกต์ (การวัด) และตัวรบกวนสำหรับคู่ของความสัมพันธ์ผลลัพธ์ความเสี่ยงที่กำหนด ฉันยังไม่แน่ใจในความแตกต่างเล็กน้อย ฉันได้ดูสัญกรณ์กราฟิกเพื่อช่วยให้ฉันเข้าใจความแตกต่าง แต่ความแตกต่างของสัญกรณ์นั้นทำให้สับสน คำอธิบายกราฟิก / ภาพของทั้งสองและเมื่อพวกเขาอาจทับซ้อนกันจะเป็นประโยชน์

2
การวิเคราะห์โพสต์ - ฮอคที่ถูกต้องคืออะไรสำหรับการวัด ANOVA ซ้ำสามทาง?
ฉันได้ทำการทดสอบ ANOVA ซ้ำสามทาง การวิเคราะห์หลังการประชุมอะไรถูกต้อง? นี่คือการออกแบบที่สมดุลอย่างสมบูรณ์ (2x2x2) โดยมีปัจจัยหนึ่งที่มีการวัดซ้ำภายในวัตถุ ฉันตระหนักถึงวิธีการหลายตัวแปรในการวัด ANOVA ซ้ำ ๆ ใน R แต่สัญชาตญาณแรกของฉันคือดำเนินการในลักษณะ aov () ที่เรียบง่ายของ ANOVA: aov.repeated <- aov(DV ~ IV1 * IV2 * Time + Error(Subject/Time), data=data) DV = ตัวแปรตอบกลับ IV1 = ตัวแปรอิสระ 1 (2 ระดับ, A หรือ B) IV2 = ตัวแปรอิสระ 2 (2 ระดับ, ใช่หรือไม่) IV3 …

2
ในการถดถอยเชิงเส้นเหตุใดเราจึงควรรวมเทอมกำลังสองเมื่อเราสนใจเฉพาะเงื่อนไขการโต้ตอบ
สมมติว่าฉันสนใจโมเดลการถดถอยเชิงเส้นสำหรับ Yผม=β0+β1x1+β2x2+β3x1x2Yi=β0+β1x1+β2x2+β3x1x2Y_i = \beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2เพราะฉันต้องการดูว่าปฏิสัมพันธ์ระหว่าง covariates ทั้งสองมีผลต่อ Y หรือไม่ ในบันทึกรายวิชาของอาจารย์ (ซึ่งฉันไม่ได้ติดต่อด้วย) จะกล่าวถึง: เมื่อรวมถึงคำศัพท์เชิงโต้ตอบคุณควรรวมคำศัพท์ระดับปริญญาที่สองของพวกเขาไว้ด้วย กล่าวคือYผม=β0+β1x1+β2x2+β3x1x2+β4x21+β5x22Yi=β0+β1x1+β2x2+β3x1x2+β4x12+β5x22Y_i = \beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2 +\beta_4x_1^2 + \beta_5x_2^2 ควรรวมอยู่ในการถดถอย ทำไมหนึ่งควรรวมถึงข้อกำหนดระดับที่สองเมื่อเราสนใจเฉพาะการโต้ตอบ?

2
ฉันจะสร้างแบบจำลองการโต้ตอบระหว่างตัวแปรอธิบายได้อย่างไรเมื่อหนึ่งในนั้นอาจมีสมการกำลังสองและลูกบาศก์?
ฉันหวังเป็นอย่างยิ่งว่าฉันจะได้ใช้คำถามนี้ในลักษณะที่สามารถตอบได้อย่างชัดเจน - หากไม่ได้โปรดแจ้งให้เราทราบและฉันจะลองอีกครั้ง! ฉันควรเดาด้วยว่าฉันจะใช้ R สำหรับการวิเคราะห์เหล่านี้ ฉันมีหลายมาตรการplant performance (Ys)ที่ฉันสงสัยว่าได้รับอิทธิพลจากสี่รักษาผม imposed-- และflower thinning (X1), fertilization (X2), leaf clipping (X3) biased flower thinning (X4)สำหรับ Ys ที่เป็นไปได้ทั้งหมด N มีอย่างน้อย 242 ดังนั้นขนาดตัวอย่างของฉันจึงใหญ่ แผนการทั้งหมดถูกทำให้ผอมบางหรือไม่ แต่แต่ละแปลงก็ต้องมีหนึ่ง (และเพียงหนึ่ง) ของการรักษาอีกสาม (หรือไม่ - มีแผนการควบคุมด้วย) แนวคิดของการออกแบบนี้คือการทดสอบว่าอีกสามวิธีการรักษามีความสามารถในการ "กำบัง" หรือ "การเสริมสร้าง" ผลของการทำให้ผอมบาง ดังนั้นด้วยการออกแบบการรักษาทั้งสามหลัง (X2-X4) จึงไม่สามารถโต้ตอบกันได้เพราะพวกเขาไม่ได้ถูกข้าม แต่พวกเขาแต่ละคนสามารถโต้ตอบกับการทำให้ผอมบางของดอกไม้ - และพวกเขาอาจทำ สมมติฐานที่ชัดเจนของฉันคือ 1) การทำให้ผอมบางดอกจะมีนัยสำคัญและ 2) …

1
การตีความค่าสัมประสิทธิ์ของการโต้ตอบระหว่างตัวแปรเด็ดขาดและตัวแปรต่อเนื่อง
ฉันมีคำถามเกี่ยวกับการตีความค่าสัมประสิทธิ์ของการโต้ตอบระหว่างตัวแปรแบบต่อเนื่องและหมวดหมู่ นี่คือแบบจำลองของฉัน: model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), data=base_708) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 21.4836 2.0698 10.380 < 2e-16 *** lg_hag 8.5691 3.7688 2.274 0.02334 * raceblack -8.4715 1.7482 -4.846 1.61e-06 *** racemexican -3.0483 1.7073 -1.785 0.07469 . racemulti/other -4.6002 2.3098 -1.992 0.04687 * pdg 2.8038 0.4268 6.570 1.10e-10 *** sexfemale 4.5691 …

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
การถดถอยเชิงเส้นกับปัจจัยใน R
ฉันพยายามที่จะเข้าใจว่าปัจจัยการทำงานในอาร์ว่ากันว่าฉันต้องการที่จะเรียกใช้การถดถอยโดยใช้ข้อมูลตัวอย่างบางอย่างใน R: > data(CO2) > colnames(CO2) [1] "Plant" "Type" "Treatment" "conc" "uptake" > levels(CO2$Type) [1] "Quebec" "Mississippi" > levels(CO2$Treatment) [1] "nonchilled" "chilled" > lm(uptake ~ Type + Treatment, data = CO2) Call: lm(formula = uptake ~ Type + Treatment, data = CO2) Coefficients: (Intercept) TypeMississippi Treatmentchilled 36.97 -12.66 -6.86 ฉันเข้าใจว่าTypeMississippiและTreatmentchilledได้รับการปฏิบัติเหมือนเป็นบูลีน: …

2
คำศัพท์เชิงบวกหมายถึงความสัมพันธ์ระหว่างตัวแปรที่เป็นองค์ประกอบหรือไม่?
สมมติว่าฉันใช้การถดถอยเชิงเส้นที่มีรูปแบบy=β0+β1A+β2B+β3AB+ϵy=β0+β1A+β2B+β3AB+ϵy = \beta_0 + \beta_1A+\beta_2B+\beta_3AB +\epsilon. ถ้า β3β3\beta_3 เป็นค่าบวกนี่หมายความถึงความสัมพันธ์เชิงบวกระหว่าง AAA และ BBB? (ตรงกันข้ามความสัมพันธ์เชิงลบถ้าβ3β3\beta_3 เป็นลบหรือไม่)

4
ช่วยแปลพล็อตปฏิสัมพันธ์หรือไม่
ฉันมีปัญหาในการตีความแผนการโต้ตอบเมื่อมีการโต้ตอบระหว่างตัวแปรอิสระสองตัว กราฟต่อไปนี้มาจากไซต์นี้ : ที่นี่และเป็นตัวแปรอิสระและเป็นตัวแปรตามAAABBBD VDVDV คำถาม: มีปฏิสัมพันธ์และผลกระทบหลักของแต่ไม่มีผลกระทบหลักของAAABBB ฉันสามารถดูว่าสูงกว่าค่าของมูลค่าของสูงให้ B เป็นที่มิฉะนั้นเป็นค่าคงที่โดยไม่คำนึงถึงความคุ้มค่าของ ดังนั้นจึงมีการทำงานร่วมกันระหว่างและและผลกระทบหลักของ (เนื่องจากสูงกว่านำไปสู่สูงขึ้นโดยที่ค่าคงที่ )AAAD VDVDVB1B1B_1DVDVDVAAAAAABBBAAAAAADVDVDVBBBB1B1B_1 นอกจากนี้ผมจะเห็นว่าระดับที่แตกต่างของจะนำไปสู่ระดับที่แตกต่างกันของถือค่าคงที่ ดังนั้นจึงมีผลกระทบหลักของ B. แต่นี่ไม่ใช่กรณี ดังนั้นนี่ต้องหมายความว่าฉันตีความพล็อตปฏิสัมพันธ์อย่างไม่ถูกต้อง ผมทำอะไรผิดหรือเปล่า?BBBDVDVDVAAA ฉันแปลพล็อต 6-8 ผิดด้วย ตรรกะที่ฉันใช้ในการตีความพวกเขาเป็นแบบเดียวกับที่ฉันใช้ข้างต้นดังนั้นถ้าฉันรู้ข้อผิดพลาดที่ฉันทำด้านบนฉันควรจะสามารถตีความส่วนที่เหลือได้อย่างถูกต้อง มิฉะนั้นฉันจะอัปเดตคำถามนี้

2
คุณวางแผนการปฏิสัมพันธ์ระหว่างปัจจัยและ covariate อย่างต่อเนื่องได้อย่างไร
ฉันต้องการลงจุดบนกราฟเดียวกันการทำงานร่วมกันระหว่างตัวทำนายต่อเนื่องของฉันกับผู้ดูแลหมวดหมู่ของฉัน ฉันรู้ว่าต้องทำอย่างไรเมื่อทั้งสองมีการจัดหมวดหมู่ ( การโต้ตอบระหว่างปัจจัย ) แต่ไม่รู้จริง ๆ ว่าจะทำอย่างไรเมื่อมีการต่อเนื่องและมีการจัดหมวดหมู่

1
ศัพท์ปฏิสัมพันธ์โดยใช้ตัวแปรกึ่งกลางการวิเคราะห์การถดถอยเชิงลำดับชั้น? ตัวแปรใดที่เราควรตั้งศูนย์
ฉันใช้การวิเคราะห์การถดถอยแบบลำดับชั้นและฉันมีข้อสงสัยเล็กน้อย: เราคำนวณคำที่ใช้โต้ตอบโดยใช้ตัวแปรกึ่งกลางหรือไม่? เราต้องจัดวางตัวแปรต่อเนื่องทั้งหมดที่เรามีในชุดข้อมูลยกเว้นตัวแปรตามหรือไม่ เมื่อเราต้องบันทึกตัวแปรบางตัว (เพราะ sd ของพวกเขานั้นสูงกว่าค่าเฉลี่ย) เราจะจัดวางตัวแปรที่เพิ่งถูกบันทึกหรือเป็นตัวแปรเริ่มต้นหรือไม่? ตัวอย่างเช่น: ตัวแปร "มูลค่าการซื้อขาย" ---> มูลค่าการซื้อขายที่ถูกบันทึกไว้ (เพราะ SD สูงเกินไปเมื่อเทียบกับค่าเฉลี่ย) ---> Centered_Turnover? หรือจะเป็นการหมุนเวียนโดยตรง -> Centered_Turnover (และเราทำงานกับอันนี้) ขอบคุณ !!

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.