คำถามติดแท็ก r

ใช้แท็กนี้สำหรับคำถาม * on-topic * ที่ (a) เกี่ยวข้องกับ `R` ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่เพียงแค่ * เกี่ยวกับวิธีการใช้` R '

1
ช่วยตีความการนับข้อมูล GLMM โดยใช้ lme4 glmer และ glmer.nb - ทวินามลบกับปัวซอง
ฉันมีคำถามบางอย่างเกี่ยวกับข้อกำหนดและการตีความของ GLMM มี 3 คำถามที่แน่นอนทางสถิติและอีก 2 คำถามเกี่ยวกับอาร์ฉันกำลังโพสต์ที่นี่เพราะท้ายที่สุดฉันคิดว่าปัญหาคือการตีความผลลัพธ์ของ GLMM ฉันกำลังพยายามที่จะติดตั้ง GLMM ฉันใช้ข้อมูลการสำรวจสำมะโนประชากรสหรัฐจากฐานข้อมูลระบบทางเดินยาว ข้อสังเกตของฉันคือการสำรวจสำมะโนประชากร ตัวแปรตามของฉันคือจำนวนหน่วยที่พักอาศัยที่ว่างและฉันสนใจในความสัมพันธ์ระหว่างตำแหน่งว่างและตัวแปรทางเศรษฐกิจและสังคม ตัวอย่างที่นี่นั้นง่ายเพียงแค่ใช้เอฟเฟ็กต์คงที่สองตัวเลือก: เปอร์เซ็นต์ของประชากรที่ไม่ใช่คนผิวขาว ฉันต้องการรวมเอฟเฟกต์แบบซ้อนสองแบบไว้ด้วยกัน: ผืนผ้าภายในทศวรรษและทศวรรษเช่น (ทศวรรษ / ผืน) ฉันกำลังพิจารณาแบบสุ่มเหล่านี้ในความพยายามที่จะควบคุมพื้นที่ (เช่นระหว่างผืน) และชั่วขณะ (เช่นระหว่างทศวรรษ) autocorrelation อย่างไรก็ตามฉันสนใจทศวรรษที่ผ่านมาเป็นผลกระทบคงที่ดังนั้นฉันจึงรวมมันเป็นปัจจัยคงที่เช่นกัน เนื่องจากตัวแปรอิสระของฉันคือตัวแปรนับจำนวนเต็มที่ไม่เป็นลบฉันจึงพยายามใส่ปัวซองและลบทวินาม GLMM ฉันใช้บันทึกของหน่วยที่อยู่อาศัยทั้งหมดเพื่อชดเชย ซึ่งหมายความว่าค่าสัมประสิทธิ์ถูกตีความว่าเป็นผลกระทบต่ออัตราตำแหน่งที่ว่างไม่ใช่จำนวนบ้านที่ว่างทั้งหมด ฉันกำลังมีผลสำหรับ Poisson และลบทวินาม GLMM ประมาณโดยใช้ glmer และ glmer.nb จากlme4 การตีความค่าสัมประสิทธิ์ทำให้ฉันรู้สึกว่าขึ้นอยู่กับความรู้ของฉันของข้อมูลและพื้นที่การศึกษา ถ้าคุณต้องการให้ข้อมูลและสคริปต์พวกเขาอยู่ในของฉันGithub สคริปต์นี้มีการสืบสวนเชิงพรรณนามากกว่าที่ฉันเคยทำก่อนสร้างแบบจำลอง นี่คือผลลัพธ์ของฉัน: โมเดลปัวซอง Generalized linear mixed model fit by …

1
Adaptive GAM ทำให้เรียบเป็น mgcv
หนังสือของ Simon Wood เกี่ยวกับ GAMs และแพ็คเกจ R ที่เกี่ยวข้อง mgcv นั้นมีทั้งรายละเอียดสูงและให้ข้อมูลเมื่อพูดถึงทฤษฎี GAM และการปรับโมเดลให้เหมาะสมกับข้อมูลจริงและจำลอง สำหรับสมูทต์ 1D นั้นไม่ต้องกังวลมากนักประหยัดสำหรับการตัดสินใจว่าจะใช้ฟังก์ชั่นแบบวัฏจักรเทียบกับแบบปรับตัวได้หรือไม่ซึ่งสามารถให้ผลการทำนายที่แตกต่างกันมากเมื่อเทียบกับลูกบาศก์, แผ่นบางและ P-spline กรณีที่ปรับตัวได้เกมหลายเกมมีการติดตั้งไปยังภูมิภาคต่างๆตามแนวโค้ง เท่าที่ฉันสามารถบอกได้ว่าฐานวงจรเป็นเรื่องธรรมดาในการสร้างแบบจำลองอนุกรมเวลาในขณะที่การปรับให้เรียบแบบปรับได้นั้นควรได้รับการพิจารณาเมื่อข้อมูลมีความหลากหลายมากเมื่อเทียบกับตัวแปรตอบสนอง แม้กระนั้นการปรับตัวให้ราบรื่นควรใช้ "เท่าที่จำเป็นและด้วยความระมัดระวัง" ฉันได้รับการตรวจสอบเกมมาระยะหนึ่งแล้วและเมื่อถามคำถามการวิจัยของฉันฉันพบว่าตัวเองเปลี่ยนใจได้มากเมื่อพูดถึงเรื่องการใช้งานที่ราบรื่น mgcv มี 17 smooths ที่แตกต่างกันให้เลือก (โดยการนับของฉัน) ฉันได้พิจารณาทั้งลูกบาศก์และ P-spline ให้เรียบ คำถามของฉันคือ : เมื่อใดควรพิจารณาความราบรื่นในการปรับตัวเมื่อพิจารณาจากคู่ที่ไม่ได้ปรับตัวถ้าเป้าหมายท้ายที่สุดคือการใช้ GAMs ที่พอดีเพื่อการคาดการณ์? สำหรับวัตถุประสงค์ของฉันฉันกำลังยึดติดกับเกณฑ์ความราบรื่น GCV เริ่มต้นแม้ว่ามันจะมีแนวโน้มที่จะไม่ราบรื่น วรรณกรรมกำลังเติบโตขึ้นใน GAMs เชิงนิเวศน์ประยุกต์ แต่ฉันยังไม่เจอการศึกษาที่ใช้การปรับตัวที่ราบรื่น คำแนะนำใด ๆ ที่ชื่นชม
9 r  mgcv 

2
โค้ง Kaplan-Meier ดูเหมือนจะพูดอย่างอื่นนอกเหนือจากการถดถอย Cox
ใน R ฉันทำการวิเคราะห์ข้อมูลการอยู่รอดของผู้ป่วยมะเร็ง ฉันได้อ่านสิ่งที่มีประโยชน์มากเกี่ยวกับการวิเคราะห์การอยู่รอดใน CrossValidated และที่อื่น ๆ และคิดว่าฉันเข้าใจวิธีตีความผลการถดถอยของ Cox อย่างไรก็ตามผลหนึ่งยังคงบักฉัน ... ฉันกำลังเปรียบเทียบความอยู่รอดกับเพศ เส้นโค้ง Kaplan-Meier เป็นที่โปรดปรานอย่างชัดเจนของผู้ป่วยเพศหญิง (ฉันได้ตรวจสอบหลายครั้งว่าตำนานที่ฉันเพิ่มเข้ามานั้นถูกต้องผู้ป่วยที่มีชีวิตรอดสูงสุด 4856 วันเป็นผู้หญิงจริง ๆ ): และการถดถอยของ Cox ก็จะกลับมา: Call: coxph(formula = survival ~ gender, data = Clinical) n= 348, number of events= 154 coef exp(coef) se(coef) z Pr(>|z|) gendermale -0.3707 0.6903 0.1758 -2.109 0.035 * …

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

4
ฉันจะตีความกราฟความอยู่รอดของโมเดลอันตราย Cox ได้อย่างไร
คุณจะตีความเส้นโค้งการอยู่รอดจากโมเดลอันตรายตามสัดส่วนของค็อกซ์ได้อย่างไร ในตัวอย่างของเล่นนี้สมมติว่าเรามีโมเดลอันตรายตามสัดส่วนในageตัวแปรในkidneyข้อมูลและสร้างเส้นโค้งการอยู่รอด library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() ตัวอย่างเช่น ณ เวลาคำสั่งใดเป็นจริง หรือทั้งสองอย่างผิดปกติ?200200200 คำแถลงที่ 1: เราจะเหลือวิชา 20% (เช่นถ้าเรามีคนโดยวันที่เราควรเหลืออีกประมาณ ) 100010001000200200200200200200 งบ 2: สำหรับคนที่ได้รับหนึ่งเขา / เธอมีมีโอกาสที่จะอยู่รอดได้ในวันที่20020%20%20\%200200200 ความพยายามของฉัน: ฉันไม่คิดว่าทั้งสองงบจะเหมือนกัน (แก้ไขฉันถ้าฉันผิด) เนื่องจากเราไม่ได้มีการสันนิษฐาน iid (เวลารอดสำหรับทุกคนไม่ได้มาจากการกระจายอย่างอิสระ) มันคล้ายกับการถดถอยโลจิสติกในคำถามของฉันที่นี่อัตราความเป็นอันตรายของแต่ละคนขึ้นอยู่กับสำหรับบุคคลนั้นβTxβTx\beta^Tx

1
ความครอบคลุมต่ำกว่าที่คาดสำหรับการสุ่มตัวอย่างที่สำคัญด้วยการจำลอง
ผมพยายามที่จะตอบคำถามที่ประเมินหนึ่งด้วยวิธีการสุ่มตัวอย่างความสำคัญในการวิจัย โดยทั่วไปผู้ใช้จำเป็นต้องคำนวณ ∫π0ฉ( x ) dx =∫π01cos( x)2+x2dx∫0πf(x)dx=∫0π1cos⁡(x)2+x2dx\int_{0}^{\pi}f(x)dx=\int_{0}^{\pi}\frac{1}{\cos(x)^2+x^2}dx ใช้การแจกแจงเอ็กซ์โพเนนเชียลเป็นการกระจายความสำคัญ Q( x ) = λ ประสบการณ์- λ xq(x)=λ exp−λxq(x)=\lambda\ \exp^{-\lambda x} และค้นหาค่าของซึ่งให้ค่าประมาณที่ดีขึ้นกับอินทิกรัล (ของมัน) ผมแต่งปัญหาการประเมินผลของค่าเฉลี่ยของในช่วง : หนึ่งคือแล้วเพียงแค่\ λλ\lambdaself-studyμμ\muฉ( x )f(x)f(x)[ 0 , π][0,π][0,\pi]πμπμ\pi\mu ดังนั้นให้เป็น pdf ของและให้ : เป้าหมายตอนนี้คือการประมาณp ( x )p(x)p(x)X∼ คุณ( 0 , π)X∼U(0,π)X\sim\mathcal{U}(0,\pi)Y∼ f( X)Y∼f(X)Y\sim f(X) μ = E [ …

2
เหตุใดฉันจึงไม่สามารถรับ SVD ที่ถูกต้องของ X ผ่านการสลายตัว eigenvalue ของ XX 'และ X'X
ฉันพยายามทำ SVD ด้วยมือ: m<-matrix(c(1,0,1,2,1,1,1,0,0),byrow=TRUE,nrow=3) U=eigen(m%*%t(m))$vector V=eigen(t(m)%*%m)$vector D=sqrt(diag(eigen(m%*%t(m))$values)) U1=svd(m)$u V1=svd(m)$v D1=diag(svd(m)$d) U1%*%D1%*%t(V1) U%*%D%*%t(V) แต่บรรทัดสุดท้ายไม่กลับmมา ทำไม? ดูเหมือนว่าจะมีบางอย่างที่เกี่ยวข้องกับสัญญาณของ eigenvector ...
9 r  svd  eigenvalues 

1
สร้างตัวเลขสุ่มจาก“ การกระจายตัวแบบลาด” จากทฤษฎีทางคณิตศาสตร์
เพื่อจุดประสงค์บางอย่างฉันต้องสร้างตัวเลขสุ่ม (ข้อมูล) จากการกระจาย "ชุดลาด" "ความชัน" ของการกระจายนี้อาจแตกต่างกันไปในช่วงเวลาที่สมเหตุสมผลแล้วการกระจายของฉันควรเปลี่ยนจากเครื่องแบบเป็นสามเหลี่ยมตามความชัน นี่คือที่มาของฉัน: มาทำให้มันง่ายและสร้างฟอร์มข้อมูล 000 ถึง BBB(สีน้ำเงิน, สีแดงคือการกระจายแบบสม่ำเสมอ) เพื่อให้ได้ฟังก์ชันความหนาแน่นของความน่าจะเป็นของเส้นสีฟ้าฉันต้องการเพียงสมการของเส้นนั้น ดังนั้น: ฉ(x ) = t g( φ ) x + Y(0 )ฉ(x)=เสื้อก.(φ)x+Y(0)f(x) = tg(\varphi)x + Y(0) และตั้งแต่ (ภาพ): เสื้อg( φ )Y( 0 )=1 / B - Y( 0 )B / 2=1B- tกรัม( φ )B2เสื้อก.(φ)=1/B-Y(0)B/2Y(0)=1B-เสื้อก.(φ)B2\begin{align} tg(\varphi) &= \frac{1/B …

1
ความไม่สอดคล้องกันเล็กน้อยระหว่างฟังก์ชัน R ในตัว Kruskal-Wallis และการคำนวณด้วยตนเอง
ฉันสับสนในเรื่องต่อไปนี้และฉันไม่สามารถหาคำตอบที่อื่นได้ ฉันพยายามเรียนรู้ R ในขณะที่ทำสถิติและในการออกกำลังกายฉันพยายามตรวจสอบผลลัพธ์ของฟังก์ชั่น R ในตัวอีกครั้งโดยทำสิ่งเหล่านี้ 'ด้วยมือ' ตามที่เป็นอยู่ในอาร์อย่างไรก็ตาม สำหรับการทดสอบ Kruskal-Wallis ฉันได้รับผลลัพธ์ที่แตกต่างกันไปและฉันไม่สามารถหาสาเหตุได้ ตัวอย่างเช่นฉันกำลังดูข้อมูลต่อไปนี้ที่แจกในแบบฝึกหัด activity <- c(2, 4, 3, 2, 3, 3, 4, 0, 4, 3, 4, 0, 0, 1, 3, 1, 2, 0, 3, 1, 0, 3, 4, 0, 1, 2, 2, 2, 3, 2) group <- c(rep("A", 11), rep("B", 10), …

2
จำลองการถดถอยเชิงเส้นด้วย heteroscedasticity
ฉันพยายามจำลองชุดข้อมูลที่ตรงกับข้อมูลเชิงประจักษ์ที่ฉันมี แต่ไม่แน่ใจว่าจะประเมินข้อผิดพลาดในข้อมูลต้นฉบับได้อย่างไร ข้อมูลเชิงประจักษ์รวมถึง heteroscedasticity แต่ฉันไม่สนใจที่จะเปลี่ยนมันออกไป แต่ใช้โมเดลเชิงเส้นที่มีคำผิดพลาดเพื่อจำลองแบบจำลองของข้อมูลเชิงประจักษ์ ตัวอย่างเช่นสมมติว่าฉันมีชุดข้อมูลเชิงประจักษ์และโมเดล: n=rep(1:100,2) a=0 b = 1 sigma2 = n^1.3 eps = rnorm(n,mean=0,sd=sqrt(sigma2)) y=a+b*n + eps mod <- lm(y ~ n) ใช้plot(n,y)เราได้รับดังต่อไปนี้ อย่างไรก็ตามถ้าฉันพยายามจำลองข้อมูล, simulate(mod)heteroscedasticity จะถูกลบออกและไม่ถูกจับโดยแบบจำลอง ฉันสามารถใช้โมเดลกำลังสองน้อยที่สุด VMat <- varFixed(~n) mod2 = gls(y ~ n, weights = VMat) ที่ให้แบบจำลองที่ดีขึ้นตาม AIC แต่ฉันไม่รู้วิธีจำลองข้อมูลโดยใช้เอาต์พุต คำถามของฉันคือฉันจะสร้างแบบจำลองที่จะช่วยให้ฉันสามารถจำลองข้อมูลให้ตรงกับข้อมูลเชิงประจักษ์ (n และ y ด้านบน) …

1
การถดถอยเชิงเส้นหลายตัวแปรด้วยเชือกใน r
ฉันพยายามสร้างแบบจำลองที่ลดลงเพื่อทำนายตัวแปรตามจำนวนมาก (DV) (~ 450) ที่มีความสัมพันธ์สูง ตัวแปรอิสระของฉัน (IV) ก็มีมากมาย (~ 2000) และมีความสัมพันธ์สูง หากฉันใช้ Lasso เพื่อเลือกรูปแบบการลดลงสำหรับแต่ละเอาต์พุตแยกกันฉันไม่รับประกันว่าจะได้รับชุดย่อยของตัวแปรอิสระแบบเดียวกับที่ฉันวนลูปมากกว่าตัวแปรตามแต่ละตัว มีการถดถอยเชิงเส้นหลายตัวแปรที่ใช้เชือกใน R หรือไม่? นี่ไม่ใช่กลุ่มบ่วงบาศ กลุ่ม lasso กลุ่ม IV ฉันต้องการการถดถอยเชิงเส้นหลายตัวแปร (หมายถึง DV เป็นเมทริกซ์ไม่ใช่เวกเตอร์สเกลาร์) ที่ใช้บ่วงบาศ (หมายเหตุ: ตาม NRH ชี้ว่าสิ่งนี้ไม่เป็นความจริงกลุ่ม lasso เป็นคำทั่วไปที่มีกลยุทธ์ที่จัดกลุ่ม IV แต่รวมถึงกลยุทธ์ที่จัดกลุ่มพารามิเตอร์อื่น ๆ เช่น DV) ฉันพบบทความนี้ที่กลายเป็นสิ่งที่เรียกว่าSparse Overlapping Sets Lasso นี่คือรหัสบางอย่างที่ทำให้การถดถอยเชิงเส้นหลายตัวแปร > dim(target) [1] 6060 441 > dim(dictionary) …

1
รูปแบบเอฟเฟกต์ผสมกับเส้นโค้ง
ฉันเหมาะสมกับโมเดลเอฟเฟกต์ผสมกับคำที่เป็นอิสระในแอปพลิเคชันซึ่งมีแนวโน้มว่าเมื่อเวลาผ่านไปเป็นเส้นโค้งเชิงเส้น อย่างไรก็ตามสิ่งที่ฉันต้องการประเมินคือแนวโน้มของเส้นโค้งเชิงเส้นเกิดขึ้นเนื่องจากความเบี่ยงเบนของแต่ละบุคคลจากเส้นตรงหรือเป็นผลกระทบในระดับกลุ่มที่ทำให้ระดับกลุ่มพอดีปรากฏเป็นเส้นโค้ง ฉันให้ตัวอย่างที่ทำซ้ำได้ซึ่งน่าเบื่อชุดข้อมูลจากแพ็คเกจ JM library(nlme) library(JM) data(pbc2) fitLME1 <- lme(log(serBilir) ~ ns(year, 2), random = ~ year | id, data = pbc2) fitLME2 <- lme(log(serBilir) ~ year, random = ~ ns(year, 2) | id, data = pbc2) โดยพื้นฐานแล้วฉันต้องการทราบว่าหนึ่งในสิ่งเหล่านี้เหมาะกับข้อมูลของฉัน อย่างไรก็ตามการเปรียบเทียบโดยanovaให้คำเตือนเป็นลางไม่ดี: Model df AIC BIC logLik Test L.Ratio p-value fitLME1 1 7 …
9 r  splines  lme4-nlme 

1
ความแตกต่างระหว่างประเภทของ SVM
ฉันใหม่เพื่อรองรับเครื่องเวกเตอร์ คำอธิบายสั้น ๆ svmฟังก์ชั่นจากe1071แพคเกจใน R มีตัวเลือกต่างๆ: C-การจัดหมวดหมู่ nu-การจัดหมวดหมู่ การจำแนกประเภทหนึ่ง (สำหรับการตรวจจับสิ่งแปลกใหม่) eps-ถดถอย nu-ถดถอย อะไรคือความแตกต่างในการหยั่งรู้ระหว่างห้าประเภท? ควรใช้อันไหนในสถานการณ์ใด

1
ตัวแบบเชิงเส้นตรงที่ข้อมูลมีความไม่แน่นอนโดยใช้ R
สมมติว่าฉันมีข้อมูลที่มีความไม่แน่นอน ตัวอย่างเช่น: X Y 1 10±4 2 50±3 3 80±7 4 105±1 5 120±9 ธรรมชาติของความไม่แน่นอนอาจเป็นการวัดซ้ำหรือการทดลองหรือความไม่แน่นอนของเครื่องมือวัด ผมอยากจะพอดีกับเส้นโค้งไปโดยใช้ R, lmบางสิ่งบางอย่างที่ปกติผมจะทำอย่างไรกับ อย่างไรก็ตามสิ่งนี้ไม่ได้คำนึงถึงความไม่แน่นอนในข้อมูลเมื่อมันทำให้ฉันมีความไม่แน่นอนในค่าสัมประสิทธิ์แบบพอดีและดังนั้นจึงมีการคาดการณ์ช่วงเวลา ดูที่เอกสารlmหน้านี้มี: ... น้ำหนักสามารถใช้เพื่อระบุว่าการสังเกตที่ต่างกันมีความแตกต่างกัน ... ดังนั้นฉันคิดว่าบางทีนี่อาจจะเกี่ยวข้องกับเรื่องนี้ ฉันรู้ทฤษฎีการทำด้วยตนเอง แต่ฉันสงสัยว่ามันเป็นไปได้ที่จะทำเช่นนั้นกับlmฟังก์ชั่น ถ้าไม่มีมีฟังก์ชั่นอื่น ๆ (หรือแพ็คเกจ) ที่สามารถทำสิ่งนี้ได้หรือไม่? แก้ไข เห็นความคิดเห็นบางส่วนนี่คือคำชี้แจงบางอย่าง ใช้ตัวอย่างนี้: x <- 1:10 y <- c(131.4,227.1,245,331.2,386.9,464.9,476.3,512.2,510.8,532.9) mod <- lm(y ~ x + I(x^2)) summary(mod) ให้ฉัน: Residuals: Min …

2
จะคำนวณช่วงความมั่นใจของการสกัดกั้น x ในการถดถอยเชิงเส้นได้อย่างไร?
เนื่องจากข้อผิดพลาดมาตรฐานของการถดถอยเชิงเส้นมักจะได้รับสำหรับตัวแปรตอบสนองฉันสงสัยว่าจะได้รับช่วงความมั่นใจในทิศทางอื่นได้อย่างไร - เช่นการสกัดกั้น x ฉันสามารถเห็นภาพว่ามันอาจจะเป็นอะไร แต่ฉันแน่ใจว่าต้องมีวิธีที่ตรงไปตรงมาในการทำเช่นนี้ ด้านล่างเป็นตัวอย่างใน R ของวิธีการเห็นภาพนี้: set.seed(1) x <- 1:10 a <- 20 b <- -2 y <- a + b*x + rnorm(length(x), mean=0, sd=1) fit <- lm(y ~ x) XINT <- -coef(fit)[1]/coef(fit)[2] plot(y ~ x, xlim=c(0, XINT*1.1), ylim=c(-2,max(y))) abline(h=0, lty=2, col=8); abline(fit, col=2) points(XINT, 0, col=4, …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.