คำถามติดแท็ก r

ใช้แท็กนี้สำหรับคำถาม * on-topic * ที่ (a) เกี่ยวข้องกับ `R` ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่เพียงแค่ * เกี่ยวกับวิธีการใช้` R '

1
เส้นทางสัมประสิทธิ์ - การเปรียบเทียบของสันเขาบาศและการถดถอยสุทธิแบบยืดหยุ่น
ฉันต้องการเปรียบเทียบรุ่นที่เลือกกับสันหลัง, เชือกและยางยืด ภาพด้านล่างแสดงเส้นทางสัมประสิทธิ์โดยใช้ทั้ง 3 วิธี: สันเขา (รูป A, อัลฟา = 0), เชือก (รูป B; อัลฟา = 1) และตาข่ายยืดหยุ่น (รูป C; alpha = 0.5) วิธีการแก้ปัญหาที่ดีที่สุดขึ้นอยู่กับค่าแลมบ์ดาที่เลือกซึ่งเลือกจากการตรวจสอบข้าม เมื่อดูที่แปลงเหล่านี้ฉันคาดว่าตาข่ายยืดหยุ่น (รูปที่ C) จะแสดงผลการจัดกลุ่ม อย่างไรก็ตามมันไม่ชัดเจนในกรณีที่นำเสนอ เส้นทางสัมประสิทธิ์สำหรับ lasso และ elastic net นั้นคล้ายกันมาก อะไรคือสาเหตุของสิ่งนี้ มันเป็นเพียงความผิดพลาดในการเขียนโค้ดหรือไม่? ฉันใช้รหัสต่อไปนี้ใน R: library(glmnet) X<- as.matrix(mydata[,2:22]) Y<- mydata[,23] par(mfrow=c(1,3)) ans1<-cv.glmnet(X, Y, alpha=0) # ridge …

1
จะสร้างกราฟผู้รอดชีวิตที่คาดการณ์ไว้จากแบบจำลองที่อ่อนแอได้อย่างไร (โดยใช้ R coxph)
ฉันต้องการคำนวณฟังก์ชั่นผู้รอดชีวิตที่คาดการณ์ไว้สำหรับโมเดลอันตรายตามสัดส่วนของ Cox ด้วยเงื่อนไขที่อ่อนแอ [ใช้แพ็คเกจการอยู่รอด] ปรากฏว่าเมื่อเงื่อนไขที่อ่อนแออยู่ในแบบจำลองฟังก์ชันการรอดชีวิตที่คาดการณ์ไม่สามารถคำนวณได้ ## Example require(survival) data(rats) ## Create fake weight set.seed(90989) rats$weight<-runif(nrow(rats),0.2,0.9) ## Cox model with gamma frailty on litter fit <- coxph(Surv(time, status) ~ rx+weight+frailty(litter,dist="gamma"), data = rats) ## Compute survival curve from the cox model for rx=0 and weight=0.5 kg plot(survfit(fit, newdata=data.frame(rx=0,weight=0.5)),xlab = "time", ylab="Survival") …

3
การนำบ่วงบาศแบบไม่ลบไปใช้ใน R
ฉันกำลังมองหาโอเพนซอร์สหรือห้องสมุดที่มีอยู่ที่ฉันสามารถใช้ได้ เท่าที่ฉันบอกแพคเกจ glmnet ไม่สามารถขยายได้อย่างง่ายดายเพื่อครอบคลุมกรณีที่ไม่ใช่เชิงลบ ฉันอาจจะผิดคนที่มีความคิดใด ๆ ชื่นชมมาก โดยไม่เป็นลบฉันหมายความว่าสัมประสิทธิ์ทั้งหมดถูก จำกัด ให้เป็นบวก (> 0)
13 r  lasso 

4
อนุกรมเวลาที่ต่างกันก่อน Arima หรือภายใน Arima
มันจะดีกว่าที่จะแตกต่างชุด (สมมติว่ามันต้องการ) ก่อนที่จะใช้ Arima หรือดีกว่าที่จะใช้พารามิเตอร์ d ภายใน Arima? ฉันรู้สึกประหลาดใจที่ความแตกต่างของค่าที่ติดตั้งนั้นขึ้นอยู่กับเส้นทางที่ถ่ายด้วยแบบจำลองและข้อมูลเดียวกัน หรือฉันกำลังทำอะไรผิดพลาด? install.packages("forecast") library(forecast) wineindT<-window(wineind, start=c(1987,1), end=c(1994,8)) wineindT_diff <-diff(wineindT) #coefficients and other measures are similar modA<-Arima(wineindT,order=c(1,1,0)) summary(modA) modB<-Arima(wineindT_diff,order=c(1,0,0)) summary(modB) #fitted values from modA A<-forecast.Arima(modA,1)$fitted #fitted from modB, setting initial value to the first value in the original series B<-diffinv(forecast.Arima(modB,1)$fitted,xi=wineindT[1]) plot(A, col="red") lines(B, …
13 r  time-series  arima 

2
มีปัญหากับ e1071 libsvm?
ฉันมีชุดข้อมูลที่มีสองคลาสที่ทับซ้อนกันเจ็ดจุดในแต่ละชั้นคะแนนอยู่ในพื้นที่สองมิติ ใน R และฉันกำลังเรียกใช้svmจากe1071แพคเกจเพื่อสร้างการแยกไฮเปอร์เพลนสำหรับคลาสเหล่านี้ ฉันใช้คำสั่งต่อไปนี้: svm(x, y, scale = FALSE, type = 'C-classification', kernel = 'linear', cost = 50000) ที่xมีจุดข้อมูลของฉันและyมีป้ายกำกับของพวกเขา คำสั่งส่งกลับ svm-object ซึ่งฉันใช้ในการคำนวณพารามิเตอร์ (เวกเตอร์ปกติ) และ (สกัดกั้น) ของการแยกไฮเปอร์เพลนขwwwbbb รูปที่ (a) ด้านล่างแสดงคะแนนของฉันและไฮเปอร์เพลนที่ส่งคืนโดยsvmคำสั่ง จุดสีน้ำเงินที่มีสัญลักษณ์ O แสดงที่มาของพื้นที่เส้นประแสดงขอบระยะทางวงกลมคือจุดที่ไม่เป็นศูนย์ (ตัวแปรสแลค)ξξ\xi รูปที่ (b) แสดงไฮเปอร์เพลนอีกอันหนึ่งซึ่งเป็นการแปลแบบขนานที่ดีที่สุดด้วย 5 (b_new = b_optimal - 5) ไม่ยากที่จะเห็นว่าสำหรับไฮเปอร์เพลนนี้ฟังก์ชันวัตถุประสงค์ (ซึ่งถูกย่อโดยการจำแนกประเภท C-svm) จะมีค่าต่ำกว่าไฮเปอร์เพลนที่ดีที่สุดที่แสดงในรูป ( ก) ดังนั้นดูเหมือนว่าจะมีปัญหากับฟังก์ชั่นนี้หรือไม่? …

5
lme4 หรือรหัสโอเพนซอร์ส R อื่น ๆ เทียบเท่ากับ asreml-R
ฉันต้องการที่จะพอดีกับรุ่นผสมโดยใช้ lme4, nlme, แพ็คเกจการถดถอยเบย์หรือที่มีอยู่ แบบผสมในแบบแผนการเข้ารหัส Asreml- R ก่อนที่จะลงรายละเอียดเฉพาะเราอาจต้องการรายละเอียดเกี่ยวกับการประชุม asreml-R สำหรับผู้ที่ไม่คุ้นเคยกับรหัส ASREML y = Xτ + Zu + e ........................(1) ; แบบผสมกับปกติ, y หมายถึง n × 1 เวกเตอร์ของการสังเกต, ที่τคือ p × 1 เวกเตอร์ของ fi xed e ff ects, X คือเมทริกซ์การออกแบบ n × p ของคอลัมน์เต็มอันดับที่เชื่อมโยงการสังเกตด้วยการรวมกันที่เหมาะสมของ fi xed e ff ects , u …
13 r 

6
แพ็คเกจ R สำหรับการระบุความสัมพันธ์ระหว่างตัวแปร [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นไปตามหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน4 ปีที่แล้ว มีแพ็คเกจ R ที่ฉันสามารถใช้เพื่อสำรวจว่ามีความสัมพันธ์ระหว่างตัวแปรหรือไม่? โดยทั่วไปเมื่อฉันกำลังมองหารูปแบบที่ฉันดูที่ความสัมพันธ์แล้วพล็อตด้าน จากนั้นฉันใช้การแปลงบางอย่างกับตัวแปรในข้อมูลด้วยตนเอง ฉันสงสัยว่าฉันสามารถเร่งกระบวนการนี้ผ่านแพ็คเกจ R ได้หรือไม่

1
PCA และคะแนนองค์ประกอบขึ้นอยู่กับการผสมผสานของตัวแปรต่อเนื่องและไบนารี
ฉันต้องการใช้ PCA กับชุดข้อมูลซึ่งประกอบด้วยตัวแปรชนิดผสม (ต่อเนื่องและไบนารี) เพื่อแสดงขั้นตอนฉันวางตัวอย่างที่ทำซ้ำได้น้อยที่สุดใน R ด้านล่าง # Generate synthetic dataset set.seed(12345) n <- 100 x1 <- rnorm(n) x2 <- runif(n, -2, 2) x3 <- x1 + x2 + rnorm(n) x4 <- rbinom(n, 1, 0.5) x5 <- rbinom(n, 1, 0.6) data <- data.frame(x1, x2, x3, x4, x5) # Correlation matrix …
13 r  pca 

2
สูตรสำหรับความสัมพันธ์อัตโนมัติใน R กับ Excel
ฉันพยายามหาวิธีที่ R คำนวณความสัมพันธ์ระหว่าง lag-k (เห็นได้ชัดว่าเป็นสูตรเดียวกับที่ใช้โดย Minitab และ SAS) เพื่อให้ฉันสามารถเปรียบเทียบกับการใช้ฟังก์ชัน CORREL ของ Excel ที่ใช้กับซีรี่ส์และรุ่น k-lagged R และ Excel (ใช้ CORREL) ให้ค่าความสัมพันธ์อัตโนมัติที่แตกต่างกันเล็กน้อย ฉันสนใจที่จะทราบด้วยว่าการคำนวณหนึ่งนั้นถูกต้องมากกว่าอีกไหม
13 r  sas  autocorrelation  excel 

1
การตีความเอาต์พุตการถดถอยโลจิสติกใน R
ผมทำงานในการถดถอยโลจิสติกในหลาย R glmโดยใช้ ตัวแปรทำนายนั้นต่อเนื่องและจัดหมวดหมู่ แยกข้อมูลสรุปของแบบจำลองแสดงดังต่อไปนี้: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.451e+00 2.439e+00 1.005 0.3150 Age 5.747e-02 3.466e-02 1.658 0.0973 . BMI -7.750e-02 7.090e-02 -1.093 0.2743 ... --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 ช่วงความเชื่อมั่น: 2.5 % 97.5 % (Intercept) …

1
ตีความแถบช่วงใน plot.stl ของ R?
ฉันมีปัญหาในการหาสิ่งที่แถบช่วงในความplot.stlหมายที่แท้จริง ฉันพบโพสต์ของ Gavin ในคำถามนี้และอ่านเอกสารเช่นกันฉันเข้าใจว่าพวกเขาบอกขนาดสัมพัทธ์ของส่วนประกอบที่สลายตัว แต่ฉันก็ยังไม่แน่ใจว่าพวกมันทำงานอย่างไร เช่น: ข้อมูล: บาร์เล็ก ๆ , ไม่มีสเกลตามฤดูกาล: เต็มบาร์, มีสเกลตั้งแต่ -0.6 ถึง 0.2 แนวโน้ม: บาร์เล็ก ๆ อีกอัน (ดูเหมือนจะเท่ากับข้อมูล), ไม่มีสเกลที่เหลือ: บาร์ขนาดกลางที่มีสเกลตั้งแต่ -1.5 ถึง 0.5 ฉันไม่เข้าใจว่าอะไรคือพื้นฐานของความสัมพันธ์และทำไมเทรนด์จึงไม่มีขนาด ฉันลองstlและdecomposeมีผลลัพธ์เหมือนกันสำหรับวิธีการคูณและการบวก
13 r  time-series 


4
รับค่าเริ่มต้นที่ถูกต้องสำหรับโมเดล nls ใน R
ฉันกำลังพยายามจัดทำแบบจำลองกฎหมายพลังงานอย่างง่ายกับชุดข้อมูลที่เป็นดังนี้: mydf: rev weeks 17906.4 1 5303.72 2 2700.58 3 1696.77 4 947.53 5 362.03 6 เป้าหมายคือการส่งผ่านสายไฟฟ้าและใช้มันเพื่อทำนายrevvlaues สำหรับสัปดาห์ต่อ ๆ ไป มีงานวิจัยมากมายพาฉันไปที่nlsฟังก์ชั่นซึ่งฉันได้ปฏิบัติดังนี้ newMod <- nls(rev ~ a*weeks^b, data=modeldf, start = list(a=1,b=1)) predict(newMod, newdata = data.frame(weeks=c(1,2,3,4,5,6,7,8,9,10))) ในขณะที่งานนี้สำหรับlmรุ่นที่ผมได้รับsingular gradientข้อผิดพลาดที่ผมเข้าใจจะทำอย่างไรกับค่าเริ่มต้นของฉันและa bฉันลองใช้ค่าที่แตกต่างกันไปจนถึงการพล็อตเรื่องนี้ใน Excel ผ่าน lone รับสมการจากนั้นใช้ค่าจากสมการ แต่ฉันยังคงได้รับข้อผิดพลาด ฉันดูคำตอบจำนวนมากเช่นนี้และลองคำตอบที่สอง (ไม่เข้าใจคำตอบแรก) แต่ไม่มีผลลัพธ์ ฉันสามารถใช้ความช่วยเหลือบางอย่างที่นี่เกี่ยวกับวิธีค้นหาค่าเริ่มต้นที่ถูกต้อง หรือมิฉะนั้นฉันสามารถใช้ฟังก์ชั่นอื่นแทน nls ได้ ในกรณีที่คุณต้องการสร้างใหม่mydfได้อย่างง่ายดาย: …

2
อคติบูต: มันโอเคที่จะจัดวาง CI รอบ ๆ สถิติที่สังเกตได้หรือไม่?
สิ่งนี้คล้ายกับBootstrap: การประเมินอยู่นอกช่วงความมั่นใจ ฉันมีข้อมูลบางอย่างที่แสดงถึงจำนวนของจีโนไทป์ในประชากร ฉันต้องการประเมินความหลากหลายทางพันธุกรรมโดยใช้ดัชนีของแชนนอนและสร้างช่วงความมั่นใจโดยใช้การบูตสแตรป อย่างไรก็ตามฉันสังเกตเห็นว่าการประเมินผ่านการบูตสแตรปปิ้งมีแนวโน้มที่จะมีอคติอย่างมากและส่งผลให้เกิดช่วงความมั่นใจที่อยู่นอกสถิติที่ฉันสังเกตเห็น ด้านล่างเป็นตัวอย่าง # Shannon's index H <- function(x){ x <- x/sum(x) x <- -x * log(x, exp(1)) return(sum(x, na.rm = TRUE)) } # The version for bootstrapping H.boot <- function(x, i){ H(tabulate(x[i])) } การสร้างข้อมูล set.seed(5000) X <- rmultinom(1, 100, prob = rep(1, 50))[, 1] การคำนวณ H(X) …

1
พล็อตเพื่อแสดงผลลัพธ์ของโมเดลเอฟเฟกต์เชิงเส้นผสม
ฉันกำลังวิเคราะห์ข้อมูลบางอย่างโดยใช้การสร้างแบบจำลองเอฟเฟกต์แบบผสมเชิงเส้นในอาร์ฉันวางแผนที่จะสร้างโปสเตอร์ที่มีผลลัพธ์และฉันก็สงสัยว่าถ้าใครมีประสบการณ์กับโมเดลเอฟเฟกต์ผสมสามารถแนะนำแผนการที่จะใช้ แบบ ฉันกำลังคิดเกี่ยวกับพล็อตที่เหลือพล็อตของค่าติดตั้งกับค่าเดิม ฯลฯ ฉันรู้ว่าสิ่งนี้จะขึ้นอยู่กับข้อมูลของฉันเป็นอย่างมาก แต่ฉันแค่พยายามทำความเข้าใจถึงวิธีที่ดีที่สุดในการอธิบายผลลัพธ์ของตัวแบบผสมเอฟเฟกต์เชิงเส้น ฉันใช้แพ็คเกจ nlme ใน R ขอบคุณ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.