คำถามติดแท็ก r

ใช้แท็กนี้สำหรับคำถาม * on-topic * ที่ (a) เกี่ยวข้องกับ `R` ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่เพียงแค่ * เกี่ยวกับวิธีการใช้` R '

1
วิธีการพล็อตขั้นตอนบันไดทำงานด้วย ggplot?
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ฉันมีกราฟดังนี้: รหัส R สำหรับการสร้างมันคือ: DF <- data.frame(date = as.Date(runif(100, 0, 800),origin="2005-01-01"), outcome = rbinom(100, 1, 0.1)) DF <- DF[order(DF$DateVariable),] #Sort by date DF$x <- seq(length=nrow(DF)) #Add case numbers (in order, since sorted) DF$y <- cumsum(DF$outcome) library(ggplot2) ggplot(DF, aes(x,y)) + geom_path() + #Ploting scale_y_continuous(name= "Number of failures") …

1
วิธีการตั้งค่าและตีความ ANOVA ต่างกับแพ็คเกจรถยนต์ใน R อย่างไร
สมมติว่าฉันมีการทดลองแบบแฟคทอเรียล 2x2 ที่ฉันต้องการทำ ANOVA เช่นนี้ตัวอย่างเช่น: d <- data.frame(a=factor(sample(c('a1','a2'), 100, rep=T)), b=factor(sample(c('b1','b2'), 100, rep=T))); d$y <- as.numeric(d$a)*rnorm(100, mean=.75, sd=1) + as.numeric(d$b)*rnorm(100, mean=1.2, sd=1) + as.numeric(d$a)*as.numeric(d$b)*rnorm(100, mean=.5, sd=1) + rnorm(100); ในกรณีที่ไม่มีการโต้ตอบที่สำคัญโดยค่าเริ่มต้น (เช่นcontr.treatment) ผลลัพธ์ของAnova()ความสำคัญโดยรวมของaในทุกระดับของbและbเหนือทุกระดับของaถูกที่? ฉันควรระบุความแตกต่างที่จะช่วยให้ฉันทดสอบความสำคัญของผลกระทบaกับbการคงที่ที่ระดับ b1 ของผลกระทบaกับbการคงที่ที่ระดับ b2 และการโต้ตอบa:bอย่างไร
15 r  anova  contrasts 

2
พื้นที่ภายใต้“ pdf” ในการประมาณความหนาแน่นของเคอร์เนลใน R
ฉันพยายามใช้ฟังก์ชัน ' ความหนาแน่น ' ใน R เพื่อทำการประมาณความหนาแน่นของเคอร์เนล ฉันมีความยากลำบากการตีความผลและเปรียบเทียบชุดข้อมูลต่างๆที่ดูเหมือนว่าพื้นที่ใต้เส้นโค้งไม่จำเป็นต้อง 1. สำหรับใด ๆฟังก์ชั่นความหนาแน่นของความน่าจะเป็น (PDF) , เราจำเป็นต้องมีพื้นที่∫ ∞ - ∞ φ ( x ) d x = 1 ฉันสมมติว่าการประมาณความหนาแน่นของเคอร์เนลรายงาน pdf ฉันใช้integrate.xyจากsfsmiscเพื่อประเมินพื้นที่ใต้เส้นโค้งϕ ( x )φ(x)\phi(x)∫∞- ∞ϕ ( x ) dx = 1∫-∞∞φ(x)dx=1\int_{-\infty}^\infty \phi(x) dx = 1 > # generate some data > xx<-rnorm(10000) > …

2
วิธีการลงจุดวงรีจากค่าลักษณะเฉพาะและค่าลักษณะเฉพาะใน R [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามดังนั้นจึงเป็นหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน2 ปีที่ผ่านมา มีใครมากับรหัสRเพื่อพล็อตวงรีจากค่าลักษณะเฉพาะและ eigenvectors ของเมทริกซ์ต่อไปนี้ A = ( 2.20.40.42.8)A=(2.20.40.42.8) \mathbf{A} = \left( \begin{array} {cc} 2.2 & 0.4\\ 0.4 & 2.8 \end{array} \right)

3
จะรวมข้อมูลนาทีเป็นเวลาหนึ่งสัปดาห์เป็นรายชั่วโมงได้อย่างไร
คุณจะได้รับค่าเฉลี่ยรายชั่วโมงสำหรับคอลัมน์ข้อมูลหลายรายการเป็นระยะเวลารายวันอย่างไรและแสดงผลลัพธ์สำหรับ "โฮสต์" สิบสองรายการในกราฟเดียวกัน นั่นคือฉันต้องการกราฟว่าระยะเวลา 24 ชั่วโมงเป็นอย่างไรสำหรับสัปดาห์ที่มีค่าของข้อมูล เป้าหมายสุดท้ายคือการเปรียบเทียบข้อมูลสองชุดนี้ก่อนและหลังการสุ่มตัวอย่าง dates Host CPUIOWait CPUUser CPUSys 1 2011-02-11 23:55:12 db 0 14 8 2 2011-02-11 23:55:10 app1 0 6 1 3 2011-02-11 23:55:09 app2 0 4 1 ฉันสามารถเรียกใช้ xyplot (CPUUser ~ เดท | โฮสต์) ได้ดี อย่างไรก็ตามแทนที่จะแสดงแต่ละวันในสัปดาห์ฉันต้องการให้แกน X เป็นชั่วโมงของวัน การพยายามนำข้อมูลนี้ไปไว้ในวัตถุ xts ทำให้เกิดข้อผิดพลาดเช่น"order.by ต้องใช้วัตถุตามเวลาที่เหมาะสม" นี่คือ str …

3
การแนะนำที่ดีกับอนุกรมเวลา (พร้อม R)
ขณะนี้ฉันกำลังรวบรวมข้อมูลสำหรับการทดลองในลักษณะทางจิตสังคมที่เกี่ยวข้องกับประสบการณ์ความเจ็บปวด เป็นส่วนหนึ่งของเรื่องนี้ฉันกำลังรวบรวมการวัด GSR และ BP ทางอิเล็กทรอนิกส์จากผู้เข้าร่วมของฉันพร้อมกับรายงานตนเองและมาตรการโดยนัย ฉันมีภูมิหลังทางจิตวิทยาและรู้สึกสบายใจกับการวิเคราะห์ปัจจัยตัวแบบเชิงเส้นและการวิเคราะห์เชิงทดลอง คำถามของฉันคือทรัพยากรที่มีประโยชน์ (ฟรี) ที่ดีสำหรับการเรียนรู้เกี่ยวกับการวิเคราะห์อนุกรมเวลา ฉันเป็น newb รวมเมื่อมันมาถึงพื้นที่นี้ดังนั้นความช่วยเหลือใด ๆ จะได้รับการชื่นชมอย่างมาก ฉันมีข้อมูลนำร่องที่จะฝึกปฏิบัติ แต่ต้องการให้แผนวิเคราะห์ของฉันทำงานโดยละเอียดก่อนที่ฉันจะรวบรวมข้อมูลให้เสร็จ หากการอ้างอิงที่ให้นั้นเกี่ยวข้องกับ R นั่นก็คงจะวิเศษมาก แก้ไข: เพื่อเปลี่ยนไวยากรณ์และเพื่อเพิ่ม 'รายงานตนเองและมาตรการโดยนัย'

3
วิธีเพิ่มประสิทธิภาพสคริปต์ R ของฉันเพื่อใช้“ มัลติคอร์”
ฉันใช้ GNU R ที่ Ubuntu-Lucid PC ซึ่งมี 4 ซีพียู ในการใช้ CPU ทั้ง 4 ตัวฉันติดตั้งแพ็คเกจ "r-cran-multicore" เนื่องจากแพ็คเกจของคู่มือขาดตัวอย่างจริงที่ฉันเข้าใจฉันต้องการคำแนะนำในการเพิ่มประสิทธิภาพสคริปต์ของฉันเพื่อใช้งาน CPU ทั้ง 4 ตัว ชุดข้อมูลของฉันคือ data.frame (เรียกว่า P1) ที่มี 50,000 แถวและ 1600 cols สำหรับแต่ละแถวฉันต้องการคำนวณค่าสูงสุดผลรวมและค่าเฉลี่ย สคริปต์ของฉันมีลักษณะดังนี้: p1max <- 0 p1mean <- 0 p1sum <-0 plength <- length(P1[,1]) for(i in 1:plength){ p1max <- c(p1max, max(P1[i,])) p1mean …
15 r 

3
บทเรียนเกี่ยวกับการเขียนโปรแกรมเชิงวัตถุใน R [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ปิดให้บริการใน4 ปีที่แล้ว ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ มีแบบฝึกหัดที่ดีเกี่ยวกับการเขียนโปรแกรมเชิงวัตถุใน R หรือไม่? มันจะดีถ้ามันรวมต่อไปนี้: วิธีกำหนดคลาส ความแตกต่างระหว่างคลาส S3 และ S4 โอเปอเรเตอร์การบรรทุกเกินพิกัด (ฉันต้องการให้สามารถเขียนa+bตำแหน่งaและbอินสแตนซ์ของคลาสที่ฉันมีอยู่ในใจได้)
15 r 

4
ช่วงความเชื่อมั่นสำหรับพารามิเตอร์การถดถอย: Bayesian vs. Classical
จากสองอาร์เรย์ x และ y ความยาวทั้งสอง n ฉันพอดีกับโมเดล y = a + b * x และต้องการคำนวณช่วงความมั่นใจ 95% สำหรับความชัน นี่คือ (b - delta, b + delta) ซึ่ง b ถูกพบในวิธีปกติและ delta = qt(0.975,df=n-2)*se.slope และ se.slope เป็นข้อผิดพลาดมาตรฐานในความชัน วิธีการหนึ่งที่จะได้รับข้อผิดพลาดมาตรฐานของความลาดชันจาก R summary(lm(y~x))$coef[2,2]คือ ทีนี้สมมติว่าฉันเขียนความน่าจะเป็นของความชันที่ให้ x กับ y คูณนี่ด้วย "แบน" ก่อนแล้วใช้เทคนิค MCMC เพื่อวาดตัวอย่างmจากการกระจายหลัง กำหนด lims = quantile(m,c(0.025,0.975)) คำถามของฉัน: …

2
ตัวเลขสุ่มและแพ็คเกจมัลติคอร์
เมื่อเขียนโปรแกรมใน R ฉันใช้แพ็คเกจมัลติคอร์สองสามครั้ง อย่างไรก็ตามฉันไม่เคยเห็นคำสั่งเกี่ยวกับวิธีการจัดการกับตัวเลขสุ่ม เมื่อฉันใช้ openMP กับ C ฉันระวังที่จะใช้ RNG แบบขนานที่เหมาะสม แต่ด้วย R ฉันคิดว่ามีบางอย่างที่เหมาะสมเกิดขึ้น มีใครยืนยันได้ไหมว่ามีบางสิ่งที่เหมาะสมเกิดขึ้น? ตัวอย่าง จากเอกสารเรามี x <- foreach(icount(1000), .combine = "+") %do% rnorm(4) วิธีนี้เป็นrnorm`s สร้าง?

4
เปรียบเทียบโมเดลเอฟเฟกต์แบบผสมด้วยจำนวนองศาอิสระเท่ากัน
ฉันมีการทดลองที่ฉันจะพยายามทำให้เป็นนามธรรมที่นี่ ลองนึกภาพฉันโยนหินสีขาวสามใบไว้หน้าคุณและขอให้คุณตัดสินเกี่ยวกับตำแหน่งของพวกเขา ฉันบันทึกคุณสมบัติต่าง ๆ ของหินและการตอบสนองของคุณ ฉันทำสิ่งนี้กับหลาย ๆ วิชา ฉันสร้างสองรุ่น หนึ่งคือหินที่อยู่ใกล้คุณที่สุดทำนายการตอบสนองของคุณและอีกอย่างคือหินเรขาคณิตที่อยู่ตรงกลางทำนายการตอบสนองของคุณ ดังนั้นการใช้ lmer ใน RI สามารถเขียนได้ mNear <- lmer(resp ~ nearest + (1|subject), REML = FALSE) mCenter <- lmer(resp ~ center + (1|subject), REML = FALSE) อัปเดตและเปลี่ยน - เวอร์ชันตรงเพิ่มเติมที่รวมความคิดเห็นที่เป็นประโยชน์ไว้หลายประการ ฉันสามารถลอง anova(mNear, mCenter) ซึ่งไม่ถูกต้องแน่นอนเพราะพวกมันไม่ได้ซ้อนกันอยู่และฉันไม่สามารถเปรียบเทียบพวกเขาในแบบนั้นได้ ฉันคาดหวังว่า anova.mer จะโยนข้อผิดพลาด แต่ก็ไม่ได้ แต่ความเป็นไปได้ในการทำรังที่ฉันสามารถลองได้ที่นี่ไม่เป็นธรรมชาติและยังทำให้ฉันมีงบการวิเคราะห์ค่อนข้างน้อย เมื่อแบบจำลองซ้อนกันตามธรรมชาติ (เช่นกำลังสองบนเส้นตรง) การทดสอบเป็นทางเดียวเท่านั้น …

5
วิธีที่ดีในการแสดงข้อมูลจำนวนมากแบบกราฟิก
ฉันกำลังทำงานในโครงการที่มีตัวแปร 14 ตัวและการสังเกตการณ์ 345,000 ครั้งสำหรับข้อมูลที่อยู่อาศัย (สิ่งต่าง ๆ เช่นปีที่สร้างขึ้นวิดีโอสแควร์ราคาขายเขตที่อยู่อาศัย ฯลฯ ) ฉันกังวลกับการพยายามค้นหาเทคนิคกราฟิกที่ดีและไลบรารี R ที่มีเทคนิคการพล็อตที่ดี ฉันได้เห็นสิ่งที่เป็น ggplot และขัดแตะจะทำงานได้ดีและฉันกำลังคิดที่จะทำไวโอลินสำหรับตัวแปรเชิงตัวเลขของฉัน แพคเกจอื่นใดที่ผู้คนจะแนะนำให้แสดงตัวแปรตัวเลขหรือตัวประกอบจำนวนมากในรูปแบบที่ชัดเจนขัดเงาและที่สำคัญที่สุดคือรวบรัด?

2
การถดถอยแบบขั้นตอนใน R - มันทำงานอย่างไร
ฉันพยายามที่จะเข้าใจความแตกต่างพื้นฐานระหว่างการถดถอยแบบขั้นตอนและย้อนกลับใน R โดยใช้ฟังก์ชั่นขั้นตอน สำหรับการถดถอยแบบขั้นตอนฉันใช้คำสั่งต่อไปนี้ step(lm(mpg~wt+drat+disp+qsec,data=mtcars),direction="both") ฉันได้ผลลัพธ์ด้านล่างสำหรับโค้ดด้านบน สำหรับการเลือกตัวแปรย้อนหลังฉันใช้คำสั่งต่อไปนี้ step(lm(mpg~wt+drat+disp+qsec,data=mtcars),direction="backward") และฉันได้ผลลัพธ์ด้านล่างสำหรับย้อนหลัง มากที่สุดเท่าที่ฉันเข้าใจเมื่อไม่มีการระบุพารามิเตอร์การเลือกแบบขั้นตอนทำหน้าที่ย้อนหลังเว้นแต่จะระบุพารามิเตอร์ "upper" และ "lower" ใน R แต่ในเอาต์พุตของการเลือกแบบ stepwise มี + disp ที่เพิ่มเข้ามา ขั้นตอนที่ 2 ฟังก์ชั่นพยายามทำอะไรโดยเพิ่มเครื่องหมาย + อีกครั้งในการเลือกแบบขั้นตอน? ทำไม R เพิ่ม + disp ในขั้นตอนที่ 2 ในขณะที่ผลลัพธ์เหมือนกัน (ค่า AIC และค่าการเลือกแบบจำลอง) เป็นการเลือกแบบย้อนหลัง R ทำงานอย่างไรในการเลือกแบบขั้นตอน ฉันต้องการเข้าใจจริงๆว่าฟังก์ชั่นนี้ทำงานอย่างไรใน R. ขอบคุณล่วงหน้าสำหรับความช่วยเหลือ!
15 r  regression 

3
การถดถอยโลจิสติก: Scikit Learn vs glmnet
ฉันพยายามทำซ้ำผลลัพธ์จากsklearnไลบรารีถดถอยโลจิสติกโดยใช้glmnetแพคเกจใน R จากเอกสารsklearnการถดถอยโลจิสติกพยายามลดฟังก์ชั่นค่าใช้จ่ายภายใต้บทลงโทษ l2 ขั้นต่ำw , c 1minw,c12wTw+C∑i=1Nlog(exp(−yi(XTiw + c ) ) + 1)minw,ค12wTW+คΣผม=1ยังไม่มีข้อความเข้าสู่ระบบ⁡(ประสบการณ์⁡(-Yผม(XผมTW+ค))+1)\min_{w,c} \frac12 w^Tw + C\sum_{i=1}^N \log(\exp(-y_i(X_i^Tw+c)) + 1) จากสะเปะสะปะของglmnetการดำเนินงานของฟังก์ชั่นช่วยลดค่าใช้จ่ายแตกต่างกันเล็กน้อย นาทีβ, β0- [ 1ยังไม่มีข้อความΣi = 1ยังไม่มีข้อความYผม( β0+ xTผมβ) - บันทึก( 1 + e( β0+ xTผมβ)) ] + λ [ ( α - 1 ) | | β| |22/ …

3
แบบจำลองสำหรับข้อมูลที่ไม่เป็นลบพร้อมการจับกลุ่มที่ศูนย์ (Tweedie GLM, GLM ที่ไม่ทำให้เป็นศูนย์เป็นต้น) สามารถทำนายค่าศูนย์ที่แน่นอนได้หรือไม่
การแจกแจงแบบทวีคูณสามารถสร้างแบบจำลองข้อมูลเอียงด้วยมวลจุดที่ศูนย์เมื่อพารามิเตอร์ (เลขชี้กำลังในความสัมพันธ์ความแปรปรวนเฉลี่ย) อยู่ระหว่าง 1 ถึง 2ppp ในทำนองเดียวกันรูปแบบศูนย์ที่พองเกิน (ไม่ว่าจะเป็นแบบต่อเนื่องหรือไม่ต่อเนื่อง) อาจมีเลขศูนย์จำนวนมาก ฉันมีปัญหาในการทำความเข้าใจว่าทำไมเมื่อฉันทำการทำนายหรือคำนวณค่าติดตั้งกับโมเดลเหล่านี้ค่าที่ทำนายทั้งหมดจะไม่เป็นศูนย์ แบบจำลองเหล่านี้สามารถทำนายค่าศูนย์ที่แน่นอนได้จริงหรือ ตัวอย่างเช่น library(tweedie) library(statmod) # generate data y <- rtweedie( 100, xi=1.3, mu=1, phi=1) # xi=p x <- y+rnorm( length(y), 0, 0.2) # estimate p out <- tweedie.profile( y~1, p.vec=seq(1.1, 1.9, length=9)) # fit glm fit <- glm( y ~ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.