การเขียนโปรแกรม r

1

ฉันพยายามทำให้ชื่ออธิบายตัวเอง แต่นี่ไป - ข้อมูลก่อน: dtf <- structure(list(variable = structure(c(1L, 1L, 2L, 2L, 3L, 3L, 4L, 4L, 5L, 5L), .Label = c("vma", "vla", "ia", "fma", "fla"), class = "factor"), ustanova = structure(c(1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L), .Label = c("srednja škola", "fakultet"), class = "factor"), `(all)` = …

99 r plot ggplot2 bar-chart

8

การหมุนฉลากแกน x ใน R สำหรับ barplot

ฉันพยายามทำให้ป้ายแกน x หมุน 45 องศาบนบาร์พล็อตโดยไม่มีโชค นี่คือรหัสที่ฉันมีด้านล่าง: barplot(((data1[,1] - average)/average) * 100, srt = 45, adj = 1, xpd = TRUE, names.arg = data1[,2], col = c("#3CA0D0"), main = "Best Lift Time to Vertical Drop Ratios of North American Resorts", ylab = "Normalized Difference", yaxt = 'n', cex.names = 0.65, cex.lab …

99 r graph plot bar-chart axis-labels

6

การเลือกระหว่าง qplot () และ ggplot () ใน ggplot2 [ปิด]

ปิด . คำถามนี้เป็นคำถามความคิดเห็นตาม ขณะนี้ยังไม่ยอมรับคำตอบ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้สามารถตอบได้ด้วยข้อเท็จจริงและการอ้างอิงโดยแก้ไขโพสต์นี้ ปิดให้บริการใน3 ปีที่ผ่านมา ปรับปรุงคำถามนี้ ฉันกำลังเริ่มใช้ggplot2แพ็กเกจที่ยอดเยี่ยมสำหรับการวางแผนใน R และสิ่งแรกที่ฉันถามตัวเองก่อนที่แต่ละพล็อตคือ"ดีฉันจะใช้qplotหรือggplot?" ฉันเข้าใจว่าqplotมีไวยากรณ์ที่ง่ายกว่าในขณะที่ggplotให้คุณสมบัติและความยืดหยุ่นสูงสุด แต่ฟังก์ชันใดที่คุณใช้มากที่สุดและคุณมีกรณีการใช้งานที่แม่นยำสำหรับแต่ละฟังก์ชันหรือไม่ คุณใช้เป็นส่วนใหญ่qplotและggplotเฉพาะสำหรับพล็อตที่ซับซ้อนหรือคุณใช้ggplotทุกครั้ง? ขอบคุณสำหรับคำติชม!

98 r ggplot2

5

แสดงรายการค่าที่แตกต่างกันในเวกเตอร์ใน R

ฉันจะแสดงรายการค่าที่แตกต่างกันในเวกเตอร์ที่ค่าถูกจำลองได้อย่างไร ฉันหมายถึงคล้ายกับคำสั่ง SQL ต่อไปนี้: SELECT DISTINCT product_code FROM data

98 r vector distinct-values r-faq

6

รวมในหลายคอลัมน์ด้วย dplyr

dplyrคำถามของฉันที่เกี่ยวข้องกับข้อสรุปถึงค่าในหลายคอลัมน์ของกรอบข้อมูลและการสร้างคอลัมน์ใหม่ที่สอดคล้องกับผลบวกนี้โดยใช้ รายการข้อมูลในคอลัมน์เป็นไบนารี (0,1) ฉันคิดของอนาล็อกแถวที่ชาญฉลาดของsummarise_eachหรือการทำงานของmutate_each dplyrด้านล่างนี้เป็นตัวอย่างขั้นต่ำของ data frame: library(dplyr) df=data.frame( x1=c(1,0,0,NA,0,1,1,NA,0,1), x2=c(1,1,NA,1,1,0,NA,NA,0,1), x3=c(0,1,0,1,1,0,NA,NA,0,1), x4=c(1,0,NA,1,0,0,NA,0,0,1), x5=c(1,1,NA,1,1,1,NA,1,0,1)) > df x1 x2 x3 x4 x5 1 1 1 0 1 1 2 0 1 1 0 1 3 0 NA 0 NA NA 4 NA 1 1 1 1 5 0 1 1 0 …

98 r dplyr

4

โฮสติ้งและตั้งค่าแอพพลิเคชั่นเงางามของตัวเองโดยไม่ต้องใช้เซิร์ฟเวอร์

ฉันกำลังพยายามสร้างแอปพลิเคชันที่เป็นประกายให้กับเพื่อนร่วมงานของฉันโดยที่พวกเขาไม่ต้องเรียกใช้หรือติดตั้ง R ดังนั้นฉันจึงอ่านหน้าเว็บนี้ และพบประโยคนี้: หากคุณคุ้นเคยกับเว็บโฮสติ้งหรือมีสิทธิ์เข้าถึงแผนกไอทีคุณสามารถโฮสต์แอป Shiny ด้วยตัวคุณเอง ภายใต้ส่วน ' แบ่งปันเป็นหน้าเว็บ ' ฉันจะทำเช่นนี้ได้อย่างไร? ปัญหาคือ บริษัท ของฉันผูกพันกับข้อ จำกัด บางประการเกี่ยวกับเว็บโฮสติ้งและความปลอดภัยเป็นต้นและจะไม่ (ในตอนนี้) จ่ายเงินให้กับเซิร์ฟเวอร์โปร แต่ประโยคข้างต้นทำให้ฉันมีความหวังที่จะสร้างบางสิ่งขึ้นมาเพื่อโน้มน้าวใจพวกเขา

98 r web-hosting shiny shiny-server

5

การจัดการข้อยกเว้นใน R [ปิด]

ปิด. คำถามนี้ไม่เป็นไปตามหลักเกณฑ์กองมากเกิน ขณะนี้ยังไม่ยอมรับคำตอบ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Stack Overflow ปิดให้บริการใน4 ปีที่แล้ว ปรับปรุงคำถามนี้ ใครมีตัวอย่าง / บทช่วยสอนเกี่ยวกับการจัดการข้อยกเว้นใน R? เอกสารอย่างเป็นทางการค่อนข้างสั้นมาก

97 r exception-handling

7

ฉันจะโหลดออบเจ็กต์เป็นชื่อตัวแปรที่ฉันระบุจากไฟล์ข้อมูล R ได้อย่างไร

เมื่อคุณบันทึกตัวแปรในไฟล์ข้อมูล R โดยใช้ตัวแปรsaveนั้นจะถูกบันทึกภายใต้ชื่อใด ๆ ที่มีในเซสชันที่บันทึกไว้ เมื่อฉันไปโหลดจากเซสชันอื่นในภายหลังมันถูกโหลดด้วยชื่อเดียวกันซึ่งสคริปต์การโหลดไม่สามารถรู้ได้ ชื่อนี้สามารถเขียนทับตัวแปรที่มีอยู่ของชื่อเดียวกันในเซสชันการโหลด มีวิธีโหลดออบเจ็กต์อย่างปลอดภัยจากไฟล์ข้อมูลไปยังชื่อตัวแปรที่ระบุโดยไม่เสี่ยงต่อการโคลนตัวแปรที่มีอยู่หรือไม่? ตัวอย่าง: กำลังบันทึกเซสชัน: x = 5 save(x, file="x.Rda") กำลังโหลดเซสชัน: x = 7 load("x.Rda") print(x) # This will print 5. Oops. ฉันต้องการให้มันทำงานอย่างไร: x = 7 y = load_object_from_file("x.Rda") print(x) # should print 7 print(y) # should print 5

97 r variable-names rdata

10

Linear Regression และจัดกลุ่มตามใน R

ฉันต้องการทำการถดถอยเชิงเส้นใน R โดยใช้lm()ฟังก์ชัน ข้อมูลของฉันเป็นอนุกรมเวลารายปีโดยมีหนึ่งฟิลด์สำหรับปี (22 ปี) และอีกฟิลด์หนึ่งสำหรับรัฐ (50 สถานะ) ฉันต้องการให้พอดีกับการถดถอยสำหรับแต่ละสถานะดังนั้นในตอนท้ายฉันมีเวกเตอร์ของการตอบสนอง lm ฉันนึกภาพออกว่าทำลูปสำหรับแต่ละสถานะจากนั้นทำการถดถอยภายในลูปและเพิ่มผลลัพธ์ของการถดถอยแต่ละครั้งให้กับเวกเตอร์ อย่างไรก็ตามนั่นดูเหมือนจะไม่เหมือน R มากนัก ใน SAS ฉันจะทำคำสั่ง 'โดย' และใน SQL ฉันจะทำ 'จัดกลุ่มตาม' R ทำแบบนี้คืออะไร?

97 r regression linear-regression lm

5

วิธีใดเร็วที่สุดในการรวม / เข้าร่วม data.frames ใน R?

ตัวอย่างเช่น (ไม่แน่ใจว่าตัวอย่างที่เป็นตัวแทนส่วนใหญ่): N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) นี่คือสิ่งที่ฉันมีจนถึงตอนนี้: d <- merge(d1,d2) # 7.6 sec library(plyr) d <- join(d1,d2) # 2.9 sec library(data.table) dt1 <- data.table(d1, key="x") dt2 <- data.table(d2, key="x") d <- data.frame( dt1[dt2,list(x,y1,y2=dt2$y2)] ) # 4.9 sec library(sqldf) sqldf() sqldf("create index ix1 on …

97 performance r join merge data.table

5

แรเงาพล็อตความหนาแน่นของเคอร์เนลระหว่างสองจุด

ฉันมักใช้พล็อตความหนาแน่นของเคอร์เนลเพื่อแสดงการกระจาย สิ่งเหล่านี้เป็นเรื่องง่ายและรวดเร็วในการสร้างใน R ดังนี้: set.seed(1) draws <- rnorm(100)^2 dens <- density(draws) plot(dens) #or in one line like this: plot(density(rnorm(100)^2)) ซึ่งให้ PDF เล็ก ๆ น้อย ๆ นี้แก่ฉัน: ฉันต้องการแรเงาพื้นที่ใต้ PDF จากเปอร์เซ็นไทล์ที่ 75 ถึง 95 ง่ายต่อการคำนวณคะแนนโดยใช้quantileฟังก์ชัน: q75 <- quantile(draws, .75) q95 <- quantile(draws, .95) แต่ฉันจะแรเงาพื้นที่ระหว่างq75และได้q95อย่างไร?

97 r plot

8

R dplyr: วางหลายคอลัมน์

ฉันมี dataframe และรายการคอลัมน์ใน dataframe ที่ฉันต้องการทิ้ง ลองใช้irisชุดข้อมูลเป็นตัวอย่าง ฉันต้องการที่จะลดลงSepal.LengthและSepal.Widthและใช้เฉพาะคอลัมน์ที่เหลือ ฉันจะทำสิ่งนี้โดยใช้selectหรือselect_จากdplyrแพ็คเกจได้อย่างไร? นี่คือสิ่งที่ฉันได้ลองทำแล้ว: drop.cols <- c('Sepal.Length', 'Sepal.Width') iris %>% select(-drop.cols) ข้อผิดพลาดใน -drop.cols: อาร์กิวเมนต์ไม่ถูกต้องสำหรับตัวดำเนินการยูนารี iris %>% select_(.dots = -drop.cols) ข้อผิดพลาดใน -drop.cols: อาร์กิวเมนต์ไม่ถูกต้องสำหรับตัวดำเนินการยูนารี iris %>% select(!drop.cols) เกิดข้อผิดพลาดใน! drop.cols: ประเภทอาร์กิวเมนต์ไม่ถูกต้อง iris %>% select_(.dots = !drop.cols) เกิดข้อผิดพลาดใน! drop.cols: ประเภทอาร์กิวเมนต์ไม่ถูกต้อง ฉันรู้สึกว่าฉันพลาดอะไรบางอย่างที่ชัดเจนเพราะสิ่งเหล่านี้ดูเหมือนเป็นการดำเนินการที่มีประโยชน์ซึ่งควรมีอยู่แล้ว ใน Github มีคนโพสต์ปัญหาที่คล้ายกันและ Hadley บอกว่าให้ใช้ 'การสร้างดัชนีเชิงลบ' นั่นคือสิ่งที่ (ฉันคิด) …

97 r dplyr

5

การรวมกันที่ไม่ซ้ำกันขององค์ประกอบทั้งหมดตั้งแต่เวกเตอร์สอง (หรือมากกว่า)

ฉันพยายามสร้างชุดค่าผสมที่เป็นเอกลักษณ์ขององค์ประกอบทั้งหมดจากเวกเตอร์สองตัวที่มีขนาดต่างกันใน R ตัวอย่างเช่นเวกเตอร์แรกคือ a <- c("ABC", "DEF", "GHI") และวันที่สองคือวันที่ที่จัดเก็บเป็นสตริงในปัจจุบัน b <- c("2012-05-01", "2012-05-02", "2012-05-03", "2012-05-04", "2012-05-05") ฉันต้องการสร้าง data frame ที่มีสองคอลัมน์เช่นนี้ > data a b 1 ABC 2012-05-01 2 ABC 2012-05-02 3 ABC 2012-05-03 4 ABC 2012-05-04 5 ABC 2012-05-05 6 DEF 2012-05-01 7 DEF 2012-05-02 8 DEF 2012-05-03 9 DEF …

97 r r-faq

2

แก้ไขลำดับของแง่มุมใน ggplot

ข้อมูล: df <- data.frame( type = c("T", "F", "P", "T", "F", "P", "T", "F", "P", "T", "F", "P"), size = c("50%", "50%", "50%", "100%", "100%", "100%", "150%", "150%", "150%", "200%", "200%", "200%"), amount = c(48.4, 48.1, 46.8, 25.9, 26, 24.9, 21.1, 21.4, 20.1, 20.8, 21.5, 16.5) ) ฉันต้องการพล็อตกราฟแท่งของข้อมูลข้างต้นโดยใช้ ggplot (แกน …

97 r ggplot2 sequence facet

6

ชุดย่อยของแถวที่มีค่า NA (ไม่มี) ในคอลัมน์ที่เลือกของกรอบข้อมูล

เรามีกรอบข้อมูลจากไฟล์ CSV กรอบข้อมูลDFมีคอลัมน์ที่มีค่าที่สังเกตได้และคอลัมน์ ( VaR2) ที่มีวันที่ที่ทำการวัด หากไม่ได้บันทึกวันที่ไว้ไฟล์ CSV จะมีค่าNAสำหรับข้อมูลที่ขาดหายไป Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 เราต้องการใช้คำสั่งย่อยเพื่อกำหนดกรอบข้อมูลใหม่new_DFเพื่อให้มีเฉพาะแถวที่มีNA'ค่าจากคอลัมน์ ( VaR2) ในตัวอย่างที่ระบุจะมีเฉพาะแถวที่ 2 DFเท่านั้น คำสั่ง new_DF<-subset(DF,DF$Var2=="NA") ไม่ทำงานเฟรมข้อมูลผลลัพธ์ไม่มีรายการแถว หากในไฟล์ CSV เดิมราคาNAจะมีการแลกเปลี่ยนกับ คำสั่งเดียวกันผลิตผลลัพธ์ที่ต้องการ:NULLnew_DF<-subset(DF,DF$Var2=="NULL") ฉันจะทำให้วิธีนี้ใช้งานได้อย่างไรหากสำหรับสตริงอักขระมีการระบุค่าNAไว้ในไฟล์ CSV ดั้งเดิม

97 r csv dataframe subset na

คำถามติดแท็ก r