การเขียนโปรแกรม r

7

ฉันมีคำถามเล็กน้อย: ฉันไม่พบโครงสร้างข้อมูลพจนานุกรมใน R ดังนั้นฉันจึงใช้ list แทน (เช่น "word" -> number) ดังนั้นตอนนี้ฉันมีปัญหาในการรับรายการคีย์ มีใครรู้บ้าง?

93 r list hashmap lookup

6

รับค่าสูงสุดตามกลุ่ม

นี่คือกรอบข้อมูลตัวอย่าง: d <- data.frame( x = runif(90), grp = gl(3, 30) ) ฉันต้องการย่อยของdที่มีแถวกับด้านบน 5 ค่าสำหรับค่าของแต่ละxgrp การใช้ฐาน -R แนวทางของฉันจะเป็นดังนี้: ordered <- d[order(d$x, decreasing = TRUE), ] splits <- split(ordered, ordered$grp) heads <- lapply(splits, head) do.call(rbind, heads) ## x grp ## 1.19 0.8879631 1 ## 1.4 0.8844818 1 ## 1.12 0.8596197 1 …

93 r data.table dplyr

2

แปลงเวกเตอร์เป็นรายการโดยแต่ละองค์ประกอบในเวกเตอร์เป็นองค์ประกอบในรายการ

เวกเตอร์เป็นดังนี้: c(1,2,3) #[1] 1 2 3 ฉันต้องการสิ่งนี้: list(1,2,3) #[[1]] #[1] 1 # #[[2]] #[1] 2 # #[[3]] #[1] 3 ฉันลองสิ่งนี้: list(c(1,2,3)) #[[1]] #[1] 1 2 3

93 r r-faq

7

ใช้ฟังก์ชันสรุปหลายตัวแปรตามกลุ่มในการโทรครั้งเดียว

ฉันมีกรอบข้อมูลต่อไปนี้ x <- read.table(text = " id1 id2 val1 val2 1 a x 1 9 2 a x 2 4 3 a y 3 5 4 a y 4 9 5 b x 1 7 6 b y 4 4 7 b x 3 9 8 b y 2 8", …

93 r aggregate r-faq

7

กำลังแปลงปีและเดือน (รูปแบบ“ ปปปป - มม”) เป็นวันที่หรือไม่

ฉันมีชุดข้อมูลที่มีลักษณะดังนี้: Month count 2009-01 12 2009-02 310 2009-03 2379 2009-04 234 2009-05 14 2009-08 1 2009-09 34 2009-10 2386 ฉันต้องการลงจุดข้อมูล (เดือนเป็นค่า x และนับเป็นค่า y) เนื่องจากมีช่องว่างในข้อมูลฉันจึงต้องการแปลงข้อมูลสำหรับเดือนเป็นวันที่ ฉันเหนื่อย: as.Date("2009-03", "%Y-%m") แต่มันไม่ได้ผล มีอะไรผิดปกติ ดูเหมือนว่าวันที่ () ต้องการวันด้วยและไม่สามารถกำหนดค่ามาตรฐานสำหรับวันได้ ฟังก์ชันใดที่ช่วยแก้ปัญหาของฉันได้

93 r date posix zoo r-faq

3

ลบตำนานพิเศษใน ggplot2

ggplot2ฉันมีกรอบข้อมูลง่ายที่ฉันพยายามที่จะทำสายรวมกันและพล็อตจุดโดยใช้ สมมติว่าข้อมูลของฉันมีลักษณะดังนี้: df <- data.frame(x=rep(1:10,2), y=c(1:10,11:20), group=c(rep("a",10),rep("b",10))) และฉันกำลังพยายามสร้างพล็อต: g <- ggplot(df, aes(x=x, y=y, group=group)) g <- g + geom_line(aes(colour=group)) g <- g + geom_point(aes(colour=group, alpha = .8)) g ผลลัพธ์ดูดีโดยมีข้อยกเว้นหนึ่งข้อ มีคำอธิบายเพิ่มเติมที่แสดงalphaสำหรับgeom_pointเลเยอร์ของฉัน ฉันจะทำให้คำอธิบายแผนภูมิแสดงสีกลุ่มได้อย่างไร แต่ไม่ใช่สีที่แสดงการตั้งค่าอัลฟาของฉัน

93 r ggplot2 legend

6

อ่านไฟล์ข้อความที่มีความกว้างคงที่

ฉันพยายามโหลดชุดข้อมูลที่มีรูปแบบน่าเกลียดนี้ลงในเซสชัน R ของฉัน: http://www.cpc.ncep.noaa.gov/data/indices/wksst8110.for Weekly SST data starts week centered on 3Jan1990 Nino1+2 Nino3 Nino34 Nino4 Week SST SSTA SST SSTA SST SSTA SST SSTA 03JAN1990 23.4-0.4 25.1-0.3 26.6 0.0 28.6 0.3 10JAN1990 23.4-0.8 25.2-0.3 26.6 0.1 28.6 0.3 17JAN1990 24.2-0.3 25.3-0.3 26.5-0.1 28.6 0.3 จนถึงตอนนี้ฉันสามารถอ่านบรรทัดด้วย x = readLines(path) แต่ไฟล์ผสม …

93 r fixed-width

1

ความสัมพันธ์ระหว่าง R Markdown, Knitr, Pandoc และ Bookdown

ความสัมพันธ์ระหว่างฟังก์ชันการทำงานของ R Markdown, Knitr, Pandoc และ Bookdown คืออะไร? โดยเฉพาะอย่างยิ่งอะไรคือ 'การแบ่งงาน' ระหว่างแพ็คเกจเหล่านี้ในการแปลงเอกสารมาร์กอัปที่มีรหัส R ฝังตัว (เช่น.Rnwหรือ.Rmd) เป็นผลลัพธ์สุดท้าย (เช่น.pdfหรือ.html)? และหากใช้ Knitr ในการประมวลผล RMarkdown rmarkdownแพ็กเกจจะทำหน้าที่อะไรและแตกต่างกับแพคเกจอย่างไรmarkdown package?

93 r knitr r-markdown pandoc bookdown

4

วิธีสร้างเวกเตอร์ตัวเลขที่มีความยาวเป็นศูนย์ใน R

ฉันสงสัยว่าฉันจะสร้างเวกเตอร์ที่เป็นตัวเลขความยาวศูนย์ใน R ได้อย่างไร

92 r vector numeric zero

5

write.table เขียนคอลัมน์ว่างชั้นนำที่ไม่ต้องการไปยังส่วนหัวเมื่อมีชื่อแถว

ตรวจสอบตัวอย่างนี้: > a = matrix(1:9, nrow = 3, ncol = 3, dimnames = list(LETTERS[1:3], LETTERS[1:3])) > a A B C A 1 4 7 B 2 5 8 C 3 6 9 ตารางแสดงอย่างถูกต้อง มีสองวิธีในการเขียนลงไฟล์ ... write.csv(a, 'a.csv') ซึ่งให้ตามที่คาดไว้: "","A","B","C" "A",1,4,7 "B",2,5,8 "C",3,6,9 และwrite.table(a, 'a.txt')สกรูตัวไหน "A" "B" "C" "A" 1 4 …

92 r export-to-csv write.table

5

ฉันจะจัดเรียงรายการตัวแปรของแปลงโดยใช้ grid.arrange ได้อย่างไร

library(ggplot2) df <- data.frame(x=1:10, y=rnorm(10)) p1 <- ggplot(df, aes(x,y)) + geom_point() plist <- list(p1,p1,p1,p1,p1) # In my real example,a plot function will fit a ggplot to a list of datasets #and return a list of ggplots like the example above. ฉันต้องการจัดแปลงโดยใช้grid.arrange()ในgridExtra. ฉันจะทำสิ่งนี้ได้อย่างไรหากจำนวนพล็อตในplistเป็นตัวแปร ใช้งานได้: grid.arrange(plist[[1]],plist[[2]],plist[[3]],plist[[4]],plist[[5]]) แต่ฉันต้องการวิธีแก้ปัญหาทั่วไปมากกว่านี้ ความคิด?

92 r ggplot2

1

R สำหรับลูปข้ามไปยัง ifelse การวนซ้ำถัดไป

สมมติว่าคุณมีห่วงแบบนี้ for(n in 1:5) { #if(n=3) # skip 3rd iteration and go to next iteration cat(n) } เราจะข้ามไปยังการทำซ้ำครั้งถัดไปได้อย่างไรหากตรงตามเงื่อนไข

92 r for-loop

5

เลือก / กำหนดให้กับ data.table เมื่อชื่อตัวแปรถูกเก็บไว้ในเวกเตอร์อักขระ

คุณอ้างถึงตัวแปรอย่างไรในdata.tableกรณีที่ชื่อตัวแปรถูกเก็บไว้ในเวกเตอร์อักขระ ตัวอย่างเช่นสิ่งนี้ใช้ได้กับdata.frame: df <- data.frame(col1 = 1:3) colname <- "col1" df[colname] <- 4:6 df # col1 # 1 4 # 2 5 # 3 6 ฉันจะดำเนินการเดียวกันนี้กับ data.table ได้อย่างไรไม่ว่าจะมีหรือไม่มี:=สัญกรณ์ สิ่งที่ชัดเจนของการdt[ , list(colname)]ใช้งานไม่ได้ (และฉันไม่คาดหวัง)

92 r data.table

4

ต้องไม่ใช้ R ggplot2: stat_count () โดยมีข้อผิดพลาดเกี่ยวกับสุนทรียศาสตร์ในกราฟแท่ง

ฉันได้รับข้อผิดพลาดนี้ขณะพล็อตกราฟแท่งและฉันไม่สามารถกำจัดมันได้ฉันได้ลองทั้ง qplot และ ggplot แล้ว แต่ก็ยังเป็นข้อผิดพลาดเหมือนเดิม ต่อไปนี้คือรหัสของฉัน: library(dplyr) library(ggplot2) #Investigate data further to build a machine learning model data_country = data %>% group_by(country) %>% summarise(conversion_rate = mean(converted)) #Ist method qplot(country, conversion_rate, data = data_country,geom = "bar", stat ="identity", fill = country) #2nd method ggplot(data_country)+aes(x=country,y = conversion_rate)+geom_bar() ข้อผิดพลาด: stat_count() must not …

92 r ggplot2 bar-chart

4

dplyr บน data.table ฉันใช้ data.table จริงหรือ

ถ้าฉันใช้ไวยากรณ์dplyrกับdatatableฉันจะได้รับประโยชน์ด้านความเร็วทั้งหมดของ datatable ในขณะที่ยังใช้ไวยากรณ์ของ dplyr หรือไม่ กล่าวอีกนัยหนึ่งฉันใช้ datatable ผิดหรือไม่หากฉันค้นหาด้วยไวยากรณ์ dplyr หรือฉันจำเป็นต้องใช้ไวยากรณ์ที่สามารถจัดเก็บข้อมูลได้อย่างแท้จริงเพื่อควบคุมพลังทั้งหมดของมัน ขอบคุณล่วงหน้าสำหรับคำแนะนำใด ๆ ตัวอย่างรหัส: library(data.table) library(dplyr) diamondsDT <- data.table(ggplot2::diamonds) setkey(diamondsDT, cut) diamondsDT %>% filter(cut != "Fair") %>% group_by(cut) %>% summarize(AvgPrice = mean(price), MedianPrice = as.numeric(median(price)), Count = n()) %>% arrange(desc(Count)) ผล: # cut AvgPrice MedianPrice Count # 1 Ideal 3457.542 1810.0 …

92 r data.table dplyr

คำถามติดแท็ก r