คำถามติดแท็ก r

R เป็นภาษาการเขียนโปรแกรมแบบโอเพนซอร์สและสภาพแวดล้อมซอฟต์แวร์สำหรับการคำนวณทางสถิติชีวสารสนเทศศาสตร์การสร้างภาพและการคำนวณทั่วไป โปรดให้ตัวอย่างที่น้อยที่สุดและทำซ้ำได้พร้อมกับผลลัพธ์ที่ต้องการ ใช้ `dput ()` สำหรับข้อมูลและระบุแพ็คเกจที่ไม่ใช่ฐานทั้งหมดด้วยการเรียก `library ()` อย่าฝังรูปภาพสำหรับข้อมูลหรือรหัสให้ใช้บล็อกรหัสเยื้องแทน สำหรับคำถามที่เกี่ยวข้องกับสถิติให้ใช้ https://stats.stackexchange.com

7
การทำงานกับพจนานุกรม / รายการใน R
ฉันมีคำถามเล็กน้อย: ฉันไม่พบโครงสร้างข้อมูลพจนานุกรมใน R ดังนั้นฉันจึงใช้ list แทน (เช่น "word" -> number) ดังนั้นตอนนี้ฉันมีปัญหาในการรับรายการคีย์ มีใครรู้บ้าง?
93 r  list  hashmap  lookup 

6
รับค่าสูงสุดตามกลุ่ม
นี่คือกรอบข้อมูลตัวอย่าง: d <- data.frame( x = runif(90), grp = gl(3, 30) ) ฉันต้องการย่อยของdที่มีแถวกับด้านบน 5 ค่าสำหรับค่าของแต่ละxgrp การใช้ฐาน -R แนวทางของฉันจะเป็นดังนี้: ordered <- d[order(d$x, decreasing = TRUE), ] splits <- split(ordered, ordered$grp) heads <- lapply(splits, head) do.call(rbind, heads) ## x grp ## 1.19 0.8879631 1 ## 1.4 0.8844818 1 ## 1.12 0.8596197 1 …
93 r  data.table  dplyr 



7
กำลังแปลงปีและเดือน (รูปแบบ“ ปปปป - มม”) เป็นวันที่หรือไม่
ฉันมีชุดข้อมูลที่มีลักษณะดังนี้: Month count 2009-01 12 2009-02 310 2009-03 2379 2009-04 234 2009-05 14 2009-08 1 2009-09 34 2009-10 2386 ฉันต้องการลงจุดข้อมูล (เดือนเป็นค่า x และนับเป็นค่า y) เนื่องจากมีช่องว่างในข้อมูลฉันจึงต้องการแปลงข้อมูลสำหรับเดือนเป็นวันที่ ฉันเหนื่อย: as.Date("2009-03", "%Y-%m") แต่มันไม่ได้ผล มีอะไรผิดปกติ ดูเหมือนว่าวันที่ () ต้องการวันด้วยและไม่สามารถกำหนดค่ามาตรฐานสำหรับวันได้ ฟังก์ชันใดที่ช่วยแก้ปัญหาของฉันได้
93 r  date  posix  zoo  r-faq 

3
ลบตำนานพิเศษใน ggplot2
ggplot2ฉันมีกรอบข้อมูลง่ายที่ฉันพยายามที่จะทำสายรวมกันและพล็อตจุดโดยใช้ สมมติว่าข้อมูลของฉันมีลักษณะดังนี้: df <- data.frame(x=rep(1:10,2), y=c(1:10,11:20), group=c(rep("a",10),rep("b",10))) และฉันกำลังพยายามสร้างพล็อต: g <- ggplot(df, aes(x=x, y=y, group=group)) g <- g + geom_line(aes(colour=group)) g <- g + geom_point(aes(colour=group, alpha = .8)) g ผลลัพธ์ดูดีโดยมีข้อยกเว้นหนึ่งข้อ มีคำอธิบายเพิ่มเติมที่แสดงalphaสำหรับgeom_pointเลเยอร์ของฉัน ฉันจะทำให้คำอธิบายแผนภูมิแสดงสีกลุ่มได้อย่างไร แต่ไม่ใช่สีที่แสดงการตั้งค่าอัลฟาของฉัน
93 r  ggplot2  legend 

6
อ่านไฟล์ข้อความที่มีความกว้างคงที่
ฉันพยายามโหลดชุดข้อมูลที่มีรูปแบบน่าเกลียดนี้ลงในเซสชัน R ของฉัน: http://www.cpc.ncep.noaa.gov/data/indices/wksst8110.for Weekly SST data starts week centered on 3Jan1990 Nino1+2 Nino3 Nino34 Nino4 Week SST SSTA SST SSTA SST SSTA SST SSTA 03JAN1990 23.4-0.4 25.1-0.3 26.6 0.0 28.6 0.3 10JAN1990 23.4-0.8 25.2-0.3 26.6 0.1 28.6 0.3 17JAN1990 24.2-0.3 25.3-0.3 26.5-0.1 28.6 0.3 จนถึงตอนนี้ฉันสามารถอ่านบรรทัดด้วย x = readLines(path) แต่ไฟล์ผสม …
93 r  fixed-width 

1
ความสัมพันธ์ระหว่าง R Markdown, Knitr, Pandoc และ Bookdown
ความสัมพันธ์ระหว่างฟังก์ชันการทำงานของ R Markdown, Knitr, Pandoc และ Bookdown คืออะไร? โดยเฉพาะอย่างยิ่งอะไรคือ 'การแบ่งงาน' ระหว่างแพ็คเกจเหล่านี้ในการแปลงเอกสารมาร์กอัปที่มีรหัส R ฝังตัว (เช่น.Rnwหรือ.Rmd) เป็นผลลัพธ์สุดท้าย (เช่น.pdfหรือ.html)? และหากใช้ Knitr ในการประมวลผล RMarkdown rmarkdownแพ็กเกจจะทำหน้าที่อะไรและแตกต่างกับแพคเกจอย่างไรmarkdown package?


5
write.table เขียนคอลัมน์ว่างชั้นนำที่ไม่ต้องการไปยังส่วนหัวเมื่อมีชื่อแถว
ตรวจสอบตัวอย่างนี้: > a = matrix(1:9, nrow = 3, ncol = 3, dimnames = list(LETTERS[1:3], LETTERS[1:3])) > a A B C A 1 4 7 B 2 5 8 C 3 6 9 ตารางแสดงอย่างถูกต้อง มีสองวิธีในการเขียนลงไฟล์ ... write.csv(a, 'a.csv') ซึ่งให้ตามที่คาดไว้: "","A","B","C" "A",1,4,7 "B",2,5,8 "C",3,6,9 และwrite.table(a, 'a.txt')สกรูตัวไหน "A" "B" "C" "A" 1 4 …

5
ฉันจะจัดเรียงรายการตัวแปรของแปลงโดยใช้ grid.arrange ได้อย่างไร
library(ggplot2) df <- data.frame(x=1:10, y=rnorm(10)) p1 <- ggplot(df, aes(x,y)) + geom_point() plist <- list(p1,p1,p1,p1,p1) # In my real example,a plot function will fit a ggplot to a list of datasets #and return a list of ggplots like the example above. ฉันต้องการจัดแปลงโดยใช้grid.arrange()ในgridExtra. ฉันจะทำสิ่งนี้ได้อย่างไรหากจำนวนพล็อตในplistเป็นตัวแปร ใช้งานได้: grid.arrange(plist[[1]],plist[[2]],plist[[3]],plist[[4]],plist[[5]]) แต่ฉันต้องการวิธีแก้ปัญหาทั่วไปมากกว่านี้ ความคิด?
92 r  ggplot2 


5
เลือก / กำหนดให้กับ data.table เมื่อชื่อตัวแปรถูกเก็บไว้ในเวกเตอร์อักขระ
คุณอ้างถึงตัวแปรอย่างไรในdata.tableกรณีที่ชื่อตัวแปรถูกเก็บไว้ในเวกเตอร์อักขระ ตัวอย่างเช่นสิ่งนี้ใช้ได้กับdata.frame: df <- data.frame(col1 = 1:3) colname <- "col1" df[colname] <- 4:6 df # col1 # 1 4 # 2 5 # 3 6 ฉันจะดำเนินการเดียวกันนี้กับ data.table ได้อย่างไรไม่ว่าจะมีหรือไม่มี:=สัญกรณ์ สิ่งที่ชัดเจนของการdt[ , list(colname)]ใช้งานไม่ได้ (และฉันไม่คาดหวัง)
92 r  data.table 

4
ต้องไม่ใช้ R ggplot2: stat_count () โดยมีข้อผิดพลาดเกี่ยวกับสุนทรียศาสตร์ในกราฟแท่ง
ฉันได้รับข้อผิดพลาดนี้ขณะพล็อตกราฟแท่งและฉันไม่สามารถกำจัดมันได้ฉันได้ลองทั้ง qplot และ ggplot แล้ว แต่ก็ยังเป็นข้อผิดพลาดเหมือนเดิม ต่อไปนี้คือรหัสของฉัน: library(dplyr) library(ggplot2) #Investigate data further to build a machine learning model data_country = data %>% group_by(country) %>% summarise(conversion_rate = mean(converted)) #Ist method qplot(country, conversion_rate, data = data_country,geom = "bar", stat ="identity", fill = country) #2nd method ggplot(data_country)+aes(x=country,y = conversion_rate)+geom_bar() ข้อผิดพลาด: stat_count() must not …
92 r  ggplot2  bar-chart 

4
dplyr บน data.table ฉันใช้ data.table จริงหรือ
ถ้าฉันใช้ไวยากรณ์dplyrกับdatatableฉันจะได้รับประโยชน์ด้านความเร็วทั้งหมดของ datatable ในขณะที่ยังใช้ไวยากรณ์ของ dplyr หรือไม่ กล่าวอีกนัยหนึ่งฉันใช้ datatable ผิดหรือไม่หากฉันค้นหาด้วยไวยากรณ์ dplyr หรือฉันจำเป็นต้องใช้ไวยากรณ์ที่สามารถจัดเก็บข้อมูลได้อย่างแท้จริงเพื่อควบคุมพลังทั้งหมดของมัน ขอบคุณล่วงหน้าสำหรับคำแนะนำใด ๆ ตัวอย่างรหัส: library(data.table) library(dplyr) diamondsDT <- data.table(ggplot2::diamonds) setkey(diamondsDT, cut) diamondsDT %>% filter(cut != "Fair") %>% group_by(cut) %>% summarize(AvgPrice = mean(price), MedianPrice = as.numeric(median(price)), Count = n()) %>% arrange(desc(Count)) ผล: # cut AvgPrice MedianPrice Count # 1 Ideal 3457.542 1810.0 …
92 r  data.table  dplyr 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.