คำถามติดแท็ก r

R เป็นภาษาการเขียนโปรแกรมแบบโอเพนซอร์สและสภาพแวดล้อมซอฟต์แวร์สำหรับการคำนวณทางสถิติชีวสารสนเทศศาสตร์การสร้างภาพและการคำนวณทั่วไป โปรดให้ตัวอย่างที่น้อยที่สุดและทำซ้ำได้พร้อมกับผลลัพธ์ที่ต้องการ ใช้ `dput ()` สำหรับข้อมูลและระบุแพ็คเกจที่ไม่ใช่ฐานทั้งหมดด้วยการเรียก `library ()` อย่าฝังรูปภาพสำหรับข้อมูลหรือรหัสให้ใช้บล็อกรหัสเยื้องแทน สำหรับคำถามที่เกี่ยวข้องกับสถิติให้ใช้ https://stats.stackexchange.com

8
ผนวกค่ากับเวกเตอร์เปล่าใน R?
ฉันพยายามเรียนรู้ R และฉันไม่สามารถหาวิธีผนวกเข้ากับรายการ ถ้านี่เป็นงูหลามฉันจะ . . #Python vector = [] values = ['a','b','c','d','e','f','g'] for i in range(0,len(values)): vector.append(values[i]) คุณทำเช่นนี้ใน R อย่างไร #R Programming > vector = c() > values = c('a','b','c','d','e','f','g') > for (i in 1:length(values)) + #append value[i] to empty vector
160 r  list  vector  append 

23
วิธีแบ่งข้อมูลออกเป็นชุดฝึกอบรม / ทดสอบโดยใช้ฟังก์ชั่นตัวอย่าง
ฉันเพิ่งเริ่มใช้ R และฉันไม่แน่ใจว่าจะรวมชุดข้อมูลของฉันกับโค้ดตัวอย่างต่อไปนี้: sample(x, size, replace = FALSE, prob = NULL) ฉันมีชุดข้อมูลที่ฉันต้องใช้ในการฝึกอบรม (75%) และชุดการทดสอบ (25%) ฉันไม่แน่ใจว่าฉันควรใส่ข้อมูลอะไรลงไปในขนาดและ x? x เป็นชุดข้อมูลและขนาดเท่าไรที่ฉันมี?
160 r  sample 

2
hjust และ vjust ทำอะไรเมื่อสร้างจุดโดยใช้ ggplot
ทุกครั้งที่ฉันทำพล็อตโดยใช้ ggplot ฉันใช้เวลาเล็กน้อยในขณะที่พยายามค่าที่แตกต่างสำหรับ hjust และ vjust ในบรรทัดเช่น + opts(axis.text.x = theme_text(hjust = 0.5)) เพื่อให้ป้ายกำกับแกนเรียงกันตรงที่ที่ป้ายกำกับแกนเกือบแตะแกนนั้นและทำการลบออก (ให้ชิดกับแกนดังนั้นเพื่อพูด) อย่างไรก็ตามฉันไม่เข้าใจจริงๆว่าเกิดอะไรขึ้น บ่อยครั้งที่hjust = 0.5ให้ผลลัพธ์ที่แตกต่างอย่างมากจากhjust = 0.6ที่ฉันไม่สามารถเข้าใจได้โดยการเล่นกับค่าที่ต่างกัน ทุกคนสามารถชี้ให้ฉันเห็นคำอธิบายที่ครอบคลุมว่าตัวเลือก hjust and vjust ทำงานอย่างไร
159 r  plot  ggplot2 

2
เกิดข้อผิดพลาดใน if / while (เงื่อนไข) {: ไม่มีค่าที่ต้องการ TRUE / FALSE
ฉันได้รับข้อความแสดงข้อผิดพลาดนี้: Error in if (condition) { : missing value where TRUE/FALSE needed หรือ Error in while (condition) { : missing value where TRUE/FALSE needed มันหมายความว่าอย่างไรและฉันจะป้องกันได้อย่างไร
159 r  r-faq 

3
จะหาองค์ประกอบทั่วไปจากเวกเตอร์หลายตัวได้อย่างไร
มีใครบอกวิธีหาองค์ประกอบร่วมจากหลายเวคเตอร์ได้บ้าง a <- c(1,3,5,7,9) b <- c(3,6,8,9,10) c <- c(2,3,4,5,7,9) ฉันต้องการได้องค์ประกอบทั่วไปจากเวคเตอร์ด้านบน (เช่น 3 และ 9)
159 r  vector  r-faq 

11
วิธีที่ไม่เจ็บปวดในการติดตั้ง R เวอร์ชันใหม่?
Andrew Gelman เพิ่งเสียใจที่ขาดกระบวนการอัพเกรดที่ง่ายสำหรับ R (อาจเกี่ยวข้องกับ Windows มากกว่า Linux) ใครบ้างมีเคล็ดลับที่ดีในการทำการอัปเกรดตั้งแต่ติดตั้งซอฟต์แวร์ไปจนถึงการคัดลอกการตั้งค่า / แพ็คเกจทั้งหมดไป? ข้อเสนอแนะนี้มีอยู่ในความคิดเห็นและเป็นสิ่งที่ฉันได้ใช้เมื่อเร็ว ๆ นี้ ก่อนอื่นให้คุณติดตั้งเวอร์ชันใหม่จากนั้นรันในเวอร์ชันเก่า: #--run in the old version of R setwd("C:/Temp/") packages <- installed.packages()[,"Package"] save(packages, file="Rpackages") ตามมาด้วยสิ่งนี้ในเวอร์ชั่นใหม่: #--run in the new version setwd("C:/Temp/") load("Rpackages") for (p in setdiff(packages, installed.packages()[,"Package"])) install.packages(p)
158 r  upgrade  packages 

5
สั่งซื้อแถวข้อมูลเฟรมตามเวกเตอร์พร้อมคำสั่งเฉพาะ
มีวิธีที่ง่ายกว่าหรือไม่ในการตรวจสอบให้แน่ใจว่าแถวของกรอบข้อมูลได้รับการจัดเรียงตามเวกเตอร์ "เป้าหมาย" ที่ฉันดำเนินการในตัวอย่างสั้น ๆ ด้านล่างหรือไม่ df <- data.frame(name = letters[1:4], value = c(rep(TRUE, 2), rep(FALSE, 2))) df # name value # 1 a TRUE # 2 b TRUE # 3 c FALSE # 4 d FALSE target <- c("b", "c", "a", "d") สิ่งนี้ดูเหมือนจะค่อนข้าง "ซับซ้อน" เพื่อให้งานเสร็จ: idx <- sapply(target, function(x) { …
158 r  sorting  dataframe 

9
จัดกลุ่มตามหลายคอลัมน์ใน dplyr โดยใช้อินพุตเวกเตอร์สตริง
ฉันพยายามโอนความเข้าใจของ plyr ไปเป็น dplyr แต่ฉันไม่สามารถหาวิธีจัดกลุ่มตามคอลัมน์หลายคอลัมน์ได้ # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, replace=TRUE), a30mvxigxkghc5cdsvxvyv0ja = sample(LETTERS[1:3], 100, replace=TRUE), value = rnorm(100) ) # get the columns we want to average within columns = names(data)[-3] # plyr - works …
157 r  dplyr  r-faq 

5
ฉลากแกนหมุนใน R
ใน R ฉันจะสร้างป้ายแกน y ของพล็อต (แถบ) ขนานกับแกน X แทนที่จะขนานกับแกน Y ได้อย่างไร
156 r  label  axis  plot 

2
ค้นหาชื่อไฟล์จากพา ธ ไฟล์แบบเต็ม
มีวิธีการแตกชื่อไฟล์จากไฟล์เต็มพา ธ (ส่วนหนึ่งของพา ธ ไฟล์) โดยไม่ต้องวุ่นวายกับการจัดการสตริงหรือไม่? เทียบเท่าใน Java จะเป็น: File f = new File ("C:/some_dir/a") f.getName() //output a f.getFullAbsolutePath() //output c:/some_dir/a
156 file  r  path 

13
การควบคุม R และเวอร์ชั่นสำหรับนักวิเคราะห์ข้อมูลเดี่ยว
นักวิเคราะห์ข้อมูลหลายคนที่ฉันเคารพใช้การควบคุมเวอร์ชัน ตัวอย่างเช่น: http://github.com/hadley/ ดูความคิดเห็นในhttp://permut.wordpress.com/2010/04/21/revision-control-statistics-bleg/ อย่างไรก็ตามฉันกำลังประเมินว่าการใช้ระบบควบคุมเวอร์ชันเช่น git จะคุ้มค่าหรือไม่ ภาพรวมโดยย่อ: ฉันเป็นนักวิทยาศาสตร์สังคมที่ใช้ R เพื่อวิเคราะห์ข้อมูลสำหรับงานวิจัย ปัจจุบันฉันไม่ได้ผลิตแพ็คเกจ R โดยทั่วไปรหัส R ของฉันสำหรับโครงการจะมีโค้ดสองสามพันบรรทัดสำหรับการป้อนข้อมูลการทำความสะอาดการจัดการการวิเคราะห์และการสร้างผลลัพธ์ โดยทั่วไปแล้วสิ่งพิมพ์จะเขียนด้วย LaTeX สำหรับการควบคุมเวอร์ชันมีประโยชน์มากมายที่ฉันได้อ่าน แต่พวกเขาดูเหมือนจะไม่ค่อยเกี่ยวข้องกับนักวิเคราะห์ข้อมูลเดี่ยว สำรองข้อมูล:ฉันมีระบบสำรองข้อมูลอยู่แล้ว การแยกและกรอกลับ:ฉันไม่เคยรู้สึกว่าจำเป็นต้องทำเช่นนี้ แต่ฉันสามารถดูว่ามันจะมีประโยชน์อย่างไร (เช่นคุณกำลังเตรียมบทความวารสารหลายบทความตามชุดข้อมูลเดียวกันคุณกำลังเตรียมรายงานที่อัพเดตรายเดือน ฯลฯ ) การทำงานร่วมกัน:ส่วนใหญ่เวลาที่ฉันวิเคราะห์ข้อมูลด้วยตัวเองดังนั้นฉันจะไม่ได้รับประโยชน์จากการทำงานร่วมกันของการควบคุมเวอร์ชัน นอกจากนี้ยังมีค่าใช้จ่ายที่อาจเกิดขึ้นหลายอย่างที่เกี่ยวข้องกับการใช้การควบคุมเวอร์ชัน: ใช้เวลาในการประเมินและเรียนรู้ระบบควบคุมเวอร์ชัน ความซับซ้อนที่เพิ่มขึ้นในระบบการจัดการไฟล์ปัจจุบันของฉัน อย่างไรก็ตามฉันยังรู้สึกว่าฉันขาดอะไรไป คำแนะนำทั่วไปเกี่ยวกับการควบคุมเวอร์ชันดูเหมือนว่าจะมีการกล่าวถึงต่อนักวิทยาศาสตร์คอมพิวเตอร์มากกว่านักวิเคราะห์ข้อมูล ดังนั้นโดยเฉพาะเกี่ยวกับนักวิเคราะห์ข้อมูลในสถานการณ์ที่คล้ายกับที่ระบุไว้ข้างต้น: การควบคุมเวอร์ชันคุ้มค่ากับความพยายามหรือไม่? ข้อดีและข้อเสียของการใช้การควบคุมเวอร์ชันคืออะไร กลยุทธ์ที่ดีในการเริ่มต้นด้วยการควบคุมเวอร์ชันสำหรับการวิเคราะห์ข้อมูลด้วย R คืออะไร (ตัวอย่างเช่นแนวคิดเวิร์กโฟลว์ซอฟต์แวร์ลิงก์ไปยังคู่มือ)
155 git  version-control  r 

9
กรอง data.frame แถวตามเงื่อนไขโลจิคัล
ฉันต้องการกรองแถวจากเงื่อนไขdata.frameตามลอจิคัล สมมุติว่าฉันมีกรอบข้อมูลเหมือนกัน expr_value cell_type 1 5.345618 bj fibroblast 2 5.195871 bj fibroblast 3 5.247274 bj fibroblast 4 5.929771 hesc 5 5.873096 hesc 6 5.665857 hesc 7 6.791656 hips 8 7.133673 hips 9 7.574058 hips 10 7.208041 hips 11 7.402100 hips 12 7.167792 hips 13 7.156971 hips 14 7.197543 hips 15 …
155 r  subset  dataframe 

7
ลบเคอร์เนลบนสมุดบันทึก jupyter
ฉันจะลบเคอร์เนลออกจากสมุดบันทึก jupyter ได้อย่างไร ฉันมีเคอร์เนล R บนสมุดบันทึก jupyter ของฉัน เคอร์เนลเมื่อเร็ว ๆ นี้มักจะตายทันทีหลังจากที่ฉันเปิดสมุดบันทึกใหม่

2
ป้องกันชื่อแถวที่จะเขียนลงไฟล์เมื่อใช้ write.csv
คำสั่ง: t <- data.frame(v = 5:1, v2 = 9:5) write.csv(t, "t.csv") ไฟล์ผลลัพธ์: # "","v","v2" # "1",5,9 # "2",4,8 # "3",3,7 # "4",2,6 # "5",1,5 ฉันจะป้องกันคอลัมน์แรกที่มีดัชนีแถวไม่ให้เขียนลงไฟล์ได้อย่างไร
154 r  csv 

8
รวม / สรุปตัวแปรหลายตัวต่อกลุ่ม (เช่นผลรวม, ค่าเฉลี่ย)
จากกรอบข้อมูลจะมีวิธีที่ง่ายต่อการรวม ( sum, mean, maxet c) ตัวแปรหลายคนพร้อมกัน? ด้านล่างเป็นข้อมูลตัวอย่างบางส่วน: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) month = month(date) x1 = cumsum(rnorm(days, 0.05)) x2 = cumsum(rnorm(days, 0.05)) df1 = data.frame(date, year, month, x1, x2) ฉันต้องการรวมx1และx2ตัวแปรจากdf2data frame ตามปีและเดือนพร้อมกัน โค้ดต่อไปนี้จะรวมx1ตัวแปร แต่ก็เป็นไปได้ที่จะรวมx2ตัวแปรพร้อมกันหรือไม่ ### aggregate variables …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.