แพ็คเกจ R ใดที่คุณพบว่ามีประโยชน์มากที่สุดในการทำงานประจำวันของคุณ


28

เธรดที่ซ้ำกัน: ฉันเพิ่งติดตั้ง R. เวอร์ชันล่าสุดฉันควรได้รับแพ็คเกจอะไร

แพ็คเกจRคืออะไรที่คุณนึกไม่ออกว่าจะทำงานกับข้อมูลทุกวัน? กรุณาระบุเครื่องมือทั้งแบบทั่วไปและแบบเจาะจง

ปรับปรุง: สำหรับ 24.10.10 ggplot2ดูเหมือนว่าจะเป็นผู้ชนะด้วย 7 คะแนน

แพ็คเกจอื่น ๆ ที่กล่าวถึงมากกว่าหนึ่งคือ:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

ขอบคุณสำหรับคำตอบของคุณ!


1
คำถามส่วนตัว: คำถามนี้ไม่สามารถตอบได้และไม่เหมาะสำหรับไซต์ QA
Egon Willighagen

3
น่าจะเป็นวิกิชุมชน คำถามที่มีประโยชน์ที่นี่ แต่ไม่มีคำตอบที่ชัดเจน
เชน

2
@Shane: จุดดี ย้าย @ Egon: ส่วนตัวแน่นอน แต่ถ้าคำตอบนั้นมาจากคนที่มีความรู้ฉันก็ไม่สนใจเรื่องส่วนตัว ฉันเพิ่งเริ่มเรียนรู้ R เมื่อเร็ว ๆ นี้และมีการติดตั้งสองสามสิบเพื่อสำรวจ แต่ฉันสังเกตเห็นว่ามีเครื่องมือที่ฉันใช้บ่อยมากโดยไม่คำนึงถึงงานที่อยู่ในมือ
radek

มันจะน่าสนใจถ้า StackExchange สามารถรองรับวิธีการเชื่อมโยงโพสต์วิกิชุมชนในเว็บไซต์ เพราะฉันจะเดิมพันคำถามนี้ได้รับการถามใน Stackoverflow และฉันคิดว่าการวิเคราะห์ทางสถิติอาจดึงดูดบางคนที่ไม่ได้เยี่ยมชม SO
Sharpie

@Sharpie: มีการโพสต์ SO ที่น่าสนใจมากมายเช่นstackoverflow.com/questions/1295955/…หรือstackoverflow.com/questions/1535021/แต่พวกเขาไม่ได้มุ่งเน้นไปที่แพ็คเกจ และฉันเห็นด้วยว่าการเชื่อมโยงของวิกิชุมชนนั้นมีประโยชน์จริงๆ
radek

คำตอบ:




8

ฉันใช้แพ็คเกจxtable แพ็คเกจ xtable จะเปลี่ยนตารางที่ผลิตโดย R (โดยเฉพาะตารางที่แสดงผลลัพธ์ anova) เป็นตาราง LaTeX เพื่อรวมไว้ในบทความ


8

multicoreค่อนข้างดีสำหรับเครื่องมือสำหรับการสร้างสคริปต์ที่เร็วขึ้น
cacheSweaveSweaveช่วยประหยัดเวลาเมื่อใช้


8

ggplot2 - ลดการสร้างภาพข้อมูลที่ดีที่สุดสำหรับ R

RMySQL / RSQLite / RODBC - สำหรับเชื่อมต่อกับฐานข้อมูล

sqldf - จัดการ data.frames ด้วยการสืบค้น SQL

Hmisc / rms - แพ็คเกจจาก Frank Harrell ที่มีฟังก์ชั่นเบ็ดเตล็ดที่สะดวกสบายและฟังก์ชั่นที่ดีสำหรับการวิเคราะห์การถดถอย

GenABEL - แพ็คเกจที่ดีสำหรับการศึกษาความสัมพันธ์ของจีโนม

Rcmdr - GUI ที่ดีสำหรับ R หากคุณต้องการ

ตรวจสอบCRANtastic ด้วย - ลิงค์นี้มีรายการแพ็คเกจ R ที่นิยมมากที่สุด หลายคนติดอันดับต้น ๆ ของลิสต์แล้ว


8

data.table เป็นรายการโปรดของฉันตอนนี้! หวังเป็นอย่างยิ่งว่าจะเป็นเวอร์ชั่นใหม่พร้อมกับมีสิ่งที่อยากได้เพิ่มเติม



6

สำหรับฉันเป็นการส่วนตัวฉันใช้แพ็คเกจสามชุดต่อไปนี้มากที่สุดที่มีทั้งหมดจากOmega Project สำหรับการคำนวณทางสถิติ (ฉันไม่ได้อ้างว่าเป็นผู้เชี่ยวชาญ แต่สำหรับวัตถุประสงค์ของฉันพวกเขาใช้งานง่ายมาก):

  • RCurl : มันมีตัวเลือกมากมายที่อนุญาตให้เข้าถึงเว็บไซต์ที่ฟังก์ชั่นเริ่มต้นในฐาน R จะมีปัญหากับฉันคิดว่ามันยุติธรรมที่จะพูด เป็นอินเตอร์เฟส R ไปยังไลบรารี libcurl ซึ่งมีประโยชน์เพิ่มเติมของชุมชนทั้งหมดนอกการพัฒนา R นอกจากนี้ยังมีในCRAN

  • XML : เป็นการให้อภัยอย่างมากในการแยกวิเคราะห์ XML / HTML ที่มีรูปแบบไม่ถูกต้อง มันเป็น R-อินเตอร์เฟซไปยังห้องสมุด libxml2 และอีกครั้งมีเพิ่มประโยชน์ของนอกทั้งชุมชนการวิจัยการพัฒนานอกจากนี้ยังมีอยู่บนCRAN

  • RJSONIO : อนุญาตให้แยกวิเคราะห์ข้อความที่ส่งคืนจากการเรียก json และจัดระเบียบเป็นโครงสร้างรายการสำหรับการวิเคราะห์เพิ่มเติมคู่แข่งของแพ็คเกจนี้คือ rjson แต่อันนี้มีข้อดีของการเป็น vectorised พร้อมขยายผ่าน S3 / S4 ได้อย่างรวดเร็ว และปรับขนาดได้เป็นข้อมูลขนาดใหญ่

6

Sweaveให้คุณฝังรหัส R ในเอกสาร LaTeX ผลลัพธ์ของการดำเนินการรหัสและเลือกซอร์สโค้ดกลายเป็นส่วนหนึ่งของเอกสารขั้นสุดท้าย

ตัวอย่างเช่นแทนที่จะวางภาพที่ผลิตโดย R ลงในไฟล์ LaTeX คุณสามารถวางรหัส R ลงในไฟล์และเก็บทุกอย่างไว้ในที่เดียว


4
เพียงคำแนะนำสำหรับทุกคนที่ต้องการเริ่มต้นการวิจัยที่ทำซ้ำได้กับอาร์ฉันอยากจะแนะนำให้คุณดูแพ็คเกจใหม่ ๆknitrแทน Sweave โดยทั่วไปมันจะใช้ Sweave กับเตียรอยด์ มันง่ายเหมือนกันถ้าไม่ใช่ง่ายกว่าที่จะเรียนรู้และยืดหยุ่นมากขึ้น
Christoph_J


4

ฉันพบตาข่ายพร้อมกับหนังสือสหาย "Lattice: การแสดงข้อมูลหลายตัวแปรพร้อม R" โดย Deepayan Sarkar ที่ประเมินค่ามิได้



4

แพคเกจที่มีประโยชน์มากที่สุดในแต่ละวันจะต้องเป็น "ต่างประเทศ" ซึ่งมีฟังก์ชั่นสำหรับการอ่านและเขียนข้อมูลสำหรับแพ็คเกจทางสถิติอื่น ๆ เช่น Stata, SPSS, Minitab, SAS ฯลฯ การทำงานในฟิลด์ที่ R ไม่ธรรมดานั้นหมายความว่า เป็นแพ็คเกจที่สำคัญมาก


3

ฉันใช้

รถยนต์, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, ก่อร่างใหม่, RODBC, TeachingDemos, XML

มาก.


3

ฉันขาดไม่ได้:

  • ขัดแตะสำหรับกราฟิก
  • xlsxหรือXLConnectเพื่ออ่านไฟล์ Excel
  • rtfเพื่อสร้างรายงานในรูปแบบ rtf (ฉันต้องการSwordหรือR2wdแต่ฉันไม่สามารถติดตั้ง statconn ในที่ทำงานได้ฉันจะลองodfWeaveเร็ว ๆ นี้)
  • nlmeและlme4สำหรับรุ่นผสม
  • ffสำหรับการทำงานกับอาร์เรย์ขนาดใหญ่

2

RODBCสำหรับการเข้าถึงข้อมูลจากฐานข้อมูลsqldfสำหรับการดำเนินการค้นหา SQL อย่างง่ายบนดาต้าเฟรม (แม้ว่าฉันบังคับให้ตัวเองใช้คำสั่ง native R) และggplot2และplyr



2

ส่วนใหญ่เราใช้:

  • ggplot - สำหรับชาร์ต
  • สถิติ
  • e1071 - สำหรับSVM

คุณอาจต้องการตรวจสอบ kernlab และ caret สำหรับ SVM เป็นทางเลือกที่น่าสนใจ (ไม่จำเป็นต้องดีกว่า)
Zach


2

สำหรับฉันฉันใช้kernlabสำหรับ Kernel-based Machine Learning Lab และe1071สำหรับ SVM และggplot2สำหรับกราฟิก




2

RColorBrewerไม่ได้ถูกกล่าวถึงที่นี่ฉันใช้มันบ่อยครั้งในการวางแผนถ้าฉันต้องการโครงร่างสี


2

ฉันเป็นแฟนตัวยงของ RCPP เมื่อฉันต้องการการวนรอบอย่างรวดเร็วหรือเพื่อทำการบำบัดที่ไม่สอดคล้องกับ R มันถูกนำมาใช้อย่างดีในระบบ R eco สามารถรับ Matrix / sparse Matrix โดยไม่ต้องแปลงเป็นอาร์กิวเมนต์ในฟังก์ชั่น

ไวยากรณ์ C ++ นั้นง่ายเมื่อคุณทำสิ่งที่ง่าย (ซึ่งมักเป็นกรณีของฉัน)

จริงๆแล้วคุณไม่จำเป็นต้องเป็นผู้ทำแพ็คเกจเพื่อต้องการ lib อันยอดเยี่ยมนี้

ฉันว่า C ++ เร็วมากหรือเปล่า


2

doParallelและforeachแพคเกจได้ทำให้ชีวิตของฉันมากขึ้นโดยการอนุญาตให้ฉันไปคู่ขนานรหัสของฉันและรันบนอินสแตนซ์คำนวณดีที่สุดในAmazon EC2 ! ฉันใช้มันบ่อยมาก แต่นั่นคงเป็นไปไม่ได้หากไม่มีRStudio AMIs ที่ออกโดย Louis Aslett ในที่สุดฉันต้องพูดถึงแพคเกจstringrซึ่งทำให้การทำงานกับสตริงเดินเล่นในสวน ใช้มันในทุกแอปพลิเคชั่นการขุดข้อความ และฉันยังใช้knitrบ่อยมากในการจัดทำรายงานคุณภาพสูงสำหรับงานของฉัน ขอบคุณมากสำหรับแพ็คเกจที่น่าทึ่งนี้ Yihui Xie!


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.