R กับ SAS ทำไม SAS จึงเป็นที่ต้องการของ บริษัท เอกชน


143

ฉันเรียนรู้ R แต่ดูเหมือนว่า บริษัท ต่าง ๆ ให้ความสนใจกับประสบการณ์ของ SAS มากขึ้น SAS over R มีข้อดีอย่างไร


17
เป็นเรื่องน่าเศร้า แต่จริงฉันกลัว ...
gung

19
นักสถิติการแพทย์เคยบอกฉันว่าพวกเขาใช้ SAS เพราะถ้าพวกเขาทำผิดพลาดเนื่องจากข้อบกพร่องของซอฟต์แวร์และมันเป็นเรื่องของการฟ้องร้อง SAS จะชดใช้พวกเขา R มาโดยไม่มีการรับประกัน
Momo

42
@Momo R มาโดยไม่มีการรับประกันจริง แต่ฉันต้องการดูการอ้างอิงที่ SAS มีความแข็งแกร่งของมัน ฉันไม่สามารถหาข้อความใบอนุญาต SAS บนเว็บไซต์ของพวกเขา แต่ก็สามารถค้นหาบางสิ่งบางอย่างสำหรับองค์ประกอบหนึ่ง: support.sas.com/documentation/onlinedoc/sasc/doc650/common/ซึ่งมีการรับประกัน 90 วันสำหรับสื่อที่ ซอฟต์แวร์ถูกจัดส่งและข้อจำกัดความรับผิดชอบทั้งหมดของการรับประกันอื่นใด โปรดให้การอ้างอิงอื่นนอกเหนือจาก "มีคนเคยบอกฉัน"
Brian Diggs

13
เป็นเพียงเรื่องเล็ก ๆ น้อย ๆ ฉันชอบความเห็นถากถางดูถูกอย่างจริงจังของความคิดเห็น แต่ดีใจที่คุณตรวจสอบฉันไม่เคยใส่ใจ
Momo

36
SAS มาพร้อมกับการรับประกันเช่นเดียวกับ R: ไม่มี
Frank Harrell

คำตอบ:


139

ฉันคิดว่ามีหลายประเด็น (เรียงตามลำดับความถูกต้องที่เป็นไปได้):

  1. ประเพณี / นิสัย : ผู้คนคุ้นเคยกับ SAS และไม่ต้องการเรียนรู้สิ่งใหม่ (ทำให้ยากขึ้นอย่างที่คุณคิดใน SAS และ R นั้นแตกต่างกัน) สิ่งนี้สามารถใช้ได้กับทุกคนที่อาจต้องส่งรหัสหรืออ่าน / ใช้รหัสของคุณรวมถึงผู้จัดการและเพื่อนร่วมงาน
  2. ความไม่ไว้วางใจของฟรีแวร์ : ฉันมีหลายคนบอกว่าพวกเขาไม่เต็มใจที่จะรับผลลัพธ์จาก R เพราะคุณไม่มี บริษัท ที่แสวงหาผลกำไรทำการตรวจสอบโค้ดเพื่อให้แน่ใจว่ามันให้ผลลัพธ์ที่ถูกต้องก่อนที่มันจะออกไปหาลูกค้า จบลงด้วยการสูญเสียธุรกิจ
  3. ข้อมูลขนาดใหญ่ : R ดำเนินการกับทุกสิ่งในหน่วยความจำในขณะที่ SAS ไม่จำเป็น ดังนั้นหากข้อมูลของคุณเข้าใกล้ขีด จำกัด หน่วยความจำของคุณจะมีปัญหา

โดยส่วนตัวแล้วฉันคิดว่า # 3 มีบุญที่ชอบด้วยกฎหมายแม้ว่าจะมีวิธีการข้อมูลขนาดใหญ่ที่ได้รับการพัฒนาด้วย R ปัญหาที่ # 1 พูดกับตัวเอง ฉันคิดว่า # 2 ไม่สนใจข้อเท็จจริงหลายอย่าง: มีการตรวจสอบบางอย่างที่เกิดขึ้นกับ R แพคเกจหลักจำนวนมากเขียนโดยชื่อที่ใหญ่ที่สุดในสถิติและมีการศึกษาเปรียบเทียบความแม่นยำของซอฟต์แวร์ทางสถิติที่แตกต่างกัน & R การแข่งขันอย่างแน่นอน


41
จุดที่ 1 ได้รับความถูกต้องมากขึ้นถ้าคุณรวม "โครงสร้างพื้นฐานที่มีอยู่" ไว้ในแบนเนอร์ความเฉื่อยนั้นด้วย หากมีกระบวนการทางธุรกิจที่มีอยู่แล้วซึ่งใช้ SAS อยู่แล้วจะมีค่าใช้จ่ายในการเปลี่ยนแปลงพร้อมการเปลี่ยนแปลง หากเป็นกรณีนี้จะไม่เลือกระหว่าง SAS และ R แต่เลือกระหว่างอยู่กับ SAS และเปลี่ยนเป็น R ซึ่งอาจมีข้อสรุปที่แตกต่างกัน
Brian Diggs

25
ประเด็นของจุดที่ 2 คือแม้ว่าแพ็คเกจ SOME R นั้นเขียนขึ้นโดยผู้เชี่ยวชาญ แต่คนอื่นก็ไม่ใช่ ใครคือผู้ให้การรับรอง ใครทดสอบพวกเขา (ฉันรู้ว่าพวกเขาได้รับการทดสอบว่าพวกเขาเรียกใช้แล้ว แต่ใครเป็นผู้ทดสอบว่าพวกเขาทำงานอย่างถูกต้องหรือไม่) ฉันรู้ว่าคุณสามารถดูรหัสได้ แต่นั่นเป็นการคาดการณ์เวลาและความสามารถในการตรวจสอบ มีความซับซ้อนมาก
Peter Flom

18
@ PeterFlom คุณเพิ่มจุดที่เหมาะสม เมื่อแพ็คเกจมีความลึกลับมากขึ้นจึงมีการรับประกันน้อยกว่าเมื่อมีสิ่งของพื้นฐาน แต่คุณต้องไปไกลแค่ไหน แม้แต่ SEM ซึ่งเป็นขั้นสูงค่อนข้างเขียนใน R โดย John Fox นอกจากนี้ StasK ยังเป็นจุดที่ดีเกี่ยวกับความเป็นจริงของการตรวจสอบซอฟต์แวร์เชิงสถิติในทางปฏิบัติ ในที่สุด R ก็มีความครอบคลุมมากกว่าสิ่งอื่นอย่างมากมายดังนั้นเมื่อคุณต้องการทำสิ่งที่ลึกลับพร้อมกับซอฟต์แวร์อื่น ๆ คุณส่วนใหญ่ต้องเขียนโค้ดเอง ใครรับประกันความถูกต้องของรหัสนั้น
gung

33
ใครคือผู้เลือกใช้ SAS, Stata, SPSS, code มีวิธีใดบ้างไหมที่จะทราบว่าผลลัพธ์ที่พวกเขาให้มานั้นมีวิธีการที่พวกเขาใช้หรือไม่ ฉันรู้จากการติดตามตัวอย่างเช่นlme4รายชื่อผู้รับจดหมายที่เปรียบเทียบกับ SAS เกิดขึ้นค่อนข้างสม่ำเสมอ แต่มันเป็นไปไม่ได้ที่จะรู้ว่าเราควรทำการเปรียบเทียบเช่นนี้หรือไม่ หากไม่สามารถเข้าถึงแหล่งข้อมูลได้เราจะต้องนำ บริษัท เหล่านั้นให้เป็นคำพูดที่ผลลัพธ์ที่ผลิตโดยซอฟต์แวร์ของพวกเขานั้นถูกต้องจริง ตรงไปตรงมาฉันชอบที่จะมีความสามารถในการตรวจสอบรหัสซอฟต์แวร์ที่ฉันใช้
Jason Morgan

28
จริง แต่มันยากที่จะลงโทษระบบคำนวณทางสถิติสำหรับความครอบคลุม หรือพูดอีกวิธีหนึ่งวิธีการทำบางสิ่งของ R นั้นดีกว่าระบบอื่นที่ไม่ทำ
Frank Harrell

105

นอกจากคำตอบที่ดีจนถึงตอนนี้ฉันจะเพิ่มปัจจัยความลำบากใจ หากคุณใช้เงินหลายแสนดอลลาร์ในปีที่แล้วในการสนับสนุน SAS และ SAS และคุณเสนอให้ใช้จ่ายอะไรกับ R ด้วยราคาการสนับสนุนที่ต่ำมาก (Revolution และอื่น ๆ ) คนที่อยู่ในเครือจะถามว่าทำไม เป็นความผิดพลาดหรือเปล่าที่ต้องใช้เงินจำนวนมากเมื่อปีที่แล้วเมื่อ R มีอยู่เมื่อปีที่แล้ว? หรือมันเป็นความผิดพลาดที่จะทิ้งซอฟต์แวร์ระดับมืออาชีพสำหรับบางสิ่งที่สร้างขึ้นโดยกลุ่มอาสาสมัครหรือไม่?

เมื่อปัญหาของกรอบในลักษณะนั้นมันเป็นเรื่องที่สูญเสียดังนั้นอาจจะดีกว่าที่จะไม่นำมาขึ้น


47
นี่อาจเป็นคำตอบเหยียดหยามที่สุดในการตรวจสอบข้าม +1
ความน่าจะเป็นทาง

11
@probabilityislogic: ขอบคุณ! เพื่อความชัดเจนนี่เป็นความคิดเห็นเพิ่มเติมเกี่ยวกับการจัดการระดับสูงที่แย่กว่าคนที่ใช้ซอฟต์แวร์ ฉันได้ทำงานในสถานที่ที่มีทัศนคติ (ในระดับที่สูงขึ้น) "อืม ... คุณไม่ได้ใช้เงินทั้งหมดที่เราตั้งงบประมาณไว้สำหรับคุณในปีนี้เห็นได้ชัดว่าคุณจะได้รับเงินน้อยลงดังนั้นเราจึง กำลังตัดงบประมาณของคุณสำหรับปีหน้าและมอบส่วนเสริมให้กับแผนกที่ใช้จ่ายเกินกำลัง " กฎของ Dilbert
Wayne

11
"คุณไม่ได้ใช้เงิน ... " - นั่นเป็นวิธีที่ระบบการวางแผนของโซเวียตใช้ในการทำงานจากความรู้โดยตรงของฉัน
StasK

5
จำเป็นต้องอธิบายบางคนถึงเรื่องลูกโซ่ว่าค่าใช้จ่ายเพียงเล็กน้อยสำหรับใบอนุญาต SAS คุณสามารถติดตั้ง R Studio Server บน AWS Virtual Machine ที่มี 16 คอร์และ 256 GB RAM ในมือของโปรแกรมเมอร์ R ที่ดี 2 คน ทรงพลังกว่าสิ่งใดที่ SAS ทำได้ คิดว่าเร็กคอร์ดพันล้านที่เร็วสามารถจับคู่กันเลือน! หรือสำหรับเรื่องนั้นแม้แต่โอเพ่นซอร์ส PostgreSQL ที่มี Python + PERL จะประสบผลสำเร็จในราคาเพียงเศษเสี้ยว
vagabond

1
"หรือเป็นความผิดพลาดที่จะทิ้งซอฟต์แวร์มืออาชีพสำหรับบางสิ่งที่สร้างขึ้นโดยกลุ่มอาสาสมัคร" นี่คือการแบ่งขั้วที่ผิดพลาด!
kjetil b halvorsen

54

ด้านบนของ gung ที่ระบุได้อย่างถูกต้องที่นี่ปัญหาที่ใหญ่ที่สุดในโลกธุรกิจคือมรดก และเมื่อคุณมีรหัสการผลิตที่มีคุณภาพดีซึ่งเป็นที่รู้จักกันในการทำงานคุณจะไม่เปลี่ยนมัน SAS ออกไปที่นั่นมาตั้งแต่ปี 1970 และในเวลานั้นมันก็มีประสิทธิภาพเพียงอย่างเดียวตามมาตรฐานในการเขียนสคริปต์ทางสถิติ จำนวนของรหัสการผลิตที่สะสมตั้งแต่นั้นมาใน SAS ในฟาร์มาและรัฐบาลนั้นเป็นไปไม่ได้นับสิบล้านปีมนุษย์ การเขียนซ้ำใน R หรือ Stata จะใช้เวลาสองสามปีรหัสผลลัพธ์จะมีความยืดหยุ่นมากขึ้นมีประสิทธิภาพมากขึ้นโปร่งใสมากขึ้นง่ายขึ้นและถูกกว่าในการบำรุงรักษา แต่ไม่มีใครจ่ายเงินสำหรับการเปลี่ยนโครงสร้างดังกล่าว (ประสบการณ์ของฉันในการทำเช่นนี้คือรหัส Stata ของฉันโดยทั่วไปจะสั้นกว่าประมาณสามเท่าฉันเคยมีโครงการแปลงรหัส SPSS เป็น Stata ซึ่งฉันทำมันสั้นกว่าประมาณ 20 เท่า

ในแง่หนึ่งนี่เป็นเรื่องราวที่คล้ายกันกับสำนักพิมพ์ทางวิชาการ: พวกเขากำลังขี่กระแสของผู้ใช้ปลายทางที่ยังคงการสมัครสมาชิกของพวกเขาจากความจำเป็น มหาวิทยาลัยที่ไม่ได้สมัครเป็นสมาชิกของ Nature ไม่ใช่มหาวิทยาลัยจริงๆ การเผยแพร่ฟรีผ่านสมาคมวิชาชีพจะทำให้ถูกลงผู้คนเตรียมส่งผลงานของพวกเขาใน LaTeX ทุกวันนี้ดังนั้นพวกเขาจึงพร้อมใช้งานกล้องและคนคนเดียวกันจะให้ความเห็นกับเพื่อน ๆ ดังนั้นจึงไม่มีความล้มเหลวในคุณภาพ แต่ ... ไม่มีชื่อแบรนด์และปัจจัยที่ส่งผลกระทบต่อวารสารออนไลน์

นี้สรุปมันทั้งหมดขึ้น: http://scatter.wordpress.com/2011/06/28/stata-12/ Stata เป็นที่ต้องการในด้านเศรษฐศาสตร์และแวดวงที่เกี่ยวข้องกับนโยบายและยิ่งฉันเรียนรู้ SAS มากเท่าไหร่ฉันก็ยิ่งชอบ Stata มากขึ้น


38
SAS มีไวยากรณ์ที่น่ากลัวที่เริ่มต้นด้วยสิ่งที่คล้ายกับ JCL (ภาษางานควบคุมของ IBM) สำหรับการส่งงานแบ็ตช์การ์ดแบบตอกกลับในวันนั้น เป็นเรื่องน่าทึ่งที่ผู้คนยังคงใช้มันอย่างแท้จริง
เวย์น

6
+1 ฉันมีความสุขกับ BlackBerry: iOS: Android: Nokia เป็น SAS: Stata: R: SPSS คล้ายคลึงกันในการโพสต์กระจาย
jthetzel

6
Wayne ถ้าคุณเคยคิดอย่างอื่นเกี่ยวกับคำสั่ง CARDS อีกครั้งคุณจะรู้ว่า SAS เป็นแพคเกจซอฟต์แวร์เชิงสถิติสำหรับการทำงานกับ punchcard Stata ทำงานร่วมกับชุดข้อมูลรูปสี่เหลี่ยมผืนผ้า R ทำงานกับวัตถุ ดังนั้นขึ้นอยู่กับชนิดของรูปแบบข้อมูลที่คุณต้องจัดการกับหนึ่งอาจดีกว่าคนอื่น ๆ
StasK

3
จุดสำคัญในมรดกคือสิ่งที่ต้องการอนุมัติ FDA หรือกฎระเบียบที่คล้ายกัน อุตสาหกรรมที่ฉันได้พูดจะไม่ได้สัมผัส anyhing (TM) หลังจากที่พวกเขาได้รับผ่านเพื่อให้แน่ใจว่าพวกเขาไม่ต้องผ่านกระบวนการทั้งหมดอีกครั้ง และนั่นเป็นข้อโต้แย้งที่ยิ่งใหญ่ในแง่ของเงิน
cbeleites

48

ฉันทำงานเป็นโปรแกรมเมอร์ SAS ได้อย่างมีประสิทธิภาพในช่วงเจ็ดปีที่ผ่านมาถัดจากฉันเพื่อนร่วมงานได้เขียนโปรแกรม SAS นานกว่าที่ฉันยังมีชีวิตอยู่ ตามที่ระบุไว้ที่นี่มีความเฉื่อย / มรดกจำนวนมากอยู่เบื้องหลัง SAS; แต่ SAS ก็เหมือนกับ R คือวิธีหนึ่งในการหาทางไม่ใช่ตัวมันเอง

SAS มีประสิทธิภาพอย่างมากในการเข้าถึงข้อมูลตามลำดับและการเข้าถึงฐานข้อมูลผ่าน SQL นั้นถูกรวมเข้าด้วยกันเป็นอย่างยิ่ง PROC เป็นเอกสารที่ดีมาก แต่น่าเสียดายที่ไม่ได้มาตรฐานอย่างสมบูรณ์พร้อมด้วยสัญกรณ์ (PROC OPTMODEL และ IML เป็นสองตัวอย่าง) มันค่อนข้างงุ่มง่ามเมื่อพูดถึงการเขียนโค้ดที่ซับซ้อนและไม่สง่างามสำหรับโค้ดแบบขนาน ฉันยังพบว่าการนำเข้าไฟล์ csv เป็นแหล่งของความทุกข์ยากที่ดีในบางครั้งและต้องการเพียงแค่ถ่ายโอนข้อมูลไปยัง R ก่อนแล้วจึงไปยังฐานข้อมูล

แม้ว่า SAS จะมีส่วนต่อประสานกับวัตถุที่ใช้ร่วมกันและ dll คุณไม่สามารถเข้าถึงไฟล์ส่วนหัวหรืออะไรอย่างนั้นได้และการแจกจ่ายรหัสก็ไม่สามารถใช้ได้ผ่านแพ็คเกจความสุข

อย่างไรก็ตามมีข้อกังวลเล็กน้อยเกี่ยวกับใครบางคนรวมถึงแพคเกจที่ลึกลับตอนนี้หมดอายุหรือแตกหักในรหัสของคุณที่คุณจำเป็นต้องรักษาและคุณภาพของรหัสใน SAS มีแนวโน้มที่จะยอดเยี่ยมอย่างสม่ำเสมอ (รหัสหลัก R ยังยอดเยี่ยมและอิสระ ใช้ได้กับทุกคน)

ตามที่กล่าวไว้ก่อนหน้านี้ SAS นั้นมีราคาแพงมาก แต่เป็นเครื่องมือที่ดีที่ฉันจะไปเมื่อฉันรู้ว่ามีกระบวนการบรรจุกระป๋องที่ทำงานได้ดีสำหรับความต้องการของฉัน

R + SAS + mysql ด้วย perl เล็กน้อยเพื่อกาวให้พวกเขาเข้าด้วยกันทำงานได้อย่างน่าอัศจรรย์ :)


11
หมายเหตุเกี่ยวกับการบำรุงรักษาแพคเกจเก่าก็มีผลเช่นกันสำหรับผู้ใช้แมโครที่เขียนหรือ proc เก่าที่ sas ยังไม่ได้ปรับปรุง
ความน่าจะเป็นเชิง

4
R ยังมีการสนับสนุน SQL ดีมากเมื่อเร็ว ๆ นี้ได้รับผ่านทางdplyrห้องสมุด - มันแปลตามตัวอักษรไวยากรณ์ R / dplyr ลงใน SQL และเรียกฐานข้อมูลคุณสามารถตัดสินใจได้ว่าการดำเนินงานที่จะทำบนเซิร์ฟเวอร์ฐานข้อมูลและสิ่งที่อยู่ภายในเครื่องโดยใช้ไวยากรณ์เดียวกัน: cran.r โครงการ org / web / แพ็คเกจ / dplyr / vignettes / database.html
ทิม

41

ดังนั้นฉันจึงใช้ทั้ง R และ SAS - เป็นที่ยอมรับในแวดวงวิชาการ - แต่มีเหตุผลสองสามข้อที่ฉันมักจะมุ่งหน้าสู่ SAS ในบางครั้ง:

  1. เอกสารที่ดีกว่า R กำลังดีขึ้นในเรื่องนี้ แต่เอกสารโดยเฉพาะเอกสารอย่างเป็นทางการมักเป็นเรื่องที่แย่และทึบแสง นอกจากนั้น SAS ยังรองรับโครงสร้างพื้นฐานขนาดใหญ่ของหนังสือนั่นคือการใช้ R! ซีรีย์กำลังช่วยเหลือเรื่องนี้ใน R แต่ก็ยังไม่ค่อยมี ฉันสามารถหันไปใช้การวิเคราะห์เอาชีวิตรอดของ Paul Allison โดยใช้ SASหรือการวิเคราะห์ข้อมูลเชิงหมวดหมู่โดยใช้ SASหรือหนังสือที่ฉันมีในวิธีการ Monte Carlo โดยใช้ SAS และฉันมีหนังสือที่เขียนอย่างชัดเจนในสไตล์ที่สอดคล้องกันสำหรับภาษาที่ฉันใช้
  2. ความเฉื่อย นี่ไม่ใช่แค่ "บริษัท ขี้เกียจ" - ความเฉื่อยก็มีคุณค่าเช่นกัน มีความรู้เชิงสถาบัน มีรหัสที่ทำเช่นนั้นและทำได้ดี
  3. แพคเกจ แพคเกจบางอย่างใน R น่าทึ่ง แพคเกจบางอย่างไม่ได้ คุณต้องไปหาพวกเขาประเมินพวกเขาและจากนั้นก็มีปัญหาการก้าวกระโดดของความเชื่อที่ว่าแพคเกจนั้นดีพอ ๆ กับผู้ชายที่เขียนมัน มันยากที่จะเชื่อใจ SAS มี "ความศรัทธาและเครดิตของสถาบัน SAS" เป็นหลักซึ่งมีประวัติที่แข็งแกร่ง
  4. การสนับสนุนแหล่งเดียว ถ้า SAS เสียคุณโทร SAS ถ้า R เสียคุณโทร ....

21
"ถ้า R เสียคุณโทรมา .... ?" ไบรอัน Ripley :-) (+1 สำหรับการตอบสนองนี้เป็นที่ถกเถียงกันด้วย)
CHL

6
เกี่ยวกับ 4) ฉันคิดว่ามีแนวคิดที่สับสน ถ้าคุณใช้โปรแกรมและมันหยุดพักโดยทั่วไปคุณมีสองตัวเลือก คุณสามารถจ่ายเงินสำหรับการสนับสนุนหรือคุณสามารถหาการสนับสนุนได้อย่างอิสระ (ชุมชนออนไลน์วรรณกรรมด้วยตัวคุณเอง) R และ SAS สามารถเปรียบเทียบเป็นภาษาการเขียนโปรแกรมเชิงสถิติ ทั้งสองรองรับการใช้งานได้อย่างอิสระซึ่งสามารถเปรียบเทียบได้ R และ SAS ไม่สามารถเทียบกับโซลูชั่นสนับสนุนจ่าย ...
jthetzel

7
... SAS Institute ให้การสนับสนุนที่มีค่าใช้จ่ายสำหรับ SAS บริษัท เช่น Revolution Analytics และ TIBCO (S +) ให้การสนับสนุนแบบเสียเงินสำหรับ R หากคุณต้องการเปรียบเทียบโซลูชันการสนับสนุนที่ชำระเงินสำหรับ R และ SAS คุณควรเปรียบเทียบ SAS Institute กับ Revolution Analytics และ TIBCO ไม่ใช่ความสับสนผมเชื่อว่าเกิดขึ้นจาก การผนวกภาษา SAS กับสถาบัน SAS อย่างแน่นหนาและการไม่รวมภาษา R เข้ากับการสนับสนุนและการศึกษาขององค์กรที่เกี่ยวข้องกับ R
jthetzel

3
@ jthetzel ฉันไม่คิดว่า "สับสน" SAS ภาษานั้นเชื่อมโยงกับบริการอย่างแน่นหนา แพลตฟอร์มใด ๆ ที่ทำงานบน SAS ได้รับการสนับสนุนจาก SAS สิ่งนี้ไม่เป็นความจริงสำหรับ R - การสนับสนุนและภาษานั้นแยกออกจากกันอาจไม่มีความช่วยเหลือสำหรับคุณขึ้นอยู่กับแพลตฟอร์ม (ลองพูดคุยกับ Revolution ในบางครั้งในขณะที่ไม่ได้ใช้ Windows หรือ RHEL ... ) และพวกเขาจะไม่รับผิดชอบ ข้อผิดพลาดของ RandomPackage โดยที่ SAS จะสนับสนุน PROC Arbitrary
Fomite

2
@probabilityislogic ฉันคิดว่ามันเกินกว่าที่จะประเมินมันเพื่อดูว่ามันเหมาะสมกับการวิเคราะห์ของคุณหรือไม่ ใช่ทั้งคู่อาจผิดและต้องได้รับการประเมินทั้งคู่ แต่ฉันเชื่อใจทีมควบคุมคุณภาพของ SAS มากกว่าที่ฉันไว้ใจตัวเอง
Fomite

39

ไม่มีใครแนะนำเหตุผลที่มันต้องการคือความโง่เขลาธรรมดา นี่คือคำพูดสองคำที่ฉันเพิ่งเจอ:

"การใช้ซอฟต์แวร์โอเพนซอร์ซเช่น R ไม่เป็นปัญหาเราไม่สามารถรับประกันผลลัพธ์ที่ทำซ้ำได้อย่างสมบูรณ์แบบ"

และ

"เราจะไม่สามารถให้การสนับสนุนใด ๆ สำหรับสิ่งนี้เนื่องจากเป็นซอฟต์แวร์โอเพ่นซอร์ส"

สองนาทีกับคนเหล่านี้จะแสดงให้พวกเขาเห็นว่าผิด


3
สองนาทีกับคนไหน? หากไม่มีการอ้างอิงก็เหมือนกับว่าคุณเพิ่งสร้างคำพูดขึ้นมา
David Heffernan

4
คำพูดที่สองดูดีจากแผนกไอทีของสภาพวกเขาไม่สามารถคาดหวังได้ว่าจะสนับสนุนซอฟต์แวร์โอเพนซอร์ซที่เป็นไปได้ทั้งหมดที่ลูกค้าอาจใช้ดังนั้นคำเตือนแบบครอบคลุม ฉันคิดว่าคำพูดโอเพนซอร์สต่อต้านที่เลวร้ายที่สุดที่ฉันเคยได้ยินมาจาก SAS บอกว่าทุกอย่างเช่น 'คุณจะเชื่อเจ็ตจัมโบ้ที่ออกแบบในโอเพนซอร์สหรือไม่เครื่องยนต์อาจ
ย่อตัว

5
@ PaulHurleyuk: +1 ข้อความอ้างอิงคือ“ เรามีลูกค้าที่สร้างเครื่องยนต์สำหรับเครื่องบิน ผมมีความสุขที่พวกเขาจะไม่ได้ใช้ฟรีแวร์เมื่อฉันได้รับในเจ็ท.” โดยผู้อำนวยการการตลาดเอสเอในบทความนี้นิวยอร์กไทม์ส R ตัวแทน SAS ชี้แจงข้อสังเกตของเธอในบล็อกโพสต์ในภายหลัง
jthetzel

4
@PaulHurleyuk: สภาไม่สามารถคาดหวังได้ว่าจะสนับสนุนซอฟต์แวร์ที่เป็นกรรมสิทธิ์ของลูกค้าที่อาจต้องการใช้ การเปิดกว้างไม่ใช่เหตุผล หากพวกเขาบอกว่าพวกเขาไม่สามารถสนับสนุนสิ่งใดนอกเหนือจากชุดซอฟต์แวร์ที่รองรับแล้วก็ใช้ได้
Spacedman

5
ในทั้งสองกรณีที่ฉันอ้างอาจมีการตัดสินใจอย่างมีเหตุผล แต่เหตุผลที่ให้ไว้ชัดเจนไม่ใช่เหตุผลเหล่านั้น เหตุผลที่มีเหตุผลอาจเป็น "เราสนับสนุน SAS อยู่แล้วและเราไม่สามารถที่จะสนับสนุนแพ็คเกจสถิติสองชุด" แต่ "เราไม่สามารถรองรับสิ่งนี้ได้เพราะมันเป็นโอเพนซอร์ซ" เป็นแบบไม่ต่อเนื่อง ทั้งสองส่วนอาจเป็นจริง แต่ข้อสรุปไม่เป็นไปตาม มันเหมือนกับว่า "เอลิซาเบ ธ เป็นราชินีเพราะท้องฟ้าเป็นสีฟ้า"
Spacedman

23

ดูเหมือนว่าปัญหาหนึ่งจะไม่ได้รับการแก้ไขอย่างชัดเจนนั่นคือ ass-covered หากคุณไปกับ SAS และสิ่งต่าง ๆ เกิดขึ้นผู้ตัดสินใจสามารถพูดได้เสมอว่าเขาซื้อซอฟต์แวร์ล้ำสมัยและเขารู้ได้อย่างไรว่ามันจะพัง หากเขาตัดสินใจที่จะไปกับ R อาร์กิวเมนต์นี้จะยากขึ้น ใช่สิ่งนี้เกี่ยวข้องกับอาร์กิวเมนต์ความเฉื่อยที่กล่าวถึงแล้วที่นี่

เมื่อไม่กี่สิบปีก่อนพวกเขาเคยพูดว่า"ขุนนางเคยถูกไล่ออกเพราะซื้อ IBM"ซึ่งถูกเรียกว่าเป็นวลีทางการตลาดที่ยิ่งใหญ่ที่สุดเท่าที่เคยมีมา


2
แม้ว่าผมไม่แน่ใจว่า R คือน้อย ๆ รัฐของศิลปะกว่า SAS (และเกี่ยวกับการหลายขั้นตอนนี้ผมรู้สึกว่า R คือมากขึ้นรัฐของศิลปะกว่า SAS) ฉันเดาว่าผู้ใช้ SAS จำนวนมากไม่รู้ว่า ...
Patrick Coulombe

21

ในฐานะผู้ใช้ทั้ง SAS และ R ฉันจะบอกว่าเหตุผลที่ยิ่งใหญ่ที่สุดที่เราใช้ SAS มากกว่า R (เมื่อเราทำ) คือความสามารถในการประมวลผลตามลำดับ เราต้องการเพียงเครื่องที่มี RAM ไม่เกิน 4GB ในการประมวลผลข้อมูล 15 ปี ฉันต้องการเครื่องที่มีขนาดใหญ่กว่าโดยใช้ stock R และฉันไม่ได้พยายามย้ายรหัส SAS เพื่อใช้งานกับ Revolution R


8
+1 แม้ว่ามันจะคุ้มค่าที่จะสังเกตว่ามีสองสามวิธีในการทำงานกับชุดข้อมูลที่มีขนาดใหญ่กว่าหน่วยความจำใน R ( bigmemory , ff , chunking data จากฐานข้อมูลเป็นตัวเลือกการคำนวณแบบกระจาย) แต่ทั้งหมดนี้เป็นการตั้งค่า SAS จะผ่านสิ่งที่คุณเลือกซึ่งเป็นข้อได้เปรียบที่แท้จริง
Matt Parker

21

เวลาที่พวกเขากำลังเปลี่ยนแปลง

ในปี 2558 นักคณิตศาสตร์อายุต่ำกว่า 35 ปีนิยมใช้ R - ตำราเรียนใช้รหัส R และ SAS นักคณิตศาสตร์เก่าไม่เคยเรียนรู้ที่จะใช้ R และชอบ SAS และไม่ใช้ R สัดส่วนของนักคณิตศาสตร์จริง ๆ ที่เข้ารหัสใน SAS จะลดลง

หากคุณค้นหาเอกสารทางวิชาการของ Google ที่อ้างถึง SAS - จากนั้นคุณจะพบสิ่งพิมพ์ 550-ish ที่สม่ำเสมอต่อปีในช่วงไม่กี่ปีที่ผ่านมา หากคุณค้นหาเอกสารโดยใช้ R ("R มูลนิธิเพื่อการคำนวณทางสถิติ") มี 25,100 ในปี 2014 และในช่วงกลางเดือนกรกฎาคม 2015 มี 16,700 วางแผนอัตรา - มันเติบโตอย่างรวดเร็วมาก!

SAS ไม่ได้ช่วยตัวเองเป็นเวลาสองสามปีโดยเรียกเก็บค่าธรรมเนียมใบอนุญาตจำนวนมากจากมหาวิทยาลัยซึ่งพวกเขาได้กลับรายการ แต่ตอนนี้มันสายเกินไปที่มหาวิทยาลัยจะเปลี่ยนมาใช้การสอนโดยใช้ R ไม่ใช่ SAS

เทคนิคทางสถิติใหม่ถูกเผยแพร่ในเอกสารร่วมกับแพ็คเกจ R เทคนิคบางอย่างที่อยู่ในฐาน R มานานหลายปียังไม่ปรากฏใน SAS ตอนนี้คุณสามารถใช้ R จากภายใน SAS

โดยสรุปสิ่งต่าง ๆ กำลังเปลี่ยนแปลงและเปลี่ยนแปลงอย่างรวดเร็ว


19

ในอุตสาหกรรมยานั้นใช้ SAS เพราะเป็นสิ่งที่ FDA ใช้และชอบ มีเหตุผลบางอย่างที่ร้ายแรง ผลลัพธ์สามารถตรวจสอบย้อนกลับได้และผลลัพธ์มีการประทับเวลา นักสถิติองค์การอาหารและยาสามารถตรวจสอบสิ่งที่คุณได้รับ มันดีมากสำหรับการจัดการฐานข้อมูลและเป็นซอฟต์แวร์ที่เชื่อถือได้ แน่นอนว่าคุณลักษณะหลายอย่างของ SAS สามารถโต้แย้งได้ว่ามีอยู่ในซอฟต์แวร์แพ็กเกจอื่นรวมถึง R และ SAS นั้นมีราคาแพง ถึงกระนั้นฉันคิดว่าทุกคนที่ต้องการเป็นนักสถิติประยุกต์ที่ทำงานในอุตสาหกรรมจะต้องเรียนรู้วิธีการโปรแกรมใน SAS อย่างน้อยที่สุด ใช้ R หรือ STATA หากคุณต้องการ แต่รู้จัก SAS เมื่อคุณทำงานให้กับ บริษัท ที่ต้องการให้คุณใช้ SAS พวกเขาจะจ่ายค่าลิขสิทธิ์


4
นี่คือข้อมูลเพิ่มเติมเกี่ยวกับความคิดของ FDA เกี่ยวกับ R: blog.revolutionanalytics.com/2012/06/fda-r-ok.html
Matt Parker

4
การวิจัยมูลนิธิเผยแพร่เอกสารในปี 2008 การอภิปรายการใช้ R ในการทดลองทางคลินิกควบคุม ควรเป็นข้อมูลอ้างอิงที่ดีสำหรับผู้ทำงานร่วมกันที่สงสัยในการใช้ R.
jthetzel

2
ฉันยอมรับว่ามีการย้ายไปใช้ R มากขึ้นในการวิจัยทางคลินิกและหลายคนเชื่อว่า R สามารถทำทุกอย่างให้ตรวจสอบย้อนกลับได้เหมือน SAS
Michael Chernick

6
องค์การอาหารและยาจะค่อนข้างแกนนำเกี่ยวกับการไม่รับรองหรือต้องการซอฟต์แวร์ใด ๆ ที่จะใช้ เป็นเรื่องจริงในอดีตที่การส่งข้อมูลส่วนใหญ่ใช้ SAS ดังนั้น FDA จึงมีความรู้ SAS จำนวนมาก แต่พวกเขาเร็วมากที่จะยอมรับระบบอื่น ๆ โดยใช้ R สำหรับงานล่าสุดจำนวนมากโดยเฉพาะการวิเคราะห์เมตาดาต้า
PaulHurleyuk

1
@ PaulHurleyuk อะไรที่องค์การอาหารและยาจะกล่าวต่อสาธารณะและวิธีการที่พวกเขาปฏิบัติในทางปฏิบัติไม่จำเป็นต้องเหมือนกัน บริษัท ยาส่วนใหญ่เกี่ยวข้องกับการทดลองทางคลินิกระยะที่สองและสามเป็นหลักและพวกเขาคาดหวังว่าพวกเขาจะต้องใช้ SAS ต่อไปในการวิเคราะห์การทดลองเหล่านั้น
Michael Chernick

18

ฉันคิดว่าคำพูดนี้จากแอนน์เอช. มิลลีย์สรุปถึงความรู้สึกของผู้คนจำนวนมากเกี่ยวกับ R:

เรามีลูกค้าที่สร้างเครื่องยนต์สำหรับเครื่องบิน ฉันมีความสุขที่พวกเขาไม่ได้ใช้ฟรีแวร์เมื่อฉันขึ้นเครื่องบิน

น่าเสียดายที่ฉันคิดว่าความเข้าใจผิดนี้ (ฟรี == ด้อยกว่า) เป็นเรื่องธรรมดาในสาธารณะทั่วไป


16

(ปิดหัวข้อเล็กน้อย): ดูรอบจุดอื่น ๆ : ข้อดีบางประการที่ R มีในสถาบันการศึกษาไม่ได้ใช้กับอุตสาหกรรม

เช่นในสถาบันการศึกษามันเป็นข้อได้เปรียบที่ชัดเจนหากคุณสามารถบอกให้นักเรียนไปรับซอฟต์แวร์และทำงานที่บ้านได้ ในอุตสาหกรรมคุณมักไม่ควรนำข้อมูลกลับบ้านไปกับคุณ ...

คุณไม่ควรลองใช้บางสิ่ง (TM) ดาวน์โหลดแพ็คเกจจำนวนมาก (แม้ว่าจะมีชื่อเสียงและทดสอบแล้วก็ตาม) ให้ใช้วิธีการที่ทันสมัย แต่โดยปกติคุณจะต้องติดกับวิธีการและรหัสที่ใช้มานานหลายปีและพฤติกรรมที่เป็นที่รู้จักกันมานาน คุณจะไม่ได้รับผลประโยชน์ทางวิชาการมากมาย

และแน่นอนตามที่ได้กล่าวไปแล้ว: ไม่มีใครเสี่ยงที่จะทำซ้ำการอนุมัติกฎข้อบังคับทุกประเภทเพื่อเปลี่ยนเป็น R จากสิ่งที่ฉันเห็นว่าน้อยกว่า R และมากขึ้นเกี่ยวกับค่าใช้จ่ายมหาศาล + ทำงานเพื่อรับการอนุมัติด้านกฎระเบียบ .


3
ไม่มีอะไรที่ต้องทำเพื่อทำซ้ำการอนุมัติตามกฎระเบียบเพื่อประโยชน์ในการเปลี่ยนเป็นอาร์
Frank Harrell

2
@ Frank: บางทีเรากำลังคิดในสถานการณ์ที่แตกต่างกัน: ฉันคิดว่าคุณอาจคิดว่าการทดลองใหม่ (และคุณมีสิทธิ์) - ฉันคิดในแง่ของการวิเคราะห์กระบวนการ (เคมี + การวิเคราะห์ทางสถิติ) ของการดำเนินการต่อไป การผลิต AFAIK คุณไม่สามารถสลับการวิเคราะห์ข้อมูลของคุณที่นั่นได้ (แต่ไม่ใช่ประเทศ SAS) แต่ฉันอาจจะผิด
cbeleites

2
ฉันไม่คุ้นเคยกับโลกนี้ แต่ฉันสงสัยว่านักวิทยาศาสตร์มีอิสระมากกว่าที่พวกเขาคิด
Frank Harrell

13

ในขณะที่มันมองโลกในแง่ร้ายคำตอบของฉันคือคนประเภทที่ตัดสินใจกวาดล้าง บริษัท เช่น 'เราแค่ใช้ SAS' ก็เป็นคนประเภทที่ไม่ไว้วางใจสิ่งที่พวกเขาไม่เข้าใจและคิดว่าคุณค่าโดยอัตโนมัติ ของบางอย่างเป็นสัดส่วนโดยตรงกับจำนวนเงินที่คุณใช้ไป สิ่งนี้ทำให้พวกเขาต้องการจ่ายเงินสำหรับ SAS มากกว่าใช้เวลาสำรวจทางเลือก


12

เหตุใด บริษัท ยารายใหญ่ถึงต้องการเปลี่ยนเป็น R จาก SAS SAS มีค่าใช้จ่ายหลายล้าน แต่ไม่มีอะไรให้กับ บริษัท ยา อย่างไรก็ตามการแปลงระบบการรายงานที่มีเสถียรภาพทั้งหมดจาก SAS เป็น R จะมีราคาสูงกว่า 50-100 เท่า

SAS มีระบบสนับสนุนปรากฎการณ์: ทุกครั้งที่ฉันต้องการความช่วยเหลือพวกเขาสามารถให้บริการได้ภายในไม่กี่ชั่วโมง

และสิ่งที่ R ไม่ได้มีนั้น SAS ไม่ได้: 1) กราฟิกที่ดีกว่า ... ตกลงมันใหญ่ แต่กราฟิกไม่ใช่ทุกอย่าง นอกจากนี้ R สามารถใช้เครื่องมือพิเศษเพื่อสร้างกราฟเจ๋ง ๆ และ SAS ก็ไม่ได้เลวร้ายเมื่อพูดถึงกราฟิก 2) ภาษาการเขียนโปรแกรมที่ทันสมัยและมีประสิทธิภาพมากขึ้น ผู้ใช้ SAS หลายคนไม่ใช่โปรแกรมเมอร์และไม่สนใจที่จะใช้ภาษาที่น่าสนใจ พวกเขาต้องการวิเคราะห์ข้อมูล

ฉันรัก R แต่มันจะเสียสติสำหรับ บริษัท ใหญ่ ๆ ที่จะเปลี่ยนมาเป็น SAS มันอาจสมเหตุสมผลสำหรับ บริษัท ขนาดเล็ก


3
เห็นด้วยกับคุณ @ Max ในที่สุดคำตอบมาจากใครบางคนในอุตสาหกรรม มีค่าใช้จ่ายในการเปลี่ยนมาใช้ R.
Dan

3
นั่นเป็นเท็จ ค่าใช้จ่ายในการสนับสนุนการเขียนโปรแกรมสำหรับ SAS นั้นสูงกว่านั้นมากสำหรับ บริษัท อาร์ได้ว่าจ้างผู้เก็บโปรแกรมของโปรแกรมเมอร์ SAS เพื่อชดเชยกับภาษาโบราณที่ SAS ใช้
Frank Harrell

ฉันอยู่ในอุตสาหกรรมและใช้ทั้งสองอย่าง R สามารถดำเนินกิจวัตรข้อมูลและที่สำคัญกว่าการวิเคราะห์ด้วยไกลเส้นน้อยลงและด้วยเหตุนี้สามารถที่จะพัฒนาได้เร็วขึ้นมาก ฉันจะบอกว่า บริษัท ยาบางแห่งได้สร้างระบบ SAS สำหรับการเขียนโปรแกรมด้านกฎระเบียบที่ประสบความสำเร็จ จุดสำคัญที่ต้องพิจารณา: ทำไมการเปลี่ยนแปลง (ณ จุดนี้) หากพวกเขาทำมันตั้งแต่เริ่มต้นบางที R แทน
AdamO

11

มีข้อดีหลายประการโดยไม่คำนึงถึงลำดับ

  • SAS มีฐานการติดตั้งขนาดใหญ่และบันทึกการติดตามที่ยาวนาน

ฉันตั้งใจหลีกเลี่ยงการใช้คำที่ดูถูกเช่น "มรดก" หรือ "นิสัย" หลาย บริษัท ใช้ SAS เป็นเวลา 30 หรือ 40 ปีและมีรหัสการทำงานนับล้าน นอกจากนี้ยังมีประโยชน์ทั้งหมดของฐานรหัสที่เสถียรโดยมีผู้ใช้นับล้านวันในพื้นที่ที่ข้อผิดพลาดเล็กน้อยอาจมีความสำคัญ นี่คือเหตุผลเดียวกันกับที่ Unix รสชาติยังคงเป็นที่นิยมแม้ว่า Unix อายุมากกว่า 40 ปีและล้าสมัยในบางวิธี ในที่สุดก็มีชุมชนขนาดใหญ่ของผู้เชี่ยวชาญ SAS ที่มีประสบการณ์ที่ใช้ในการแก้ปัญหาทางธุรกิจ

  • SAS เหมาะอย่างยิ่งกับข้อมูลที่ซับซ้อนต่างกันและสภาพแวดล้อมการทำงาน

บริษัท มีแหล่งข้อมูลที่แตกต่างกันมากมายซึ่งมีพื้นฐานอยู่ในระบบที่แตกต่างกันรวมถึงในหลาย ๆ กรณีสภาพแวดล้อมการทำงานที่หลากหลาย R เพิ่งได้รับความสามารถขั้นพื้นฐานบางอย่างในการจัดการกับมากกว่าที่จะถูกเก็บไว้ในหน่วยความจำ เปรียบเทียบสิ่งนี้กับความสามารถของ SAS ในการสนับสนุนการประมวลผลดั้งเดิมที่ได้รับการปรับปรุงในฐานข้อมูลสำหรับ Terradata เพื่ออ้างอิงเพียงตัวอย่างเดียว ในสถานการณ์จริงส่วนใหญ่ส่วนที่ยากที่สุดของการวิเคราะห์คือการจัดการกับข้อมูลและสภาพแวดล้อมการทำงาน (จำเป็นต้องรันโค้ดให้คะแนนโมเดลที่พัฒนาโดย Windows ของคุณบนเมนเฟรมใช่หรือไม่ด้วย SAS ไม่มีปัญหาด้วย R คุณไม่มีโชค) R ไม่สามารถแก้ปัญหาเหล่านั้นได้

  • ผู้ใช้ไม่ต้องกังวลกับการเป็น "ด้วยตนเอง"

ผู้ใช้ SAS สามารถมั่นใจได้อย่างสมเหตุสมผลว่าทุกโค้ดโมดูลได้รับการทดสอบโดยบุคคลที่ผ่านการรับรองแล้ว ไม่จำเป็นต้องอุทิศเวลาและความพยายามในการเรียนรู้ที่มาของรหัสหรือตรวจสอบความถูกต้องได้อย่างอิสระ นอกจากนี้หากพบปัญหาใด ๆ ความช่วยเหลือที่แข็งแกร่ง (จากบางสิ่งพื้นฐานเป็นเอกสารไปจนถึงสิ่งที่ครอบคลุมเช่นการสำรวจรายละเอียดผลลัพธ์ที่ไม่คาดคิดหรือพฤติกรรมของวิธีการที่ซับซ้อน) ผู้ใช้สามารถรับโทรศัพท์และขอความช่วยเหลือ

  • มันคือ "ดีพอ"

ภาษาปิดบางคนเพราะแตกต่างจากภาษาสมัยใหม่สำหรับการเขียนโปรแกรมทั่วไป ต้องบอกว่าภาษานั้นอยู่ในระดับสูงมีประสิทธิภาพแสดงออกและครอบคลุม ในระยะสั้นเมื่อคุณเรียนรู้มันจะทำให้งานเสร็จ สำหรับ บริษัท ความสง่างามของโซลูชันไม่ใช่จุดขายมากนัก


2
ความสง่างามอาจ - แต่ค่าใช้จ่าย? ฉันคิดว่า บริษัท ให้ความสำคัญกับเรื่องนี้!
ความน่าจะเป็นทางการ

2
R สามารถทำงานได้ทุกอย่างตั้งแต่โทรศัพท์มือถือไปจนถึงซูเปอร์คอมพิวเตอร์ในราคาศูนย์และเมนเฟรมก็มีค่าใช้จ่ายเช่นกัน
Sean

9

สนับสนุนลูกค้า.

ฉันเคยแชทกับเพื่อนที่ทำงานใน บริษัท ที่เชี่ยวชาญในการติดตั้งเซิร์ฟเวอร์และเขาก็อธิบายให้ฉันฟังว่าทำไม บริษัท ใหญ่ ๆ มักเลือกใช้ผลิตภัณฑ์ของ Microsoft มากกว่าไปเปิดแหล่งที่มา ข้อได้เปรียบที่ Microsoft มีเหนือคู่แข่งโอเพ่นซอร์สคือการสนับสนุนลูกค้า หากมีสิ่งผิดปกติเกิดขึ้นกับผลิตภัณฑ์ บริษัท สามารถโทรไปยัง Microsoft บริษัท ใหญ่ ๆ ได้รับการสนับสนุนเป็นส่วนตัว ไม่เช่นนั้นกับซอฟต์แวร์โอเพนซอร์ซ

ฉันคิดว่านั่นเป็นเหตุผลเดียวกันที่ SAS กำลังให้ความสำคัญมากกว่า R


2
การปฏิวัติ R (หรือ บริษัท อื่น ๆ )?
Ben Bolker

4
ฉันคิดว่าความคิดเห็นเหล่านี้ไม่ถูกต้อง ในโลกเซิร์ฟเวอร์กฎของโอเพ่นซอร์สและเว็บเซิร์ฟเวอร์ Apache เป็นเว็บเซิร์ฟเวอร์ที่ได้รับความนิยมมากที่สุด
Frank Harrell

ฉันไม่เคยบอกว่าเขากำลังพูดถึงเซิร์ฟเวอร์ ค่อนข้างเกี่ยวกับผลิตภัณฑ์เช่น Microsoft Office ฉันแค่บอกว่าเขาทำงานในโลกเซิร์ฟเวอร์
Raskolnikov

2
เตือนฉันถึง บริษัท ที่ใช้ sharepoint และวิกิโอเพนซอร์ซ sharepoint เกือบจะแห้งแล้งและมีการอัปเดตเฉพาะ wiki เท่านั้น
TLJ

9

สิ่งที่เกี่ยวกับ Frontends R คืออะไรที่เทียบเท่ากับ SAS Enterprise Guide, Web Report Studio หรือ Enterprise Miner แก้ไข: เครื่องมือเหล่านี้ทำให้ผู้ใช้ที่ไม่ใช่การเขียนโปรแกรมสามารถใช้คลังข้อมูลได้โดยไม่ต้องมีความรู้เกี่ยวกับเทคโนโลยีพื้นฐาน พวกเขาไม่ใช่เครื่องมือสำหรับการใช้งาน SAS เป็นหลัก R GUI's เป็นเพียง IDE สำหรับภาษา R ระบบ / AFAIK พวกเขาไม่สามารถให้ความช่วยเหลือสำหรับผู้ใช้ที่ไม่ใช่ด้านเทคนิคที่ต้องการได้รับข้อมูล & ข้อมูลเชิงลึกจาก DWH


2
มันเป็นคำตอบ สิ่งที่ทำให้ SAS มีคุณค่าต่อลูกค้า (เช่นเรา) คือความสะดวกในการใช้งานสำหรับผู้ที่ไม่ต้องเขียนโค้ดบรรทัดเดียว
เคิร์ต

2
@Kurt, gung ไม่ต้องการที่จะหมายความว่านี่ไม่ใช่คำตอบ แต่ที่คำตอบของคุณไม่เหมาะกับเว็บไซต์นี้ (และโดยเฉพาะอย่างยิ่งสำหรับคำถามปัจจุบันที่จริงแล้ว)
Stéphane Laurent

มี GUIs จำนวนมากสำหรับ R ดูที่stats.stackexchange.com/questions/5292/…
naught101

2
ฉันทำงานกับ RStudio แล้ว เมื่อเปรียบเทียบกับ SAS Enterprise Guide มันยังคงมีวิธีที่ยาวมากไปจนถึงการใช้งานที่ง่ายสำหรับผู้ใช้มือใหม่ เพิ่มความจริงที่ว่า R หายไปเทียบเท่ากับเซิร์ฟเวอร์ Metadata และฉันก็คิดถึงสิ่งที่เทียบเท่ากับ WRS (บางทีฉันอาจจะตาบอด :) ความงามของภาษาและประสิทธิภาพที่คุณสามารถทำได้หมายถึงไม่ติดกับ บริษัท ใดที่ 90% ของคลังข้อมูล "ลูกค้า" ไม่สามารถเขียน "Hello World" ในทุกสภาพแวดล้อม นั่นคือสิ่งที่ฉันต้องการชี้ให้เห็นและนั่นคือสิ่งที่ต้องทำมากมาย
เคิร์ต

2
ขอบคุณสำหรับการอัปเดตคำตอบของคุณ @Kurt ฉันคิดว่ามันจะมีประโยชน์มากขึ้นสำหรับผู้อ่านในอนาคตตอนนี้ เป็นความจริงที่ว่ามีจุด & คลิกและข้อเสนอคลังข้อมูลสำหรับ SAS ที่มีความครอบคลุมมากขึ้น & พร้อมออกจากกล่องได้มากกว่าอาร์นั่นเป็นจุดที่เหมาะสมที่จะยกระดับ +1
gung

8

ฉันเคยทำงานให้กับ บริษัท ที่ปรึกษาที่ให้ความช่วยเหลือ SAS แก่ผู้ผลิตชิปรายใหญ่ใน Silicon Valley บุคคลที่ติดต่อของเราที่ บริษัท บอกเราว่าเขาได้รับข้อเสนอจาก บริษัท อื่นเพื่อให้คำปรึกษาเดียวกันโดยใช้ซอฟต์แวร์ที่แตกต่างกันซึ่งครอบคลุมทุกพื้นที่ที่ครอบคลุมโดย SAS และจะทำให้ บริษัท เสียค่าใช้จ่ายเพียงเศษเสี้ยวของ SAS ( $ 30,000 เมื่อเทียบกับ$ 1,000,000) ผู้ติดต่อพิจารณาว่าจะทำอย่างไรและตัดสินใจไม่แจ้งหัวหน้าของเขาเกี่ยวกับข้อเสนอนี้เพราะเขากลัวว่าจะถูกไล่ออกเพราะใช้ SAS ตั้งแต่แรกและไม่ได้พิจารณาทางเลือกที่ถูกกว่า เขายืนยันว่า บริษัท ที่ปรึกษาของเราให้ค่าใช้จ่ายในการปรึกษากับเรา บริษัท ของเราตกลงกัน


1
ดังนั้นผู้ติดต่อของคุณไม่สามารถโต้แย้งว่า R ยังคงค่อนข้างใหม่เมื่อเทียบกับ SAS และเขาต้องการรอเพื่อให้แน่ใจว่า R ก่อตั้งขึ้นก่อนที่จะใช้หรือไม่
ความน่าจะเป็นทางการ

6

ฉันไม่คิดว่ามีการพูดถึงความปลอดภัยของแอปพลิเคชัน คำถามนี้ถูกยกขึ้นใน Stack Overflowแต่ลดลงเนื่องจากไม่อยู่ในหัวข้อ

ฉันทำงานร่วมกับคณะกรรมการสุขภาพและสวัสดิการแห่งชาติของสวีเดนที่ใช้ SAS เมื่อฉันพูดคุยกับนักสถิติของพวกเขา (เช่น R) พวกเขาอ้างว่าพวก IT-folks ชอบ SAS เพราะพวกเขาไม่เชื่อถือแพ็คเกจที่ดาวน์โหลดใน R. ภรรยาของฉันก็ทำงานใน SAS และสถาบันของเธอมักจะอ้างถึงปัญหาเดียวกัน ...

ฉันชอบที่จะเห็นความคิดเห็นบางอย่างเกี่ยวกับปัญหานี้ ฉันทำการค้นหาอย่างรวดเร็ว แต่ไม่พบการอ้างอิงที่ดีใด ๆ ...


3
ทางเลือกในการดาวน์โหลดแพ็คเกจที่ให้ความสามารถใหม่ (เหมือนแพ็คเกจ R) มันเป็นบ้านเติบโตความสามารถเหล่านั้นหรือไม่ น่าเชื่อถือมากกว่านี้ไหม?
Frank Harrell

2
@ FrankHarrell ฉันเห็นด้วย แต่ฉันคิดว่านี่อาจเป็นเรื่องง่ายสำหรับนักพัฒนา R ในการกำหนดเป้าหมายและปรับปรุง วิธีแก้ไขปัญหาที่ง่ายอาจเป็นระดับความปลอดภัยที่แตกต่างกันสำหรับแพ็คเกจ - ถ้าแพ็คเกจมีการเรียกระบบหรือเชื่อมต่อด้วยตนเองกับอินเทอร์เน็ตแพคเกจควรมีระยะห่างที่สูงขึ้น สิ่งนี้จะช่วยให้สามารถติดตั้งได้ในระดับต่ำเท่านั้นในสถาบัน / บริษัท ที่มีปัญหาด้านการรั่วไหลของข้อมูล ฉันในฐานะผู้ใช้สามารถทำการตรวจสอบพิเศษเมื่อฉันเลือกที่จะติดตั้งแพ็คเกจการกวาดล้างสูง (Btw, หนังสือของคุณ (RMS ver 2) กำหนดเวลาเมื่อไหร่?)
Max Gordon

ฉันหวังว่ารุ่นที่ 2 ของ RMS จะวางจำหน่ายในเวลาเพียงหนึ่งปี
Frank Harrell

5

เหตุผลที่ฉันเข้าใจว่าน่าเชื่อถือที่สุดคือ SAS มีห้องสมุดที่กว้างขวางของโมดูลเฉพาะธุรกิจแนวดิ่งที่ผู้คนในแนวดิ่งเหล่านี้ใช้ทั้งหมดดังนั้นมันจึงค่อนข้างเป็นล็อคอิน
แต่ด้วยที่ SAS ได้ตอบสนองความต้องการของเซ็กเมนต์แนวตั้งเหล่านี้ในธุรกิจและปรับให้เหมาะสมกับความต้องการของพวกเขา - ได้รับการปรับปรุงในแง่ของ "ผู้ใช้ไม่ต้องทำงานพิเศษมากมายเพื่อให้ได้ผลลัพธ์" ฉันไม่ใช่ผู้ใช้ SAS ดังนั้นจึงไม่ได้หมายความว่าเป็นการป้องกันแบบเอนเอียงของกลยุทธ์ทางธุรกิจของ SAS


4

เป็นผลิตภัณฑ์เชิงพาณิชย์ขนาดใหญ่ที่ SAS คือมีความพยายามที่แข็งแกร่งและประสานงานโดยจ่ายพนักงานขายเพื่อส่งเสริมมัน ฉันไม่คิดว่าความพยายามในการส่งเสริมการใช้ R สามารถจับคู่สิ่งเหล่านี้ได้


8
ใช่ผู้คนต้องค้นพบ R ในระดับหนึ่ง แต่ปัญหาส่วนใหญ่เกิดจากความเฉื่อยในการเรียนรู้ภาษาใหม่ ภาษาใหม่ออกมาเสมอซึ่งมีข้อได้เปรียบเหนือภาษาเก่า แต่ผู้ใช้ยังคงยึดมั่นกับภาษาเก่า (เป็นสักขีพยานภาษาโคบอล) การเขียนโปรแกรมใน SAS นั้นไม่มีประสิทธิภาพอย่างมหาศาลโดยอาจต้องเพิ่มจำนวนโปรแกรมเมอร์ให้ทำงานเช่นเดียวกับ R แต่ผู้เชี่ยวชาญ SAS มีความยินดีที่จะคร่ำครวญในความสนุกสนาน ในเงินเดือน
Frank Harrell

3

ฉันดู Open Source หรือซอฟต์แวร์ที่มีลิขสิทธิ์เช่นนี้ไม่ว่าจะเป็น SAS หรืออย่างอื่น แผนกไอทีของฉันอยู่ที่นั่นเพื่อให้บริการแก่ธุรกิจของเรา บริษัท ไม่ได้รับเงินจากไอทีเพียงอย่างเดียวจากธุรกิจไอทีที่สนับสนุน ธุรกิจมีรายได้ปีละ$ 16 พันล้าน ค่าใช้จ่ายไอทีรอบ$ 200 ล้านปี หากเงินเป็นปัญหาฉันจะลดค่าใช้จ่าย แต่ถ้าฉันประหยัดงบประมาณ10% ( $ 20 ล้านบาท) ธุรกิจจะแจ้งให้ทราบหรือไม่ พวกเขาจะลดงบประมาณของฉันในปีหน้าหรือไม่ หากไอทีล้มเหลวธุรกิจสูญเสียรายได้เท่าไหร่จะแตกต่างกันไปตามลักษณะของความล้มเหลว บางส่วนของธุรกิจอาจไม่มีรายได้อีกต่อไป หากผลิตภัณฑ์อย่าง SAS ล้มเหลวฉันสามารถฟ้องร้องได้โดยทำสัญญา หากผลิตภัณฑ์ OSS ล้มเหลวฉันไม่สามารถทำได้ ฉันจะไม่กู้คืน$ของฉัน16 พันล้าน แต่ฉันอาจได้รับคืนและด้วยความเป็นจริงกับ SAS คุณไม่น่าจะสูญเสียมาก ความแตกต่างของราคาเมื่อเทียบกับราคาจะต้องพิสูจน์ความเสี่ยงที่รับรู้เพิ่มเติมให้กับธุรกิจ บางครั้งมันถูกกว่าที่จะยึดติดกับ SAS มากกว่าที่จะฝึกใหม่ บางครั้งมีปัญหาที่มีลำดับความสำคัญสูงกว่าดังนั้น บริษัท จึงยังคงอยู่กับ SAS บาง บริษัท ไม่จำเป็นต้องใช้ฟังก์ชั่นเต็มรูปแบบในกรณีที่มีทางเลือกอื่น บางคนไม่ต้องการความช่วยเหลือและมีทางเลือกอีกทาง หากคุณตอบสนองความต้องการทางธุรกิจแล้วตัวเลือกอย่างใดอย่างหนึ่งที่ถูกต้องหากคุณต้องการที่จะให้การสนับสนุนสำหรับธุรกิจที่คุณต้องดูที่ค่าใช้จ่ายทั้งหมดของการเป็นเจ้าของในช่วง 5-10 ปีความสามารถในการรับสมัครผู้เชี่ยวชาญในเครื่องมือ ดังนั้นคุณไม่จำเป็นต้องเขียนทุกอย่างใหม่ทุกครั้งที่มีการเปิดตัวหลักสูตรฝึกอบรมที่มีให้


4
ฉันไม่ทำตามเหตุผลของคุณ จำนวนเงินที่สูญเสียไปกับการเขียนโปรแกรมให้เป็นภาษาโบราณ (SAS) กับภาษาฟรีสมัยใหม่นั้นน่าทึ่งมาก
Frank Harrell

4
@ Frank - ฉันต้องไม่เห็นด้วยกับลักษณะของคุณ โปรแกรมเมอร์ SAS ที่มีความสามารถนั้นสามารถทำงานได้อย่างมีประสิทธิภาพใน SAS และโปรแกรมเมอร์ SAS ที่มีความสามารถนั้นก็มีวางจำหน่ายอย่างกว้างขวาง ฉันให้คุณว่า R มีโครงสร้างมากกว่าภาษาสมัยใหม่และดังนั้นอาจจะง่ายต่อการเรียนรู้สำหรับโปรแกรมเมอร์ที่รู้พูด Java จากประสบการณ์ของฉันที่หลาย ๆ บริษัท ประสิทธิภาพการทำงานของนักพัฒนาโดยใช้ SAS ไม่ค่อยเป็นปัญหาสำคัญ
JBK

9
การใช้ SAS เป็นเวลา 23 ปีและ S-Plus / R เป็นเวลา 22 ปีฉันสามารถพูดได้ว่าโปรแกรมเมอร์ SAS ที่มีประสบการณ์สูงสามารถทำงานได้อย่างมีประสิทธิภาพสูง แต่โปรแกรมเมอร์ R ที่มีประสบการณ์นั้นสามารถสร้างผลงานได้สามครั้งได้อย่างง่ายดาย
Frank Harrell

2
"ฉันสามารถฟ้องร้องได้ภายใต้สัญญา" haha ​​- รหัสที่ไม่ถูกต้องที่เขียนโดยพนักงานมีแนวโน้มที่จะทำให้เกิดปัญหามากกว่าสิ่งที่ SAS หรือ R ทำ "ด้วยตัวของมันเอง"
ความเป็นไปได้ที่จะเกิดขึ้น

1

เหตุผลบางอย่างที่ฉันไม่ได้เห็นได้กล่าวถึง:

  1. เอกสารที่ดีกว่า เอกสารประกอบของ SAS เป็น verbose เอกสาร R เป็นคำย่อ บริษัท หลายแห่งอาจชอบเอกสาร verbose

  2. ข้อความผิดพลาดที่ดีขึ้น ข้อความแสดงข้อผิดพลาดของ R มักจะถูกออกแบบมาเพื่อพิสูจน์ว่าคนที่เขียนข้อความนั้นฉลาดกว่าคนที่อ่าน

  3. การสนับสนุนทางเทคนิค SAS มีการสนับสนุนด้านเทคนิคที่ดีที่สุดที่ฉันได้รับจากทุกที่ที่ SAS จัดหาให้ คุณสามารถรับความช่วยเหลือเกี่ยวกับ R ได้ แต่ความช่วยเหลือนั้นกระจัดกระจายไปตามที่ต่างๆและไม่สามารถใช้งานได้ตลอดเวลา ผู้คนในไซต์ต่าง ๆ ที่ให้ความช่วยเหลือด้าน R เป็นอาสาสมัครและอาสาสมัครไม่จำเป็นต้องให้ความช่วยเหลือ ผู้คนที่ได้รับการสนับสนุนทางเทคนิคของ SAS จะได้รับเงินเพื่อทำสิ่งที่พวกเขาทำ - และพวกเขาทำได้ดี ไม่เพียง แต่พวกเขาทำมันได้ดีพวกเขาทำอย่างสุภาพที่มักจะไม่ปรากฏในชุมชน R ทั้งหมด (รายการโปรดของฉัน "ฉันได้รับความช่วยเหลือโดยการพิมพ์ 'ช่วย' ทำไมคุณไม่ลองพิมพ์ 'ช่วย'?)

  4. LATEX


1
ฉันแน่ใจว่ามี บริษัท ที่ขายการสนับสนุนทางเทคนิคสำหรับอาร์ แต่ฉันไม่มีประสบการณ์ที่ดีเพียงใด!
kjetil b halvorsen

1

ฉันคิดว่ามุมดั้งเดิมอาจเป็นมุมที่ใหญ่ด้วยเหตุผลดังต่อไปนี้ องค์กรว่าจ้างบุคคลเรียกบุคคลนั้นว่า X พวกเขาเป็นกูรูด้านการคำนวณ / พ่อมด / ฯลฯ พวกเขาสร้างสุดยอดโปรแกรม / เครื่องมือ / etc ของ SAS พวกเขาดีมากที่คนอื่น ๆ ในองค์กรไม่รู้สึกว่าพวกเขาจำเป็นต้องเข้าใจวิธีการทำงานของโปรแกรม มันทำให้ง่ายมากเพียงแค่กดปุ่มและทุกอย่างก็ใช้งานได้ (กล่องดำวิเศษ)

Person X ออกจากองค์กร น่าเสียดายที่ความรู้ที่บุคคล X ออกจากองค์กร (เอกสารและการจัดการความรู้ไม่ได้จัดลำดับความสำคัญโปรแกรมทำงานแทน) พวกเขาถูกแทนที่ด้วยบุคคล Y บุคคล Y นั้นยอดเยี่ยมด้วย R แต่ไม่มีความคิดเกี่ยวกับ SAS และด้วยเหตุนี้จึงไม่มีความคิดเกี่ยวกับวิธีที่โปรแกรม SAS ใช้งานได้จริง มีเส้นโค้งการเรียนรู้ขนาดใหญ่ที่จะคิดออกว่าเป็นอะไรCTCTสูงกว่าใบอนุญาตปีเดียวอย่างมีนัยสำคัญสำหรับ SAS ฉันคาดหวังว่า SAS จะทำการวิเคราะห์การค้านี้และให้อิทธิพลนี้กับวิธีการตั้งค่าใบอนุญาต (ดีฉันจะถ้าฉันทำงานที่ SAS) นอกจากนี้ให้สังเกตว่าขั้นตอนการพล็อตของ SAS นั้นดีกว่าทศวรรษที่ผ่านมาหรือไม่ เหตุบังเอิญที่ R ทำการวางแผนที่ดีเป็นอันดับแรกได้หรือไม่ ผมคิดว่าไม่! สิ่งนี้ช่วยลดประสิทธิภาพในการสลับเนื่องจากการวางแผนไม่แตกต่างกันอีกต่อไป - R ยังดีกว่า แต่ไม่เพียงพอที่จะเปลี่ยน ...


0

สำหรับสถิติอุตสาหกรรมมีผู้ประกันคุณภาพที่ (ปกติ) ไม่มีการเขียนโปรแกรมสถิติหรือภูมิหลังทางวิทยาศาสตร์และผู้ตรวจสอบสถิตินักเขียนโปรแกรมและนักวิทยาศาสตร์ พวกเขาต้องการรู้ว่า "คุณรู้ได้อย่างไรว่าสิ่งที่คุณทำถูกต้องหรือไม่" และ "ถ้ามันผิดเราจะโทษใครสักคนได้อย่างไรและพวกเขาจะจ่ายอย่างไร"

ใบอนุญาต Copyleft ของ GNU / GPL มาพร้อมกับข้อความกระป๋องที่ระบุว่า "R เป็นซอฟต์แวร์ฟรีและมาพร้อมกับไม่มีการรับประกันอย่างไม่มีเงื่อนไข" ในข้อความตัวพิมพ์ใหญ่ทั้งหมดตามที่ฉันเขียน นี่เป็นปัญหา เมื่อคนที่มีคุณภาพอ่านข้อความนี้พวกเขาจะทำให้เสื่อมเสียชื่อเสียง R ทันที ฉันหมายถึงถ้าผลิตภัณฑ์ดีมีมูลค่าเพิ่มการรับประกันใช่มั้ย ดังกล่าวมีผลิตภัณฑ์ในเชิงพาณิชย์ทำให้เราเชื่อ ในความเป็นจริงแล้วท้ายที่สุดแล้วองค์การอาหารและยาที่กล่าวว่าพวกเขาจะยอมรับการส่งกฎข้อบังคับใน R ซึ่งสะท้อนถึงการเปลี่ยนแปลงในอุตสาหกรรมซอฟต์แวร์ (หมายเหตุข้อความนี้มาหลังจากวันที่โพสต์ดั้งเดิมของคำถาม)

สำหรับคนที่ไม่รู้อะไรเกี่ยวกับคอมพิวเตอร์สถานการณ์ความปลอดภัยความไม่สามารถคืนสภาพและข้อผิดพลาดทางวิทยาศาสตร์ที่เกิดขึ้นจริงนั้นเป็นผลมาจากการขาดการรับประกันอย่างสมบูรณ์ เราทุกคนยอมรับความผิดพลาดอาจมีค่าใช้จ่ายที่รุนแรง สำหรับสิทธิ์ใช้งาน SAS ของคุณ SAS มีผู้เชี่ยวชาญที่สามารถอธิบายซอฟต์แวร์ของตนต่อผู้สอบบัญชีและในสถานการณ์ที่เป็นไปไม่ได้ที่ SAS ทำให้เกิดปัญหาดังกล่าวพวกเขาสามารถรับผิดชอบค่าปรับและการลงโทษ (พวกเขามีเงินเพียงพอสำหรับนักกฎหมาย ถูกโต้แย้งอย่างสมบูรณ์ในกรณีเช่นนี้) ภาระและค่าใช้จ่ายในการมีนักวิเคราะห์ / โปรแกรมเมอร์ที่นำเสนอกรณีนี้สำหรับ R โดยทั่วไปจำนวนใบอนุญาต SAS ไม่ใช่การเขียนโปรแกรมใน SAS ที่ทำให้คุณพ้นจากภาระการปฏิบัติตามข้อกำหนดด้านคุณภาพอย่างสมบูรณ์!

ดังนั้นโดยพื้นฐานแล้วฉันจะบอกว่าการดำเนินคดีอย่างมีเกียรติมีบทบาทสำคัญในการทำให้จำเป็นต้องมีซอฟต์แวร์ลิขสิทธิ์ที่มีราคาแพง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.