ทับทิมเป็นโต๊ะทำงานสถิติ


13

และนี่ก็เป็นคำถามที่เกี่ยวข้องอย่างมากกับงูหลามเป็นสถิติที่ปรับแต่งและExcel เป็นสถิติที่ปรับแต่ง ฉันรู้ว่ามีการอภิปรายอย่างมากเกี่ยวกับ Ruby กับ Python แต่นี่ไม่ใช่ประเด็นของคำถามนี้ ฉันคิดว่าทับทิมเร็วกว่าไพ ธ อนและการมีไวยากรณ์ที่เป็นธรรมชาติมาก ๆ อาจเป็นประโยชน์ต่อฉันในการเข้าใจสถิติและอาจเป็นทางเลือกที่ดีสำหรับ R (ซึ่งเป็นที่สนใจของฉันและถูกอ้างถึงในคำถามอื่น ๆ ของฉันที่นี่) ตัวอย่างเช่นหนึ่งในการบรรยายของ Google Tech ที่ฉันเคยเห็น (อ้างถึงคำถามที่เชื่อมโยงที่นี่ผู้สอนบ่นว่า R ช้าในขณะที่สร้างลูปสำหรับ) ด้วย Ruby ยังมี Rails อยู่ด้วยดังนั้นอาจมีความเป็นไปได้ที่จะนำทั้งสองอย่างมารวมกัน (Python มี Django แต่อีกครั้งฉันไม่เข้าใจ)

ดังนั้นคำถามก็เหมือนกัน แต่สำหรับฉันใน Ruby:

  • คุณสามารถแนะนำอะไรได้ถ้าฉันต้องการใช้ Ruby เป็น "สถิติ workbench" เพื่อแทนที่ R, SPSS, Python, Excelฯลฯ

  • สิ่งที่ฉันจะได้รับและสูญเสียขึ้นอยู่กับประสบการณ์ของคุณ?

โปรดทราบฉันกำลังพิจารณาคำถามนี้ตามคำถาม Python และ Excel ก่อนหน้า หากคุณเชื่อว่าการใช้ Ruby และ Python (หรือ Excel) จะมีผลกระทบเหมือนกันดังนั้นโปรดพูดเช่นนั้นและชี้ไปที่ข้อโต้แย้งของคำถามก่อนหน้านี้เจตนาของคำถามนี้คือการไม่ทำซ้ำคำถามก่อนหน้าสำหรับคำตอบเดียวกัน อย่างไรก็ตามฉันเชื่อว่ามีความแตกต่าง (เช่นความเร็วของภาษาและไวยากรณ์) แต่ฉันก็อยากรู้คำแนะนำสำหรับ Ruby หรือเป็นพิเศษเช่นถ้ามีน้อยกว่าที่จะพูด Python หรือ Excel ดังนั้นโปรดพิจารณาคำตอบก่อนหน้าสำหรับคำถามที่คล้ายกันนี้ แต่สำหรับภาษา / โปรแกรมอื่น ๆ

แก้ไข:เพียงเพื่อเน้นเนื่องจากคำตอบดูเหมือนจะเกิดขึ้นในอีกทางหนึ่งคำตอบที่ฉันค้นหาคือคำตอบที่เลือกจากคำถาม Python ที่ฉันเชื่อมโยง มันไม่ได้เกี่ยวกับการเรียนรู้สถิติร่วมกับทับทิม ผมไม่ชี้ไปที่คำถามที่เรียนรู้สถิติกับR ถ้าเป็นไปได้ดี แต่ฉันไม่คาดหวังว่าจะได้เรียนรู้สถิติกับ Ruby ในเวลาเดียวกัน คุณสามารถสมมติพื้นหลังสถิติสำหรับคำถามนี้


ขอบคุณสำหรับการแก้ไข! ฉันสังเกตเห็นว่าคำขอบคุณของฉันถูกลบออก เป็นความคิดที่ดีไหมที่จะพูดขอบคุณในคำถาม? (แค่ต้องการยืนยันไม่มีปัญหาในด้านของฉัน - แสดงความคิดเห็นเล็กน้อยหัวข้อคำถาม แต่ฉันไม่ต้องการที่จะเริ่มคำถามเกี่ยวกับ meta เพียงแค่นี้)
Oeufcoque Penteano

1
ความเห็นต่างกันเล็กน้อย สั้น ๆ "ขอบคุณ" ในตอนท้ายของคำถามเป็นเรื่องปกติ แต่มากกว่านั้นมักจะถือว่าเป็นการรบกวนที่ไม่จำเป็น คุณสามารถค้นหาคำแนะนำเกี่ยวกับเว็บไซต์เมตาทั่วทั้งไซต์เช่นทิศตะวันออกคำถามที่พบบ่อยหน้า
whuber

คำตอบ:


9

ฉันใช้ Ruby + R

คุณสามารถอ่านกระดาษ: RinRuby: การเข้าถึง R Interpreter จาก Pure Ruby

http://www.jstatsoft.org/v29/i04/paper

และบล็อกนี้:

http://rubyforscientificresearch.blogspot.com

http://sciruby.com/

(ผู้เขียนของ sciruby เป็นผู้ใช้ R ด้วย)


ขอบคุณคำตอบของคุณไปในทิศทางที่ฉันกำลังมองหา ฉันสังเกตเห็นว่าวันที่อ้างอิงตั้งแต่ปี 2009 และ 2011 ฉันสงสัยว่ามีวรรณกรรมล่าสุดเกี่ยวกับทับทิมที่ให้ไว้นี้หรือไม่เป็นภาษาใหม่ที่มีความสำคัญและมีการเติบโตอยู่เสมอ ถึงกระนั้นฉันคิดว่านี่เป็นจุดเริ่มต้นที่ดี ดีที่บล็อกพิจารณาทับทิมสำหรับการวิจัยทางวิทยาศาสตร์ซึ่งเป็นกรณีของฉัน
Oeufcoque Penteano

สวัสดีฉันรักทับทิมและรางรถไฟ ฉันก็ชอบอาร์ด้วย คุณสามารถค้นหา rubygems เพิ่มมากขึ้นเรื่อย ๆ rubygems.org/stats R ก็เช่นกัน 2003, R cran คือ 200, ตอนนี้คือ 3600+ !!! ในปี 2011 ทับทิมอัญมณีเป็น 28000 ตอนนี้เป็น 36874 อัญมณี! คุณสามารถเพลิดเพลินกับ Ruby + R: D
ouyang

จุดที่ดีในอัญมณีทับทิมฉันลืมเกี่ยวกับสิ่งเหล่านั้น บางทีคนอื่น ๆ อาจแนะนำพลอยทับทิมจำนวนเล็กน้อยเกี่ยวกับการใช้ทับทิมเป็นโต๊ะทำงานซึ่งเป็นที่รู้จักกันดีในการทำงานและมีประสิทธิภาพ? ขอบคุณที่เพิ่มคำตอบในสิ่งที่ฉันกำลังมองหาอีกครั้ง
Oeufcoque Penteano

4

คำตอบเก่า (ก่อนแก้ไข):

หากคุณคิดว่าคุณจะเรียนรู้สถิติด้วยการเขียนโปรแกรมทุกอย่างด้วยตัวเองฉันจะบอกว่าคุณกำลังเข้าสู่ช่วงยาวเต็มไปด้วยการดีบักและไม่ใช่การเรียนรู้ทางสถิติ นอกจากนี้คุณจะต้องมีภาษาอย่าง R เพื่อตรวจสอบคำตอบของคุณ

ฉันคิดว่า user765195 มีจุดในแง่ของการเป็น R debug ยากกว่าภาษาอื่น ๆ ซึ่งเป็นสิ่งสำคัญ แต่ "เลวร้ายที่สุด"? ฉันไม่คิดอย่างนั้น

แก้ไข:

ดังนั้นถ้าฉันสามารถสรุปการแก้ไขของคุณ: เนื่องจากคุณได้ทำสถิติแล้วและคุณต้องการใช้ Ruby เพื่อทำแทนโปรแกรมทางสถิติจริง ๆ (R, gretl, SAS ฯลฯ ) คุณจะทำให้ชีวิตของคุณง่ายขึ้นได้อย่างไร . นั่นถูกต้องใช่ไหม?

ฉันไม่สามารถให้คำตอบทับทิมได้ แต่ฉันคิดว่าควรถามคำถามทั่วไปด้วย โดยเฉพาะอย่างยิ่งเมื่อคุณกลับไปที่อินสแตนซ์อื่นของคำถามเดียวกัน: "ฉันต้องการใช้ Python / perl / java / Clojure / C / อะไรก็ตามที่ต้องทำสถิติ"

ฉันคิดว่าคำตอบจะเป็นเสมอ: "ทำไมจึงต้องใช้เครื่องมือที่มีความเป็นทั่วไปดั้งเดิม (สถิติฉลาด) เพื่อทำงานที่เครื่องมือพิเศษทำได้ดีกว่ามาก" และฉันเห็นคำตอบพื้นฐานหกข้อ:

  1. ฉันไม่ต้องการที่จะเรียนรู้ภาษาอื่นและเนื่องจากฉันมีความรอบรู้ใน Python / Ruby / Excel / Java ฉันจึงยืนยันที่จะใช้ภาษานั้น

  2. สถิติที่ฉันต้องการจะต้องปรับให้เหมาะกับโครงการขนาดใหญ่ (เช่นเครื่องมือบนเว็บ) และเครื่องมือที่ใช้โดยโครงการนี้เล่นได้ไม่ดีกับเครื่องมือภายนอกดังนั้นฉันต้องใช้ Python / Ruby / Java (หรืออาจเป็นเรื่องของการปรับใช้แอปพลิเคชันและเป็นไปไม่ได้ที่จะพยายามปรับใช้โปรแกรมเรียกใช้โดยอำเภอใจ)

  3. ฉันจะใช้เครื่องมือพิเศษ แต่สิ่งที่ฉันสามารถเข้าถึงได้ (เช่น R ซึ่งฟรี) ช้าเกินไปหรือไม่สามารถจัดการชุดข้อมูลขนาดใหญ่ / ข้อกำหนดตามเวลาจริงสำหรับโครงการของฉันได้

  4. นายจ้าง / ลูกค้าของฉันยืนยันว่าฉันใช้ภาษา Python / Ruby / Excel / Java ฉันไม่มีทางเลือกและกำลังมองหาวิธีที่เจ็บปวดน้อยที่สุดในการทำตามข้อกำหนดนี้

  5. โดย "สถิติ" ฉันหมายถึงสิ่งที่ง่ายมากเช่นการหาค่าเฉลี่ย / ค่ามัธยฐานความแปรปรวน ฯลฯ ทำไมถึงดึงแพคเกจพิเศษที่สามารถคำนวณแบบจำลองเอฟเฟกต์แบบผสมผ่าน MCMC เมื่อสิ่งที่ฉันต้องการจะทำคือการคำนวณว่า ห่างจากค่าเฉลี่ยหรือไม่

  6. ฉันกำลังทำบางสิ่งที่เชี่ยวชาญเป็นพิเศษและแม้แต่แพ็คเกจทางสถิติอย่าง R ก็ไม่มีแพ็คเกจ / ไลบรารี / ฟังก์ชั่น มันไม่เพียง แต่ล้ำสมัย แต่ต้องการประสิทธิภาพที่สูงเป็นพิเศษและฉันต้องทำตั้งแต่เริ่มต้น (หรืออาจใช้ห้องสมุดที่ฉันพัฒนาแล้วในภาษา X)

ในความเห็นของฉันการตอบกลับ 1 ไม่ใช่คำตอบที่ดีตอบ 2 อาจถูกต้อง แต่อาจมีวิธีแก้ปัญหาที่คุณไม่ได้รับการตอบกลับ 3 มีแนวโน้มที่จะถูกกฎหมาย แต่อาจมีวิธีแก้ไขและอีกสามคำตอบ หวังว่าคุณจะได้คำตอบที่ดีกว่าของฉัน


เป้าหมายในคำถามนี้ไม่ใช่เพื่อเรียนรู้สถิติพร้อมกับทับทิมโปรดดูการแก้ไข แต่ขอบคุณสำหรับความคิดของคุณและขออภัยหากคำถามนี้ทำให้เข้าใจผิดฉันหวังว่าจะชัดเจนในการแก้ไข
Oeufcoque Penteano

ขอขอบคุณคุณได้รับมันขวา ข้อสันนิษฐานเกี่ยวกับความรู้ทางสถิตินั้นใช้ได้และตอนนี้ฉันกำลังมองหาห้องสมุดเพื่อเรียนรู้วิธีการทำเช่นนั้นใน Ruby เช่นแนะนำให้ใช้กับ Python ฉันเห็นด้วยกับคุณแรงจูงใจหลายอย่างเป็นไปได้ แต่อีกครั้ง (เพียงเพื่อผู้อ่านรายต่อไปที่เข้ามาในหน้านี้) คำตอบที่คาดหวังคือคำตอบที่แนะนำห้องสมุดและเช่นที่ถูกกล่าวถึงในคำถาม Python ฉันเชื่อว่าหากมีที่ว่างสำหรับความคิดเห็นที่แตกต่างมากมายเกี่ยวกับเครื่องมือสถิติที่จะใช้นอกจากนี้ยังมีการให้ความรู้เกี่ยวกับพวกเขาในชุมชนนี้ ขอบคุณ!
Oeufcoque Penteano

+1 ส่วนใหญ่แล้วเรากำลังพูดถึงคำที่แตกต่างกันที่สะกดว่า "สถิติ" สถิติการใช้งานเว็บไซต์ที่สามารถดึงออกมาจากบันทึกได้อย่างง่ายดายโดยใช้ Python หรือ Ruby เป็นสัตว์ที่แตกต่างจากที่บอกว่าต้องเขียนโปรแกรมโมเดล Cox หรือความแปรปรวนของตัวประมาณอัตราส่วนทั้งหมดตามการสำรวจแบ่งชั้นสองระดับโดยใช้ Ruby (หนึ่งจะต้องหมดหวังอย่างแน่นอนตามคำตอบของคุณ 2, 3 และ 4 ที่จะคิดเกี่ยวกับทับทิมเป็นภาษาที่เลือก) หนึ่งสามารถเสริมสถิติการเรียนรู้ของพวกเขาด้วยการจำลองในภาษาใดก็ตามที่สะดวกที่สุดแล้ว 1 เป็นคำตอบที่ถูกต้อง
StasK

@OeufcoquePenteano: ในที่สุดฉันคิดว่าปัญหาของฉันเดือดลงไปที่ "workbench" คำตอบที่ชนะในชุด Python นั้นเป็นสปาร์ตันที่ค่อนข้างสวย ทรัพยากรที่รวมอยู่ในรายการทั้งหมดไม่ได้จับคู่กับฐาน R โดยไม่คำนึงถึงแพ็คเกจ R มากนัก ถ้าคุณต้องทำสถิติบางอย่างใน Python คุณมีตัวเลือกที่ จำกัด ไม่กี่ตัว แต่ก็ไม่ควรสับสนและคิดว่า Python สร้าง "workbench" เชิงสถิติที่ดี ฉันหวังว่าคุณจะได้รับคำตอบ แต่ Ruby ก็ยิ่งแย่ไปกว่า Python
เวย์น

@ เวย์นั่นเป็นเรื่องปกติ ฉันไม่ได้วางแผนที่จะแลกเปลี่ยน R สำหรับ Ruby, Python หรือ Excel แต่ฉันอยากรู้ว่าทับทิมมีอะไรให้ บางทีพลอยจากทับทิมบางตัวอาจจะดีกว่าไข่บางอัน (นั่นคือไข่ที่พวกมันเรียกว่า Python ใช่ไหม) และในทางกลับกัน บางที Excel อาจดีกว่าสำหรับบางสิ่ง ยกตัวอย่างเช่นฉันคิดว่า Excel สามารถช่วยในการวิเคราะห์ผิวเผินบางอย่างแล้วดำดิ่งลงไปใน R หรือเครื่องมืออื่น ๆ ดังนั้นจึงไม่ใช่เรื่องของ 'การเลือก' แต่รู้ว่าอะไรดีที่สุดในแต่ละโลกและรู้จักพวกเขาเลือกอันที่เหมาะสมกว่าสำหรับปัญหาที่ระบุ ขอบคุณสำหรับคำแนะนำ.
Oeufcoque Penteano

-1

ความคิดสุ่มเล็กน้อย:

  • คุณพูดถึงว่าคุณกำลังมองหา workbench เพื่อเรียนรู้สถิติ IMHO ไม่มีแพลตฟอร์มใดที่คุณกล่าวถึงจะดีสำหรับการเรียนรู้สถิติ จะมีสิ่งที่ทำให้ไขว้เขวมากเกินไปเรียนรู้ไวยากรณ์และความหมายของภาษาเฉพาะ หากคุณต้องการเรียนรู้สถิติเพียงหยิบหนังสือขึ้นมา (ฉันขอแนะนำ EJ ของ Tukey) และอาจเป็นเครื่องคิดเลข การเรียนรู้ภาษาด้านบนของแนวคิดทางสถิติเป็นสิ่งที่ทำให้ไขว้เขวไม่จำเป็นอย่างมาก
  • คนที่บ่นเกี่ยวกับลูปช้าใน R คือการทรยศต่อความไม่รู้ของเขา: ลูปไม่ใช่สิ่งก่อสร้างตามธรรมชาติในทุกภาษา พวกมันช้าในภาษาการเขียนโปรแกรมที่ใช้งานได้ดีที่สุด ทางเลือกคือแอปพลิเคชั่นฟังก์ชั่นซึ่งมักจะรวดเร็ว
  • เมื่อพูดถึงภาษาการเขียนโปรแกรมความเร็วควรเป็นข้อกังวลสุดท้ายของคุณ ปัญหาที่สำคัญกว่านั้นคือความสะดวกในการดีบักรหัส
  • เมื่อพูดถึงการดีบัก R อาจเป็นภาษาโปรแกรมที่แย่ที่สุดที่ฉันรู้จัก บางครั้งไม่สามารถดีบักรหัสได้ ยิ่งไปกว่านั้นเอกสารสำหรับแพ็คเกจที่มีอยู่มักจะเขียนไม่ดีมาก โดยรวมแล้วคำแนะนำของฉันคือถ้าคุณสามารถหลีกเลี่ยง R ทำมันได้
  • ฉันคุ้นเคยกับเนื้อหาทางสถิติของ Python เพียงเล็กน้อยเท่านั้น ความเข้าใจของฉันคือ NumPy ไม่ได้เขียนอย่างมืออาชีพและไม่นำประเด็นที่เป็นตัวเลขมาพิจารณา
  • คุณคิดว่า Haskell หรือไม่? เป็นภาษาการเขียนโปรแกรมที่ดีที่สุดแน่นอน

สวัสดี! ขอบคุณสำหรับความคิดเห็นของคุณ ฉันยินดีที่จะเห็นความคิดเห็นที่แตกต่างกับอาร์ฉันจะพิจารณาสิ่งที่คุณพูดด้วยเช่นกันเนื่องจากฉันกำลังมองหาเครื่องมืออื่น ๆ ที่ไม่ได้กล่าวถึงที่นี่ บางทีคำถามของฉันอาจทำให้เข้าใจผิด ฉันยังคงเรียนรู้สถิติและในความเป็นจริงคำถามของฉันเกี่ยวกับ R คือเกี่ยวกับเรื่องนี้ แต่สำหรับ Ruby มันเป็นสิ่งที่แตกต่างกัน ฉันอยากรู้ว่าทับทิมมีอะไรบ้างที่สามารถปรับแต่งได้เช่น python และ excel ฉันจะพิจารณาดู Haskell ด้วยเช่นกัน แต่ถ้าคุณมีข้อเสนอแนะเกี่ยวกับ Ruby ขอขอบคุณ!
Oeufcoque Penteano

Haskell สำหรับสถิติ? พูดคุยเกี่ยวกับสิ่งที่ทำให้ไขว้เขวที่ไม่จำเป็น ...
Phillip Cloud

-1, ไม่สามารถดีบักโค้ดใน r?
mpiktas

ฉันควรทราบว่าเฉพาะย่อหน้าเกี่ยวกับการดีบักใน R ไม่ถูกต้องในคำตอบนี้ ทุกอย่างดูเหมือนว่าสมควรได้รับการโหวต ยกเว้น Haskell ซึ่งฉันไม่มีประสบการณ์ แต่ข้อสังเกตเกี่ยวกับการแก้ไขจุดบกพร่องนั้นเป็นจุด
mpiktas

1
@cpcloud: ภาษาคณิตศาสตร์และสถิติเป็นแลมบ์ดา - แคลคูลัส Haskell ไม่มีอะไรนอกจากแลมบ์ดาแคลคูลัส โครงสร้างทางคณิตศาสตร์แสดงใน Haskell ในลักษณะเดียวกับที่เขียนในหนังสือคณิตศาสตร์ ด้วยเหตุนี้ค่าใช้จ่ายจากภาษาเกือบเป็นศูนย์ ในความเป็นจริงหนังสือ "Haskell Road to Logic" สอนคณิตศาสตร์โดยใช้ Haskell ฉันแนะนำให้คุณดูหนังสือเล่มนั้น
user765195
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.