คำถามติดแท็ก education

13
คุณคิดอย่างไรกับการรับรองวิทยาศาสตร์ข้อมูล
ผมเคยเห็นตอนนี้สองวิทยาศาสตร์ข้อมูลโปรแกรมการรับรอง - เดอะจอห์นฮอปกินส์หนึ่งที่มีอยู่ใน CourseraและCloudera หนึ่ง ฉันแน่ใจว่ามีคนอื่นออกมี ชุดชั้นเรียนของ John Hopkins เน้นที่ R เป็นชุดเครื่องมือ แต่ครอบคลุมหัวข้อต่างๆดังนี้: การเขียนโปรแกรม R การทำความสะอาดและการรับข้อมูล การวิเคราะห์ข้อมูล การวิจัยซ้ำ อนุมานทางสถิติ แบบจำลองการถดถอย การเรียนรู้ของเครื่อง การพัฒนาผลิตภัณฑ์ข้อมูล และสิ่งที่ดูเหมือนว่าจะเป็นงานที่เสร็จสิ้นตามโครงการคล้ายกับการท้าทายวิทยาศาสตร์ข้อมูลของ Cloudera โปรแกรม Cloudera มีลักษณะบางบนพื้นผิว แต่ดูเหมือนจะตอบคำถามสำคัญสองข้อ - "คุณรู้จักเครื่องมือ", "คุณสามารถใช้เครื่องมือในโลกแห่งความเป็นจริงได้ไหม" โปรแกรมของพวกเขาประกอบด้วย: วิทยาศาสตร์ข้อมูลเบื้องต้น การสอบข้อมูลวิทยาศาสตร์ที่จำเป็น Data Science Challenge (สถานการณ์จำลองโครงงานวิทยาศาสตร์ข้อมูลจริง) ฉันไม่ได้มองหาคำแนะนำในโปรแกรมหรือการเปรียบเทียบคุณภาพ ฉันอยากรู้เกี่ยวกับการรับรองอื่น ๆ ที่นั่นหัวข้อที่พวกเขาครอบคลุมและความน่าเชื่อถือของชุมชนที่ได้รับการรับรอง DS แก้ไข: นี่คือคำตอบที่ดีทั้งหมด ฉันเลือกคำตอบที่ถูกต้องด้วยคะแนนโหวต
35 education 

3
เริ่มต้นอาชีพการเป็นนักวิทยาศาสตร์ข้อมูลต้องมีประสบการณ์ด้านวิศวกรรมซอฟต์แวร์หรือไม่? [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Data Science Stack Exchange ปิดให้บริการใน5 ปีที่ผ่านมา ฉันเป็นนักเรียนปริญญาโทที่มหาวิทยาลัยเอดินบะระมีความเชี่ยวชาญในการเรียนรู้เครื่องและการประมวลผลภาษาธรรมชาติ ฉันมีหลักสูตรภาคปฏิบัติที่เน้นการขุดข้อมูลและอื่น ๆ ที่เกี่ยวข้องกับการเรียนรู้ของเครื่องสถิติแบบเบย์และโมเดลกราฟิก พื้นหลังของฉันคือ BSc ในสาขาวิทยาศาสตร์คอมพิวเตอร์ ฉันทำวิศวกรรมซอฟต์แวร์บ้างและเรียนรู้แนวคิดพื้นฐานเช่นรูปแบบการออกแบบ แต่ฉันไม่เคยเกี่ยวข้องกับโครงการพัฒนาซอฟต์แวร์ขนาดใหญ่ อย่างไรก็ตามฉันมีโครงการขุดข้อมูลในปริญญาโทวิทยาศาสตร์ คำถามของฉันคือถ้าฉันต้องการมีอาชีพเป็นนักวิทยาศาสตร์ด้านข้อมูลฉันควรสมัครตำแหน่งนักวิทยาศาสตร์ข้อมูลระดับบัณฑิตศึกษาก่อนหรือฉันควรจะได้ตำแหน่งวิศวกรซอฟต์แวร์ระดับบัณฑิตศึกษาก่อนอาจเป็นบางสิ่งที่เกี่ยวข้องกับวิทยาศาสตร์ข้อมูลเช่นข้อมูลขนาดใหญ่ โครงสร้างพื้นฐานหรือการพัฒนาซอฟต์แวร์เรียนรู้เครื่อง? ความกังวลของฉันคือฉันอาจต้องมีทักษะวิศวกรรมซอฟต์แวร์ที่ดีสำหรับวิทยาศาสตร์ข้อมูลและฉันไม่แน่ใจว่าสิ่งเหล่านี้สามารถได้รับจากการทำงานในฐานะนักวิทยาศาสตร์ข้อมูลระดับบัณฑิตศึกษาโดยตรงหรือไม่ ยิ่งไปกว่านั้นในตอนนี้ฉันชอบ Data Mining แต่ถ้าฉันต้องการเปลี่ยนอาชีพเป็นวิศวกรรมซอฟต์แวร์ในอนาคต มันอาจเป็นเรื่องยากถ้าฉันมีความเชี่ยวชาญในศาสตร์ข้อมูลมาก ฉันยังไม่ได้รับการว่าจ้างดังนั้นความรู้ของฉันจึงยัง จำกัด ยินดีต้อนรับสู่การชี้แจงหรือคำแนะนำใด ๆ เนื่องจากฉันกำลังจะสำเร็จการศึกษาระดับปริญญาโทและต้องการเริ่มสมัครเข้าเรียนระดับบัณฑิตในช่วงต้นเดือนตุลาคม

2
วิทยาศาสตร์ข้อมูลที่ไม่มีความรู้ในหัวข้อที่เฉพาะเจาะจงมันคุ้มค่าที่จะใฝ่หาอาชีพหรือไม่? [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัพเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Data Science Stack Exchange ปิดให้บริการใน5 ปีที่ผ่านมา ฉันได้สนทนากับบางคนเมื่อเร็ว ๆ นี้และพูดถึงความสนใจในการวิเคราะห์ข้อมูลและฉันตั้งใจจะเรียนรู้ทักษะและเครื่องมือที่จำเป็น พวกเขาแนะนำให้ฉันรู้ว่าในขณะที่มันยอดเยี่ยมในการเรียนรู้เครื่องมือและสร้างทักษะมีจุดเล็ก ๆ น้อย ๆ ในการทำเช่นนั้นเว้นแต่ว่าฉันมีความรู้เฉพาะด้านในสาขาเฉพาะ โดยพื้นฐานแล้วพวกเขาสรุปว่าฉันเป็นเหมือนช่างก่อสร้างที่มีเครื่องมือมากมายที่สามารถสร้างกล่องไม้สองสามกล่องและอาจสร้างสิ่งที่ดีกว่า (ห้องโดยสารตู้เก็บของ ฯลฯ ) แต่ไม่มีความรู้ในสาขาเฉพาะที่ฉันไม่เคยทำ เป็นคนสร้างจะมาสำหรับผลิตภัณฑ์เฉพาะ มีใครพบสิ่งนี้หรือมีข้อมูลใด ๆ เกี่ยวกับสิ่งนี้ มันจะดูเหมือนว่ามันเป็นเรื่องจริงที่จะต้องเรียนรู้ด้านวิทยาศาสตร์ข้อมูลของสิ่งต่าง ๆ แล้วเรียนรู้สาขาใหม่เพียงเพื่อจะกลายเป็นผู้เชี่ยวชาญ

3
ชุดข้อมูล / คำถามวิจัยทางวิทยาศาสตร์ข้อมูลสำหรับวิทยานิพนธ์ปริญญาโทวิทยาศาสตร์สาขาสถิติ
ฉันต้องการสำรวจ 'วิทยาศาสตร์ข้อมูล' คำดูเหมือนคลุมเครือเล็กน้อยสำหรับฉัน แต่ฉันคาดหวังว่าจะต้อง: การเรียนรู้ของเครื่อง (มากกว่าสถิติดั้งเดิม); ชุดข้อมูลขนาดใหญ่เพียงพอที่คุณต้องเรียกใช้การวิเคราะห์บนคลัสเตอร์ มีชุดข้อมูลและปัญหาอะไรบ้างที่สามารถเข้าถึงได้โดยนักสถิติที่มีพื้นฐานการเขียนโปรแกรมที่ฉันสามารถใช้เพื่อสำรวจสาขาวิทยาศาสตร์ข้อมูลได้ เพื่อให้แคบที่สุดเท่าที่จะทำได้ฉันต้องการเชื่อมโยงไปยังชุดข้อมูลเปิดและชุดข้อมูลที่ใช้งานได้ดีและปัญหาตัวอย่าง

3
ภาษาที่ดีที่สุดสำหรับการคำนวณทางวิทยาศาสตร์ [ปิด]
ปิด คำถามนี้จะต้องมีมากขึ้นมุ่งเน้น ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้มุ่งเน้นที่ปัญหาเดียวโดยแก้ไขโพสต์นี้ ปิดให้บริการใน5 ปีที่ผ่านมา ดูเหมือนว่าภาษาส่วนใหญ่จะมีห้องสมุดคำนวณทางวิทยาศาสตร์จำนวนหนึ่ง Python มี Scipy Rust มี SciRust C++มีหลายอย่างรวมถึงViennaCLและArmadillo JavaมีJava NumericsและColtเช่นเดียวกับหลาย ๆ ไม่ต้องพูดถึงภาษาที่ชอบRและJuliaออกแบบมาอย่างชัดเจนสำหรับการคำนวณทางวิทยาศาสตร์ ด้วยตัวเลือกมากมายคุณจะเลือกภาษาที่ดีที่สุดสำหรับงานอย่างไร นอกจากนี้ภาษาใดที่จะเป็นคนที่มีประสิทธิภาพมากที่สุด? PythonและRดูเหมือนว่าจะมีแรงฉุดที่สุดในอวกาศ แต่ภาษาที่รวบรวมได้ดูเหมือนจะเป็นทางเลือกที่ดีกว่า และจะมีอะไรดีกว่านี้Fortranไหม ภาษาที่คอมไพล์ด้วยนอกจากนี้มักจะมีการเร่งความเร็วของ GPU ในขณะที่ตีความภาษาเช่นRและPythonไม่ ฉันควรคำนึงถึงอะไรเมื่อเลือกภาษาและภาษาใดให้ความสมดุลของยูทิลิตี้และประสิทธิภาพที่ดีที่สุด มีภาษาใดบ้างที่มีทรัพยากรการคำนวณทางวิทยาศาสตร์ที่สำคัญที่ฉันพลาดไป
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

5
คุณสมบัติสำหรับหลักสูตรปริญญาเอก
Yann LeCun กล่าวในAMAของเขาว่าเขาคิดว่าปริญญาเอกมีความสำคัญมากเพื่อที่จะได้งานที่ บริษัท ชั้นนำ ฉันมีผู้เชี่ยวชาญด้านสถิติและปริญญาตรีของฉันอยู่ในสาขาเศรษฐศาสตร์และคณิตศาสตร์ประยุกต์ แต่ตอนนี้ฉันกำลังมองหาหลักสูตรปริญญาเอกของ ML โปรแกรมส่วนใหญ่บอกว่าไม่มีหลักสูตร CS ที่จำเป็นอย่างยิ่ง แต่ฉันมักจะคิดว่านักเรียนที่ได้รับการยอมรับส่วนใหญ่มีพื้นฐานด้าน CS ที่แข็งแกร่งอย่างน้อย ขณะนี้ฉันทำงานเป็นนักวิทยาศาสตร์ข้อมูล / สถิติ แต่ บริษัท ของฉันจะจ่ายค่าหลักสูตร ฉันควรเรียนหลักสูตรวิศวกรรมซอฟต์แวร์เบื้องต้นที่มหาวิทยาลัยในพื้นที่ของฉันเพื่อให้ตัวเองแข็งแกร่งขึ้นหรือไม่? คุณมีคำแนะนำอะไรอีกสำหรับคนที่สมัครหลักสูตรปริญญาเอกจากนอกเขต CS แก้ไข: ฉันใช้ MOOC หลายครั้ง (การเรียนรู้ของเครื่อง, ระบบผู้แนะนำ, NLP) และโค้ด R / python เป็นประจำทุกวัน ฉันมีประสบการณ์การเขียนโค้ดจำนวนมากด้วยภาษาเชิงสถิติและใช้อัลกอริทึม ML ทุกวัน ฉันกังวลมากขึ้นกับสิ่งต่าง ๆ ที่ฉันสามารถใส่ในแอปพลิเคชัน
10 education 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.