คำถามติดแท็ก career

8
ทำไม บริษัท อินเทอร์เน็ตถึงชอบ Java / Python สำหรับนักวิทยาศาสตร์ข้อมูล?
ฉันเห็นรายละเอียดงานหลายครั้งสำหรับนักวิทยาศาสตร์ข้อมูลที่ขอประสบการณ์ Python / Java และไม่สนใจอาร์ด้านล่างเป็นอีเมลส่วนตัวที่ฉันได้รับจากหัวหน้านักวิทยาศาสตร์ข้อมูลของ บริษัท ที่ฉันสมัครผ่าน LinkedIn X ขอขอบคุณที่เชื่อมต่อและแสดงความสนใจ คุณมีทักษะการวิเคราะห์ที่ดี อย่างไรก็ตามนักวิทยาศาสตร์ด้านข้อมูลของเราทุกคนต้องมีทักษะการเขียนโปรแกรมที่ดีใน Java / Python เนื่องจากเราเป็นองค์กรอินเทอร์เน็ต / มือถือและทุกอย่างที่เราทำออนไลน์อยู่ ในขณะที่ฉันเคารพการตัดสินใจของหัวหน้านักวิทยาศาสตร์ด้านข้อมูล แต่ฉันไม่สามารถเข้าใจได้อย่างชัดเจนว่าอะไรคืองานที่ Python สามารถทำสิ่งที่ R ไม่สามารถทำได้ ใครบ้างที่สามารถใส่ใจในรายละเอียด? จริง ๆ แล้วฉันกระตือรือร้นที่จะเรียนรู้ Python / Java หากฉันได้รับรายละเอียดเพิ่มเติม แก้ไข: ฉันพบการสนทนาที่น่าสนใจเกี่ยวกับ Quora ทำไม Python เป็นภาษาที่ถูกเลือกสำหรับนักวิทยาศาสตร์ด้านข้อมูล? แก้ไข 2: บล็อกจาก Udacity เกี่ยวกับภาษาและไลบรารีสำหรับการเรียนรู้ของเครื่อง

11
นักวิทยาศาสตร์ข้อมูลใช้ Excel หรือไม่
ฉันจะคิดว่าตัวเองเป็นนักวิทยาศาสตร์ข้อมูลมืออาชีพ เช่นเดียวกับคนส่วนใหญ่ (ฉันคิดว่า) ฉันทำแผนภูมิแรกของฉันและทำการรวมครั้งแรกของฉันในโรงเรียนมัธยมและวิทยาลัยโดยใช้ Excel ขณะที่ฉันเรียนวิทยาลัยจบการศึกษาและมีประสบการณ์การทำงานประมาณ 7 ปีฉันเลือกสิ่งที่ฉันคิดว่าเป็นเครื่องมือขั้นสูงเช่น SQL, R, Python, Hadoop, LaTeX เป็นต้น เรากำลังสัมภาษณ์ตำแหน่งนักวิทยาศาสตร์ด้านข้อมูลและผู้สมัครคนหนึ่งประกาศตัวเองว่าเป็น "นักวิทยาศาสตร์ด้านข้อมูลอาวุโส" (คำศัพท์ที่ค่อนข้างยุ่งเหยิงในสมัยนี้) ที่มีประสบการณ์มากกว่า 15 ปี เมื่อถูกถามว่าชุดเครื่องมือที่เขาต้องการคืออะไรเขาตอบว่านั่นคือ Excel ฉันใช้สิ่งนี้เป็นหลักฐานว่าเขาไม่ได้มีประสบการณ์มากเท่ากับประวัติย่อของเขาที่จะเรียกร้อง แต่ไม่แน่ใจ ท้ายที่สุดเพียงเพราะมันไม่ใช่เครื่องมือที่ฉันชอบไม่ได้หมายความว่าไม่ใช่คนอื่น นักวิทยาศาสตร์ข้อมูลที่มีประสบการณ์ใช้ Excel หรือไม่ คุณสามารถสมมติว่าขาดประสบการณ์จากคนที่ใช้ Excel เป็นหลักหรือไม่?
37 tools  career  excel 

1
ทำไม xgboost จึงเร็วกว่า GradientBoostingClassifier ของ sklearn มาก?
ฉันพยายามที่จะฝึกอบรมการยกระดับความลาดชันของตัวอย่างมากกว่า 50k ด้วยคุณสมบัติตัวเลข 100 ตัว XGBClassifierจัดการ 500 ต้นภายใน 43 วินาทีบนเครื่องของฉันในขณะที่GradientBoostingClassifierจัดการเพียง 10 ต้น (!) ใน 1 นาทีและ 2 วินาที :( ฉันไม่ได้พยายามที่จะเติบโต 500 ต้นเพราะจะใช้เวลาหลายชั่วโมงฉันใช้แบบเดียวกันlearning_rateและmax_depthการตั้งค่า ดูด้านล่าง อะไรทำให้ XGBoost เร็วขึ้นมาก? มันใช้การปรับแต่งแบบใหม่เพื่อส่งเสริมการไล่ระดับสีที่พวก sklearn ไม่รู้หรือไม่? หรือว่า "ตัดมุม" และปลูกต้นไม้ที่ตื้นขึ้น? ป.ล. ฉันตระหนักถึงการสนทนานี้: https://www.kaggle.com/c/higgs-boson/forums/t/10335/xgboost-post-competition-surveyแต่ไม่สามารถหาคำตอบได้ที่นั่น ... XGBClassifier(base_score=0.5, colsample_bylevel=1, colsample_bytree=1, gamma=0, learning_rate=0.05, max_delta_step=0, max_depth=10, min_child_weight=1, missing=None, n_estimators=500, nthread=-1, objective='binary:logistic', reg_alpha=0, reg_lambda=1, …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

3
เริ่มต้นอาชีพการเป็นนักวิทยาศาสตร์ข้อมูลต้องมีประสบการณ์ด้านวิศวกรรมซอฟต์แวร์หรือไม่? [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Data Science Stack Exchange ปิดให้บริการใน5 ปีที่ผ่านมา ฉันเป็นนักเรียนปริญญาโทที่มหาวิทยาลัยเอดินบะระมีความเชี่ยวชาญในการเรียนรู้เครื่องและการประมวลผลภาษาธรรมชาติ ฉันมีหลักสูตรภาคปฏิบัติที่เน้นการขุดข้อมูลและอื่น ๆ ที่เกี่ยวข้องกับการเรียนรู้ของเครื่องสถิติแบบเบย์และโมเดลกราฟิก พื้นหลังของฉันคือ BSc ในสาขาวิทยาศาสตร์คอมพิวเตอร์ ฉันทำวิศวกรรมซอฟต์แวร์บ้างและเรียนรู้แนวคิดพื้นฐานเช่นรูปแบบการออกแบบ แต่ฉันไม่เคยเกี่ยวข้องกับโครงการพัฒนาซอฟต์แวร์ขนาดใหญ่ อย่างไรก็ตามฉันมีโครงการขุดข้อมูลในปริญญาโทวิทยาศาสตร์ คำถามของฉันคือถ้าฉันต้องการมีอาชีพเป็นนักวิทยาศาสตร์ด้านข้อมูลฉันควรสมัครตำแหน่งนักวิทยาศาสตร์ข้อมูลระดับบัณฑิตศึกษาก่อนหรือฉันควรจะได้ตำแหน่งวิศวกรซอฟต์แวร์ระดับบัณฑิตศึกษาก่อนอาจเป็นบางสิ่งที่เกี่ยวข้องกับวิทยาศาสตร์ข้อมูลเช่นข้อมูลขนาดใหญ่ โครงสร้างพื้นฐานหรือการพัฒนาซอฟต์แวร์เรียนรู้เครื่อง? ความกังวลของฉันคือฉันอาจต้องมีทักษะวิศวกรรมซอฟต์แวร์ที่ดีสำหรับวิทยาศาสตร์ข้อมูลและฉันไม่แน่ใจว่าสิ่งเหล่านี้สามารถได้รับจากการทำงานในฐานะนักวิทยาศาสตร์ข้อมูลระดับบัณฑิตศึกษาโดยตรงหรือไม่ ยิ่งไปกว่านั้นในตอนนี้ฉันชอบ Data Mining แต่ถ้าฉันต้องการเปลี่ยนอาชีพเป็นวิศวกรรมซอฟต์แวร์ในอนาคต มันอาจเป็นเรื่องยากถ้าฉันมีความเชี่ยวชาญในศาสตร์ข้อมูลมาก ฉันยังไม่ได้รับการว่าจ้างดังนั้นความรู้ของฉันจึงยัง จำกัด ยินดีต้อนรับสู่การชี้แจงหรือคำแนะนำใด ๆ เนื่องจากฉันกำลังจะสำเร็จการศึกษาระดับปริญญาโทและต้องการเริ่มสมัครเข้าเรียนระดับบัณฑิตในช่วงต้นเดือนตุลาคม

2
วิทยาศาสตร์ข้อมูลที่ไม่มีความรู้ในหัวข้อที่เฉพาะเจาะจงมันคุ้มค่าที่จะใฝ่หาอาชีพหรือไม่? [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัพเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Data Science Stack Exchange ปิดให้บริการใน5 ปีที่ผ่านมา ฉันได้สนทนากับบางคนเมื่อเร็ว ๆ นี้และพูดถึงความสนใจในการวิเคราะห์ข้อมูลและฉันตั้งใจจะเรียนรู้ทักษะและเครื่องมือที่จำเป็น พวกเขาแนะนำให้ฉันรู้ว่าในขณะที่มันยอดเยี่ยมในการเรียนรู้เครื่องมือและสร้างทักษะมีจุดเล็ก ๆ น้อย ๆ ในการทำเช่นนั้นเว้นแต่ว่าฉันมีความรู้เฉพาะด้านในสาขาเฉพาะ โดยพื้นฐานแล้วพวกเขาสรุปว่าฉันเป็นเหมือนช่างก่อสร้างที่มีเครื่องมือมากมายที่สามารถสร้างกล่องไม้สองสามกล่องและอาจสร้างสิ่งที่ดีกว่า (ห้องโดยสารตู้เก็บของ ฯลฯ ) แต่ไม่มีความรู้ในสาขาเฉพาะที่ฉันไม่เคยทำ เป็นคนสร้างจะมาสำหรับผลิตภัณฑ์เฉพาะ มีใครพบสิ่งนี้หรือมีข้อมูลใด ๆ เกี่ยวกับสิ่งนี้ มันจะดูเหมือนว่ามันเป็นเรื่องจริงที่จะต้องเรียนรู้ด้านวิทยาศาสตร์ข้อมูลของสิ่งต่าง ๆ แล้วเรียนรู้สาขาใหม่เพียงเพื่อจะกลายเป็นผู้เชี่ยวชาญ

7
ฉันเป็นโปรแกรมเมอร์ฉันจะเข้าสู่สาขาวิทยาศาสตร์ข้อมูลได้อย่างไร
ก่อนอื่นคำนี้ฟังดูคลุมเครือมาก อย่างไรก็ตาม .. ฉันเป็นโปรแกรมเมอร์ซอฟต์แวร์ หนึ่งในภาษาที่ฉันสามารถใช้รหัสคือ Python การพูดของข้อมูลฉันสามารถใช้ SQL และสามารถทำ Data Scraping ได้ สิ่งที่ฉันรู้หลังจากอ่านบทความมากมายที่วิทยาศาสตร์ข้อมูลเป็นเรื่องที่ดีที่: 1- สถิติ 2- พีชคณิต 3- การวิเคราะห์ข้อมูล 4- การสร้างภาพ 5- การเรียนรู้ของเครื่อง สิ่งที่ฉันรู้จนถึงตอนนี้: 1- การเขียนโปรแกรม Python 2- การทิ้งข้อมูลใน Python ผู้เชี่ยวชาญช่วยแนะนำฉันหรือแนะนำแผนงานเพื่อปัดกวาดทั้งทฤษฎีและการปฏิบัติได้หรือไม่? ฉันให้เวลากับตัวเองประมาณ 8 เดือน
13 beginner  career 

3
สถิติ + วิทยาการคอมพิวเตอร์ = วิทยาศาสตร์ข้อมูล? [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัพเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Data Science Stack Exchange ปิดให้บริการใน5 ปีที่ผ่านมา ฉันต้องการที่จะกลายเป็นนักวิทยาศาสตร์ข้อมูล ฉันศึกษาสถิติประยุกต์(วิทยาศาสตร์คณิตศาสตร์ประกันภัย) ดังนั้นฉันจึงมีภูมิหลังทางสถิติที่ยอดเยี่ยม (การถดถอยกระบวนการสโตแคสติกอนุกรมเวลาการพูดถึงเพียงไม่กี่อย่าง) แต่ตอนนี้ฉันกำลังจะเรียนปริญญาโทด้านวิทยาการคอมพิวเตอร์ในระบบอัจฉริยะ นี่คือแผนการศึกษาของฉัน: การเรียนรู้ของเครื่อง การเรียนรู้ของเครื่องจักรขั้นสูง การขุดข้อมูล ตรรกะคลุมเครือ ระบบการแนะนำ ระบบข้อมูลแบบกระจาย Cloud Computing การค้นพบความรู้ ระบบธุรกิจอัจฉริยะ การดึงข้อมูล การขุดข้อความ ในตอนท้ายด้วยความรู้ทางสถิติและวิทยาศาสตร์คอมพิวเตอร์ทั้งหมดของฉันฉันสามารถเรียกตัวเองว่าเป็นนักวิทยาศาสตร์ด้านข้อมูลได้หรือไม่? หรือฉันผิด ขอบคุณสำหรับคำตอบ

7
อาชีพเปลี่ยนเป็น Big Data Analytics
ฉันเป็นผู้เชี่ยวชาญด้านไอทีอายุ 35 ปีซึ่งเป็นผู้เชี่ยวชาญด้านเทคนิคอย่างแท้จริง ฉันเก่งด้านการเขียนโปรแกรมเรียนรู้เทคโนโลยีใหม่ ๆ ทำความเข้าใจและนำไปปฏิบัติ ฉันไม่ชอบคณิตศาสตร์ที่โรงเรียนดังนั้นฉันจึงทำคะแนนได้ไม่ดีในวิชาคณิตศาสตร์ ฉันสนใจเป็นอย่างมากในการใฝ่หาอาชีพในการวิเคราะห์ข้อมูลขนาดใหญ่ ฉันสนใจ Analytics มากกว่าเทคโนโลยี Big Data (Hadoop ฯลฯ ) แม้ว่าฉันจะไม่ชอบก็ตาม อย่างไรก็ตามเมื่อฉันมองไปรอบ ๆ อินเทอร์เน็ตฉันเห็นว่าคนที่เก่งในการวิเคราะห์ (นักวิทยาศาสตร์ด้านข้อมูล) ส่วนใหญ่เป็นผู้สำเร็จการศึกษาด้านคณิตศาสตร์ที่ได้ทำปริญญาเอกและเสียงของพวกเขาเช่นสัตว์ฉลาดที่อยู่ไกลจากฉัน บางครั้งฉันก็กลัวที่จะคิดว่าการตัดสินใจของฉันถูกต้องหรือไม่เพราะการเรียนรู้สถิติล่วงหน้าด้วยตัวคุณเองนั้นยากมากและต้องใช้เวลาและการลงทุนอย่างหนัก ฉันต้องการทราบว่าการตัดสินใจของฉันถูกต้องหรือไม่หรือฉันควรปล่อยงานชิ้นนี้ให้กับผู้มีปัญญาเท่านั้นที่ใช้ชีวิตในการศึกษาในวิทยาลัยที่มีชื่อเสียงและได้รับปริญญาและปริญญาเอก
9 career 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.