คุณคิดอย่างไรกับการรับรองวิทยาศาสตร์ข้อมูล


35

ผมเคยเห็นตอนนี้สองวิทยาศาสตร์ข้อมูลโปรแกรมการรับรอง - เดอะจอห์นฮอปกินส์หนึ่งที่มีอยู่ใน CourseraและCloudera หนึ่ง

ฉันแน่ใจว่ามีคนอื่นออกมี

ชุดชั้นเรียนของ John Hopkins เน้นที่ R เป็นชุดเครื่องมือ แต่ครอบคลุมหัวข้อต่างๆดังนี้:

  • การเขียนโปรแกรม R
  • การทำความสะอาดและการรับข้อมูล
  • การวิเคราะห์ข้อมูล
  • การวิจัยซ้ำ
  • อนุมานทางสถิติ
  • แบบจำลองการถดถอย
  • การเรียนรู้ของเครื่อง
  • การพัฒนาผลิตภัณฑ์ข้อมูล
  • และสิ่งที่ดูเหมือนว่าจะเป็นงานที่เสร็จสิ้นตามโครงการคล้ายกับการท้าทายวิทยาศาสตร์ข้อมูลของ Cloudera

โปรแกรม Cloudera มีลักษณะบางบนพื้นผิว แต่ดูเหมือนจะตอบคำถามสำคัญสองข้อ - "คุณรู้จักเครื่องมือ", "คุณสามารถใช้เครื่องมือในโลกแห่งความเป็นจริงได้ไหม" โปรแกรมของพวกเขาประกอบด้วย:

  • วิทยาศาสตร์ข้อมูลเบื้องต้น
  • การสอบข้อมูลวิทยาศาสตร์ที่จำเป็น
  • Data Science Challenge (สถานการณ์จำลองโครงงานวิทยาศาสตร์ข้อมูลจริง)

ฉันไม่ได้มองหาคำแนะนำในโปรแกรมหรือการเปรียบเทียบคุณภาพ

ฉันอยากรู้เกี่ยวกับการรับรองอื่น ๆ ที่นั่นหัวข้อที่พวกเขาครอบคลุมและความน่าเชื่อถือของชุมชนที่ได้รับการรับรอง DS

แก้ไข: นี่คือคำตอบที่ดีทั้งหมด ฉันเลือกคำตอบที่ถูกต้องด้วยคะแนนโหวต


4
นี่กว้างเกินไปและใช้ความเห็นเป็นหลัก โปรดดูที่datascience.stackexchange.com/help/dont-ask
asheeshr

3
@AsheeshR - เราเฉลี่ย 2 คำถามต่อวันและ 2 คำตอบต่อคำถาม ณ จุดนี้จำเป็นต้องมุ่งเน้นไปที่การมีส่วนร่วมและการเพิ่มความสนใจ
Steve Kallestad

10
การมีส่วนร่วมโดยเสียค่าใช้จ่ายของคุณภาพไซต์ไม่ใช่วิธีแก้ปัญหา การมีเพศสัมพันธ์เป็นสิ่งชั่วคราว คุณภาพเปลี่ยนแปลงได้ยากกว่ามาก
asheeshr

4
จักรยาน , สถานที่ทำงาน , การเงินและเงินส่วนตัว , คลางแคลง , การพัฒนาเกมทั้งหมดเปิดตัวโดยมีคำถามน้อยกว่า 10 ข้อต่อวัน จักรยานเปิดตัวพร้อมวันละ 4 คันเพราะถือว่าเป็นจักรยานคุณภาพสูง
asheeshr

3
อืม ... ฉันเดาว่าฉันต้องประกาศให้คุณทราบถึงผู้ชนะในตอนนี้ :)
Steve Kallestad

คำตอบ:


13

ฉันทำ 2 หลักสูตรแรกและฉันวางแผนที่จะทำหลักสูตรอื่นทั้งหมดเช่นกัน หากคุณไม่ทราบว่า R มันเป็นโปรแกรมที่ดีจริงๆ มีการมอบหมายและแบบทดสอบทุกสัปดาห์ หลายคนพบว่าบางหลักสูตรยากมาก คุณกำลังจะมีปัญหาถ้าคุณไม่มีประสบการณ์การเขียนโปรแกรม (แม้ว่าพวกเขาบอกว่ามันไม่จำเป็น)

แค่จำไว้ .. ไม่ใช่เพราะคุณสามารถขับรถยนต์ที่คุณเป็นนักบิน F1 ได้)


32

ในฐานะที่เป็นอดีตผู้จัดการการวิเคราะห์และนักวิทยาศาสตร์ด้านข้อมูลนำในปัจจุบันฉันรู้สึกเบื่อหน่ายกับความต้องการใบรับรองวิทยาศาสตร์ข้อมูล คำว่านักวิทยาศาสตร์ข้อมูลค่อนข้างคลุมเครือและสาขาวิทยาศาสตร์ข้อมูลยังอยู่ในช่วงวัยทารก ใบรับรองบ่งบอกถึงมาตรฐานที่เหมือนกันบางประเภทซึ่งขาดความรู้ด้านข้อมูล แต่ก็ยังคงเป็นทางตะวันตกของธรรมชาติ

ในขณะที่ใบรับรองอาจไม่ทำร้ายคุณฉันคิดว่าเวลาของคุณจะดีกว่าที่จะพัฒนาประสบการณ์ให้รู้ว่าต้องใช้วิธีการใดและความเข้าใจในเชิงลึกเพื่ออธิบายวิธีการดังกล่าวแก่ผู้ชมที่ไม่ใช่ด้านเทคนิค


2
บางครั้งประสบการณ์ก็ยากที่จะได้รับหากงานปัจจุบันของคุณไม่ได้มุ่งเน้นไปที่วิทยาศาสตร์ข้อมูล แต่ในสาขาที่เกี่ยวข้องบางอย่าง (ในกรณีสถิติของฉัน) ฉันใช้หลักสูตรเพื่อรับความรู้และอยู่ในหัวข้อที่ฉันไม่สามารถทำงานในเวลากลางวันได้
คริสเตียนซาวเออร์

1
ฉันเห็นด้วยอย่างเต็มที่หลักสูตรมีค่ามากสำหรับการให้คุณเริ่มต้นและโครงสร้างบางอย่างเพื่อรับประสบการณ์นั้น เพื่อให้ได้ประโยชน์สูงสุดจาก Mooc ฉันขอแนะนำให้ใช้ตัวอย่างที่เฉพาะเจาะจงมาก ๆ ลองพูดว่า logistic regression และทำงานกับชุดข้อมูลที่แตกต่างกันและโบนัสสองเท่าถ้าคุณทำในภาษาอื่นที่ไม่ใช่หลักสูตรที่สอน .
neone4373

นั่นเป็นความคิดที่ดี. สิ่งที่ขาดหายไปสำหรับสถิติโดยทั่วไปคือเว็บไซต์ฝึกอบรม เช่นชุดของฐานข้อมูลพร้อมกับเป้าหมายและผลลัพธ์ที่เป็นไปได้ในตอนท้าย บางอย่างเช่น khancademy แต่มีประสิทธิภาพมากกว่า;)
Christian Sauer

11

โปรแกรมการรับรองที่คุณกล่าวถึงเป็นหลักสูตรระดับต้นจริงๆ โดยส่วนตัวแล้วฉันคิดว่าใบรับรองเหล่านี้แสดงให้เห็นถึงความเพียรของบุคคลเท่านั้นและจะเป็นประโยชน์ต่อผู้ที่สมัครเข้าฝึกงานเท่านั้นไม่ใช่งานด้านวิทยาศาสตร์ข้อมูลจริง


ฉันเห็นด้วย. เนื้อหาหลักสูตรเป็นสิ่งที่ดีสำหรับการเริ่มต้น แต่ส่วนใหญ่จะเป็นระดับเริ่มต้น
Shagun Sodhani

10

ฉันนำทีมข้อมูลวิทยาศาสตร์สำหรับ บริษัท อินเทอร์เน็ตรายใหญ่และฉันได้คัดเลือกโปรไฟล์หลายร้อยรายการและสัมภาษณ์ทีมงานของเราทั่วโลกเป็นโหล ๆ ผู้สมัครจำนวนมากได้ผ่านหลักสูตรและโปรแกรมดังกล่าวข้างต้นหรือนำข้อมูลประจำตัวที่คล้ายกัน โดยส่วนตัวแล้วฉันได้เรียนในหลักสูตรบางวิชาก็เป็นเรื่องดีคนอื่น ๆ ก็น่าผิดหวัง แต่ก็ไม่มีใครทำให้คุณเป็น "นักวิทยาศาสตร์ข้อมูล"

โดยทั่วไปฉันเห็นด้วยกับคนอื่น ๆ ที่นี่ ใบรับรองจาก Coursera หรือ Cloudera เป็นเพียงสัญญาณที่น่าสนใจ แต่มันไม่ย้ายเข็ม มีสิ่งที่ต้องพิจารณาอีกมากมายและคุณสามารถสร้างผลกระทบที่ยิ่งใหญ่กว่าด้วยการให้ที่เก็บข้อมูลที่ครอบคลุมเกี่ยวกับงานของคุณ (เช่นโปรไฟล์ Github) และโดยการสร้างเครือข่ายกับนักวิทยาศาสตร์ด้านข้อมูลอื่น ๆ ใครก็ตามที่จ้างโปรไฟล์วิทยาศาสตร์ข้อมูลมักต้องการดูงานก่อนหน้าของคุณและสไตล์การเขียน / ความสามารถ


8

มีการรับรองหลายอย่างเกิดขึ้น แต่มีพื้นที่โฟกัสที่แตกต่างกันและรูปแบบการสอน

ฉันชอบ The Analytics Edge ใน eDX มากกว่าความเชี่ยวชาญเฉพาะของ John Hopkins เนื่องจากมีความเข้มข้นและตรงตามความต้องการมากขึ้น ความคาดหวังในความเชี่ยวชาญของ John Hopkins คือการใช้เวลา 3 - 4 ชั่วโมงต่อสัปดาห์เทียบกับ 11 - 12 ชั่วโมงต่อสัปดาห์บน Analytics Edge

จากมุมมองของอุตสาหกรรมผมถือว่าการรับรองเหล่านี้เป็นสัญลักษณ์ของความสนใจและไม่ใช่ระดับความรู้ที่บุคคลมี MOOC เหล่านี้มีดร็อปดาวน์มากเกินไป ฉันให้ความสำคัญกับประสบการณ์อื่น ๆ (เช่นมีส่วนร่วมในการแข่งขัน Kaggle) มากกว่าการผ่านการรับรอง XYZ ใน MOOC


2
และสิ่งที่เกี่ยวกับ stats.SE, datascience.SE โปรไฟล์ คุณคิดว่าพวกเขาสามารถพูดมากเกี่ยวกับระดับความรู้ที่เกี่ยวข้อง?
IharS

dropouts เกี่ยวข้องกับอะไรบ้าง? สันนิษฐานว่าการรับรองจะเกิดขึ้นเมื่อจบหลักสูตรไม่เพียง แต่ลงทะเบียน ...
Gala

มีหลายคนที่พูดถึงว่าพวกเขากำลังได้รับการรับรองโดยทำหลักสูตรใน MOOC เหล่านี้ คุณต้องระวังให้ดี
Kunal

@ Kunal มันสมเหตุสมผลแล้ว แต่คำตอบของคุณข้ามไปจาก“ การรับรอง” เป็น“ ดรอปเอาท์” (ซึ่งอาจไม่มีใบรับรอง ) ที่สำคัญนี่คือการดำเนินการ มันเป็นเหมือนการลงทะเบียนเป็นนักเรียนหรือมีบัญชี Kaggle สิ่งเหล่านี้ไม่ได้บอกเราว่าคุณควรให้ความสำคัญกับคนที่ได้รับปริญญาสำเร็จหลักสูตรหรือเข้าร่วมการแข่งขันจนจบ
งานกาล่า

6

ไม่แน่ใจเกี่ยวกับยุคคลาวด์อย่างใดอย่างหนึ่ง แต่หนึ่งในเพื่อนของฉันเข้าร่วมจอห์นฮอปกิ้นส์หนึ่งและในคำพูดของเขามัน "ยอดเยี่ยมที่จะให้คุณเริ่มต้น" มันได้รับการแนะนำโดยผู้คนจำนวนมาก ฉันวางแผนที่จะเข้าร่วมในไม่กี่สัปดาห์ เท่าที่มีความกังวลอย่างจริงจังฉันไม่คิดว่าการรับรองเหล่านี้จะช่วยให้คุณได้งาน แต่พวกเขามั่นใจว่าจะช่วยให้คุณเรียนรู้


4

@OP: การเลือกคำตอบด้วยคะแนนเสียงเป็นความคิดที่แย่ที่สุด

คำถามของคุณกลายเป็นการประกวดที่ได้รับความนิยม คุณควรหาคำตอบที่ถูกต้องฉันสงสัยว่าคุณรู้ว่าคุณกำลังถามอะไรรู้ว่าคุณกำลังมองหาอะไร

ในการตอบคำถามของคุณ:
ถาม: ชุมชนได้รับการรับรอง DS อย่างจริงจังเพียงใด

ตอบ: คุณมีเป้าหมายอย่างไรในการเข้าเรียนหลักสูตรเหล่านี้? สำหรับการทำงานสำหรับโรงเรียนเพื่อการพัฒนาตนเอง ฯลฯ ? ชั้นเรียน Coursera นั้นถูกนำไปใช้อย่างมากคุณจะไม่ได้เรียนรู้ทฤษฎีมากนัก แต่จะสงวนไว้สำหรับการจัดห้องเรียน

อย่างไรก็ตามคลาส Coursera นั้นมีประโยชน์มาก ฉันจะบอกว่ามันเทียบเท่ากับหนึ่งปีของการเรียนระดับบัณฑิตศึกษาจากหลักสูตรปริญญาโทสองปี

ฉันยังไม่แน่ใจเกี่ยวกับการยอมรับของอุตสาหกรรมเนื่องจากปัญหาของหลักสูตรที่คุณเรียน คุณใช้เวลาเท่าไหร่ เป็นเรื่องง่ายกว่าที่จะเข้าเรียนในหลักสูตรเหล่านี้มากกว่าการสอบข้อเขียนในห้องเรียน ดังนั้นจึงมีการเปลี่ยนแปลงที่มีคุณภาพมากจากคนสู่คน


ส่วนหนึ่งของคำถามมีขึ้นเพื่อวัดว่าชุมชนได้ให้คุณค่ากับการรับรองหรือไม่ ในบางพื้นที่การรับรองเป็นสิ่งจำเป็นอย่างยิ่ง ในคนอื่น ๆ การรับรองไม่สำคัญเลย ในขณะที่คนอื่น ๆ การรับรองโดย บริษัท ใด บริษัท หนึ่งมีความสำคัญและไม่ได้รับการรับรองการแข่งขัน อีกส่วนหนึ่งก็เพื่อให้เข้าใจถึงความแตกต่างในการมุ่งเน้นเฉพาะของการรับรองที่มีอยู่ วิทยาศาสตร์ข้อมูลเป็นคำกว้าง ปกติแล้วการรับรองจะเน้นมากขึ้น นี่เป็นคำถามที่ไม่ดีสำหรับรูปแบบ QA - เป็นการสนทนาที่มากขึ้นภายใต้ความคิดเห็น
Steve Kallestad

จุดประสงค์ของฉันในการสังเกตว่าฉันเลือกคำตอบด้วยคะแนนเสียงคือการทำให้ชัดเจนว่าคำตอบทั้งหมดที่ควรอ่าน ทุกคนทำคะแนนได้ดีรวมถึงคุณลงมาที่นี่ที่ด้านล่าง ใครบางคนที่สงสัยเกี่ยวกับสิ่งเหล่านี้ไม่ควร จำกัด ตัวเองให้อยู่ในอันดับหนึ่งหรือสองคำตอบ
Steve Kallestad

การโหวตเพื่อค้นหาคำตอบที่ถูกต้องเป็นความคิดที่น่ากลัว มันเป็นวิธีที่ผิดที่จะเข้าใกล้คณิตศาสตร์ คุณพลาดจุดของฉันอย่างชัดเจน
13985

2

ฉันคิดว่าผลกระทบของการรับรองจากหลักสูตรจะขึ้นอยู่กับแต่ละบุคคลเช่นเดียวกับชั้นเรียน ความต้องการบอกว่าขั้นต่ำ 3-5 ชั่วโมงต่อสัปดาห์ถ้าคุณใส่มากขึ้นและวัสดุเปิดขึ้นมานานกว่า 3-5 ชั่วโมงการเรียนและการรับรองเหล่านี้จะเทียบเท่ากับฐานความรู้และประสบการณ์ที่แข็งแกร่งในสาขานี้ . วิทยาศาสตร์มาถึงผู้ที่ร้องขอ


2

ฉันเกือบทำกับ Johns Hopkins Data Science Specialis on Coursera (หลักสูตรและสุดยอดที่จะจบการศึกษา) ฉันจะให้ข้อดีข้อเสียของมันกับคุณพยายามที่จะทำให้มันเป็นไปตามวัตถุประสงค์:

ข้อดี :

  • โครงสร้างรอบกระบวนการเรียนรู้
  • คุณจะสร้างผลงานเมื่อเวลาผ่านไป

ข้อเสีย :

  • ภูมิหลังที่แตกต่างกันจำเป็นสำหรับหลักสูตรที่แตกต่าง หลักสูตรสองสามคนแรกไม่ได้รับความรู้ก่อนหน้านี้ ทันใดนั้นมันไม่ง่ายที่จะเข้าใจในหลักสูตรแนวคิด (การอนุมานทางสถิติการวิเคราะห์การถดถอย)
  • สอนโดยอาจารย์ 3 ท่าน ฉันคิดว่าพวกเขาไม่ได้อยู่ในหน้าเดียวกันเกี่ยวกับกลุ่มเป้าหมายและความสามารถ / ความต้องการ / ความสนใจ

2

วิธีที่ดีที่สุดที่จะประสบความสำเร็จในการหางานที่คุณต้องการแสดงให้เห็นว่าคุณสามารถทำได้

MOOC ที่คุณพูดถึงจะทำให้คุณมีพื้นฐานที่ดีในพื้นฐานและควรจะเพียงพอที่จะให้คุณเริ่มต้นแก้ปัญหาการเรียนรู้ของเครื่อง / ข้อมูลวิทยาศาสตร์ ลองการแข่งขัน Kaggle หรือสองครั้งซึ่งเป็นวิธีที่ดีในการพัฒนาทักษะของคุณและเกรดที่เหมาะสมจะเป็นที่สนใจของผู้จ้างงานที่มีศักยภาพ เผยแพร่ผลลัพธ์ของคุณใน Github โดยใช้บางสิ่งบางอย่างเช่นโน๊ตบุ๊ค iPython ซึ่งจะทำให้งานของคุณสามารถมองเห็นและตัดสินได้ง่าย

ลองวิเคราะห์ชุดข้อมูลสาธารณะอื่น ๆ เช่นชุดข้อมูลการแชร์จักรยาน UCIหรือชุดข้อมูลการรักษาโรคเบาหวาน UCI ที่สนุกมากและแสดงให้เห็นว่าคุณมีความกระตือรือร้นและเต็มใจที่จะพัฒนาทักษะของคุณ


2

มันขึ้นอยู่กับความน่าเชื่อถือของสถาบันที่ให้ใบรับรอง ตัวอย่างเช่นการรับรองวิทยาศาสตร์ข้อมูลจาก บริษัท ที่อยู่ในฮาร์วาร์ดได้รับการยอมรับจากพันธมิตรอุตสาหกรรมหลายแห่งและอาจเป็นทางเลือกที่ดี คุณไม่ได้พูดว่าคุณกำลังมองหาใบรับรองประเภทใด?


1

มูลค่าสำหรับนักเรียน, กระเป๋าแบบผสม การจ่ายเงินหลายร้อยดอลลาร์สำหรับโปรแกรมหนึ่งหรือหนึ่งร้อยต่อป๊อปสำหรับหลักสูตรนั้นเป็นแรงจูงใจ

ฉันได้จบซีรีส์หนึ่งจาก MITx เป็นหลักสูตรสำรวจวิธีการและเครื่องมือสำหรับผู้ที่ต้องการ "รู้เกี่ยวกับ" ในรายละเอียด มันเพียงพอแล้วที่ฉันรู้สึกสบายใจที่จะใช้สิ่งที่ฉันเรียนรู้

หลักสูตร HarvardX แบบสแตนด์อโลนในวิธีกราฟกราฟเชิงเส้นตรงเป็นเหมือนการสัมมนาระดับบัณฑิตศึกษาในสถิติของวิธีจูเดียเพิร์ล คงนานมากแล้วก่อนที่ฉันจะได้ยินเรื่องนี้

ซีรี่ส์ HarvardX เป็นค่าย boot ระดับบัณฑิตศึกษาที่มุ่งเน้นไปที่นักเรียนใหม่ในชุดเครื่องมือ R และแอพพลิเคชั่น

ซีรี่ส์ BerkeleyX เป็นหลักสูตรสำรวจระดับปริญญาตรีโดยใช้คลาส Python ที่สร้างขึ้นเพื่อวัตถุประสงค์เกือบเป็นภาษาเฉพาะของโดเมน

สำหรับมูลค่าของใบรับรองฉันสามารถรายงานได้ว่าประสบการณ์การศึกษาที่เกี่ยวข้องเพียงอย่างเดียวของฉันคือปริญญาโทด้านธรณีฟิสิกส์และฉันมีประสบการณ์เกี่ยวกับการชำระเงินเป็นเวลาหนึ่งปีนอกคำบรรยายลักษณะงานของฉัน (ทนายความธนาคารอาวุโส)

อาจเป็นผลมาจากใบรับรองฉันถูกปฏิเสธว่า "เกินคุณสมบัติ" สำหรับงานที่ฉันรู้จักอย่างน้อยสองงาน ดังนั้นคำแนะนำของฉันคือถ้าคุณมีใบรับรองไม่ต้องพูดถึงถ้าคำว่า "Excel" ปรากฏในการโพสต์งาน


1

แหล่งข้อมูลเกี่ยวกับ edX สำหรับหลักสูตรวิทยาศาสตร์ข้อมูลจาก Harvard, MIT, Microsoft และอื่น ๆ ที่อาจเป็นที่สนใจของกลุ่มนี้

ตัวอย่างเช่นเรามีโปรแกรมใบรับรองมืออาชีพจากฮาร์วาร์ประกอบด้วย 8 หลักสูตรและการสอบสุดที่นี่

สำหรับการศึกษาที่สูงขึ้นเรามีโปรแกรม Micromasters จากเอ็มไอทีที่นี่

เช่นเดียวกับจาก UC San Diego ที่นี่ สำหรับภาพรวมที่ดีของ Data Science เรามีโปรแกรมจาก Microsoft สำหรับทุกโปรแกรมของเราคุณสามารถตรวจสอบได้ที่นี่

หวังว่าจะช่วยได้

Josh จาก edX

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.