การเรียนรู้ของเครื่องเป็นเรื่องสำคัญสำหรับนักสถิติคนใดที่จะทำความคุ้นเคยหรือไม่? ดูเหมือนว่าการเรียนรู้ของเครื่องเป็นสถิติ ทำไมโปรแกรมวิชาสถิติ (ระดับปริญญาตรีและบัณฑิต) จึงไม่จำเป็นต้องเรียนรู้ด้วยเครื่อง?
การเรียนรู้ของเครื่องเป็นเรื่องสำคัญสำหรับนักสถิติคนใดที่จะทำความคุ้นเคยหรือไม่? ดูเหมือนว่าการเรียนรู้ของเครื่องเป็นสถิติ ทำไมโปรแกรมวิชาสถิติ (ระดับปริญญาตรีและบัณฑิต) จึงไม่จำเป็นต้องเรียนรู้ด้วยเครื่อง?
คำตอบ:
การเรียนรู้ของเครื่องเป็นสาขาเฉพาะของสถิติที่ใช้ในมิติสูง นอกจากนี้ยังต้องมีพื้นหลังการเขียนโปรแกรมจำนวนมากซึ่งไม่จำเป็นสำหรับโปรแกรมเชิงปริมาณที่ดีโดยเฉพาะอย่างยิ่งในระดับปริญญาตรี แต่ยังมีขอบเขตในระดับบัณฑิตศึกษา มันมีการประยุกต์ใช้เฉพาะกับการทำนายด้านสถิติในขณะที่สถิติทางคณิตศาสตร์เช่นเดียวกับสถิติเชิงอนุมานและเชิงพรรณนาที่ต้องการความสนใจ หลายโปรแกรมเปิดโอกาสให้นักเรียนได้สัมผัสกับการเรียนรู้ของเครื่องจักร (CMU เป็นต้น) แต่นักสถิติอุตสาหกรรมโดยรวมไม่ค่อยได้รับโอกาสในการใช้เครื่องมือเหล่านี้ยกเว้นงานเทคโนโลยีชั้นสูงบางอย่าง
ในขณะที่ฉันได้เห็นเมื่อเร็ว ๆ นี้นักวิทยาศาสตร์ข้อมูลจำนวนมากและการเรียนรู้เครื่องตำแหน่งในตลาดงานผมคิดว่ารายละเอียดงานทั่วไปของ "สถิติ" ไม่จำเป็นต้องมีการเรียนรู้เครื่องพื้นหลัง แต่ไม่จำเป็นต้องมีความเข้าใจที่ไร้ที่ติของสถิติพื้นฐานการอนุมานและการสื่อสาร: สิ่งเหล่านี้ควรเป็นแกนหลักของโปรแกรมสถิติระดับบัณฑิตศึกษา การเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูลนั้นค่อนข้างใหม่สำหรับตำแหน่งงานและสาขาวิชา มันจะเป็นการก่อความเสียหายแก่ผู้ที่มองหาการจ้างงานในฐานะนักสถิติที่จะส่งผลต่อกลยุทธ์การแก้ปัญหาของพวกเขาที่มีต่อการเรียนรู้ของเครื่องจักรหากองค์กรส่วนใหญ่ถูกทอดทิ้งในองค์กรธุรกิจ / เภสัชศาสตร์ / วิทยาศาสตร์ชีวภาพ
ท้ายสุดฉันไม่รู้สึกว่าการเรียนรู้ของเครื่องช่วยเพิ่มความเข้าใจในสถิติอย่างมาก สถิติเป็นพื้นฐานข้ามสาขาวิชาและเป็นสิ่งสำคัญในการสื่อสารและโน้มน้าวให้ผู้เชี่ยวชาญที่ไม่ใช่ด้านเทคนิคในสาขาของคุณ (เช่นแพทย์, CFOs หรือผู้ดูแลระบบ) ว่าทำไมคุณเลือกวิธีการที่คุณเลือก การเรียนรู้ของเครื่องเป็นสิ่งที่มีความสำคัญอย่างยิ่งในด้านเทคนิคซึ่งในการปฏิบัติที่ประยุกต์ใช้หลายอย่างนั้นสัญญาว่าจะให้ประสิทธิภาพที่ดีกว่าการเพิ่มขึ้นของเครื่องมือและเทคนิคมาตรฐาน วิธีการหลายอย่างในการเรียนรู้แบบมีผู้สอนและไม่ได้รับการดูแลนั้นถูกมองว่าไม่ใช่ผู้เชี่ยวชาญ (และแม้แต่ผู้เชี่ยวชาญที่ผ่านการฝึกอบรมน้อยกว่า) ในฐานะ "กล่องดำ" เมื่อถูกขอให้ปกป้องการเลือกวิธีการเรียนรู้ที่เฉพาะเจาะจงของพวกเขามีคำอธิบายที่ไม่สอดคล้องกับสถานการณ์ที่กระตุ้นให้เกิดปัญหา
โอเคเรามาพูดถึงเรื่องของสถิติกับสิ่งที่เราได้เรียนรู้จากสิ่งที่เราเรียนรู้จากคนหนึ่งหรือสองคนที่เราได้ทำงานอย่างใกล้ชิดในโครงการปริญญาโทของเรา ...
โปรแกรมสถิติต้องการสิ่งที่พวกเขาเห็นว่าเหมาะสมสิ่งที่สำคัญที่สุดคือสิ่งที่พวกเขาต้องการให้นักเรียนเรียนรู้ในระยะเวลา จำกัด ที่นักเรียนจะมีในโปรแกรม การกำหนดพื้นที่แคบ ๆ หมายถึงการจูบลาไปยังพื้นที่อื่นที่สามารถแย้งว่ามีความสำคัญเท่าเทียมกัน บางโปรแกรมต้องการการวัดความน่าจะเป็นเชิงทฤษฎี แต่บางโปรแกรมไม่ บางโปรแกรมต้องการภาษาต่างประเทศ แต่โปรแกรมส่วนใหญ่ไม่ต้องการ บางโปรแกรมใช้กระบวนทัศน์แบบเบย์เป็นสิ่งเดียวที่ควรค่าแก่การศึกษา บางโปรแกรมรู้ว่าความต้องการที่ยิ่งใหญ่ที่สุดสำหรับนักสถิตินั้นอยู่ในสถิติการสำรวจ (อย่างน้อยก็คือในสหรัฐอเมริกา) แต่ส่วนใหญ่ไม่ได้ โปรแกรม Biostat ติดตามเงินและสอนวิธีการขาย SAS + ให้กับแพทย์และเภสัชศาสตร์อย่างง่ายดาย
สำหรับผู้ที่ออกแบบการทดลองทางการเกษตรหรือรวบรวมข้อมูลการสำรวจผ่านการสำรวจทางโทรศัพท์หรือตรวจสอบสเกลไซโครเมทหรือสร้างแผนที่อุบัติการณ์ของโรคใน GIS การเรียนรู้ด้วยเครื่องเป็นศิลปะนามธรรมของวิทยาการคอมพิวเตอร์ รากฐาน บุคคลเหล่านี้จะไม่เห็นประโยชน์ทันทีจากการเรียนรู้เครื่องสนับสนุนเวกเตอร์หรือป่าสุ่ม
สรุปแล้วการเรียนรู้ของเครื่องเป็นส่วนเสริมที่ดีในด้านอื่น ๆ ของสถิติ แต่ฉันจะยืนยันว่าสิ่งที่สำคัญเช่นการแจกแจงปกติหลายตัวแปรและโมเดลเชิงเส้นทั่วไปต้องมาก่อน
การเรียนรู้ของเครื่องนั้นเกี่ยวกับการรับความรู้ / การเรียนรู้จากข้อมูล ตัวอย่างเช่นฉันทำงานกับอัลกอริธึมการเรียนรู้ด้วยเครื่องจักรที่สามารถเลือกยีนบางตัวที่อาจเกี่ยวข้องกับโรคบางประเภทจากข้อมูล DNA Microarray (เช่นมะเร็งหรือเบาหวาน) นักวิทยาศาสตร์สามารถใช้ยีนเหล่านี้ (โมเดลที่เรียนรู้) สำหรับการวินิจฉัยในอนาคต (การจำแนกประเภทตัวอย่างที่มองไม่เห็น)
มีสถิติจำนวนมากที่เกี่ยวข้องกับการเรียนรู้ของเครื่อง แต่มีสาขาของการเรียนรู้ของเครื่องที่ไม่ต้องใช้สถิติ (เช่นการเขียนโปรแกรมทางพันธุกรรม) ครั้งเดียวที่คุณจะต้องใช้สถิติในกรณีเหล่านี้คือดูว่าแบบจำลองที่คุณสร้างขึ้นโดยใช้การเรียนรู้ของเครื่องนั้นแตกต่างจากรุ่นอื่นอย่างมีนัยสำคัญหรือไม่
ในความคิดของการแนะนำเพื่อการเรียนรู้เครื่องสถิติจะเป็นประโยชน์ สิ่งนี้จะช่วยให้นักสถิติเห็นสถานการณ์จริงของการประยุกต์ใช้สถิติ แต่ก็ไม่ควรจะเป็นภาคบังคับ คุณอาจกลายเป็นนักสถิติที่ประสบความสำเร็จและใช้เวลาทั้งชีวิตโดยไม่ต้องเข้าใกล้การเรียนรู้ของเครื่อง!