มันเกี่ยวกับอะไร
เพียงแค่รู้เกี่ยวกับเทคนิคก็เหมือนกับการรู้จักสัตว์ในสวนสัตว์ - คุณสามารถบอกชื่อพวกเขาอธิบายคุณสมบัติของพวกเขา
การทำความเข้าใจว่าเมื่อใดที่จะใช้พวกเขากำหนดสร้างทดสอบและปรับใช้แบบจำลองทางคณิตศาสตร์ที่ใช้งานได้ในพื้นที่แอปพลิเคชันขณะที่หลีกเลี่ยงข้อผิดพลาดซึ่งเป็นทักษะที่แยกแยะได้ในความคิดของฉัน
ควรเน้นวิทยาศาสตร์การประยุกต์ใช้วิธีการทางวิทยาศาสตร์เพื่อธุรกิจปัญหาอุตสาหกรรมและเชิงพาณิชย์ แต่ตอนนี้ต้องใช้ทักษะกว้างกว่าการทำเหมืองข้อมูลและการเรียนรู้เครื่องขณะที่โรบินบลอร์ระบุเชิญชวนใน"วิทยาศาสตร์ข้อมูลพูดจาโผงผาง"
ดังนั้นเราจะทำอะไรได้บ้าง
พื้นที่การใช้งาน : เรียนรู้เกี่ยวกับพื้นที่การใช้งานต่างๆที่ใกล้เคียงกับความสนใจของคุณหรือที่นายจ้างของคุณ พื้นที่มักมีความสำคัญน้อยกว่าการทำความเข้าใจวิธีสร้างแบบจำลองและวิธีการใช้เพื่อเพิ่มมูลค่าให้กับพื้นที่นั้น แบบจำลองที่ประสบความสำเร็จในพื้นที่หนึ่งมักจะสามารถปลูกถ่ายและนำไปใช้กับพื้นที่ต่าง ๆ ที่ทำงานในลักษณะที่คล้ายกัน
การแข่งขัน : ลองใช้ไซต์การแข่งขันขุดข้อมูลKaggleโดยควรเข้าร่วมทีมของผู้อื่น (Kaggle: แพลตฟอร์มสำหรับการแข่งขันการสร้างแบบจำลองการทำนาย บริษัท รัฐบาลและนักวิจัยนำเสนอชุดข้อมูลและปัญหาและนักวิทยาศาสตร์ข้อมูลที่ดีที่สุดในโลกแข่งขันกันเพื่อผลิตโซลูชั่นที่ดีที่สุด)
พื้นฐาน : มีสี่: (1) ดินแข็งในสถิติ (2) ทักษะการเขียนโปรแกรมที่ดีพอสมควร (3) ทำความเข้าใจวิธีโครงสร้างแบบสอบถามข้อมูลที่ซับซ้อน (4) การสร้างแบบจำลองข้อมูล หากมีผู้อ่อนแอแสดงว่าเป็นจุดเริ่มต้นที่สำคัญ
คำพูดเล็กน้อยในส่วนนี้:
`` ฉันเรียนรู้ความแตกต่างระหว่างการรู้ชื่อของบางสิ่งและรู้อะไรบางอย่างตั้งแต่ต้น คุณสามารถรู้ชื่อของนกในทุกภาษาของโลก แต่เมื่อคุณทำเสร็จแล้วคุณจะไม่รู้อะไรเลยเกี่ยวกับนก ... ดังนั้นลองมาดูนกและดูว่ามันกำลังทำอะไรอยู่ - นั่นคือ สิ่งที่สำคัญ '' - ริชาร์ดไฟน์แมน "การสร้างนักวิทยาศาสตร์" หน้า 14 ในสิ่งที่คุณสนใจสิ่งที่คนอื่นคิด 2531
โปรดทราบ:
`` การรวมกันของทักษะที่จำเป็นในการดำเนินโครงการวิทยาศาสตร์ทางธุรกิจเหล่านี้ ( วิทยาศาสตร์ข้อมูล) ไม่ค่อยมีคนอาศัยอยู่ในคนคนเดียว บางคนอาจมีความรู้อย่างกว้างขวางในสามด้านของ (i) สิ่งที่ธุรกิจทำ (ii) วิธีใช้สถิติและ (iii) วิธีจัดการข้อมูลและการไหลของข้อมูล ถ้าเป็นเช่นนั้นเขาหรือเธออาจอ้างได้ว่าเป็นนักวิทยาศาสตร์ธุรกิจ (หรือที่รู้จักว่า“ นักวิทยาศาสตร์ข้อมูล”) ในภาคที่กำหนด แต่บุคคลดังกล่าวเกือบจะหายากเหมือนฟันของไก่ '' - Robin Bloor นักวิทยาศาสตร์ด้านข้อมูล , ส.ค. 2013, การวิเคราะห์ภายใน
และในที่สุดก็:
`` แผนที่ไม่ใช่ดินแดน '' - Alfred Korzybski, 1933, วิทยาศาสตร์และความมีสติ
ปัญหาที่แท้จริงและนำไปใช้จริงส่วนใหญ่ไม่สามารถเข้าถึงได้จาก `` แผนที่ 'เท่านั้น ในการทำสิ่งต่าง ๆ ด้วยการสร้างแบบจำลองทางคณิตศาสตร์เราต้องยอมให้มีรายละเอียดย่อย ๆ และข้อยกเว้น ไม่มีสิ่งใดสามารถทดแทนการรู้อาณาเขตด้วยตนเอง