วิชาคณิตศาสตร์ใดที่คุณแนะนำให้เตรียมตัวสำหรับการขุดข้อมูลและการเรียนรู้ของเครื่อง


30

ฉันพยายามรวบรวมหลักสูตรคณิตศาสตร์ที่กำกับตนเองเพื่อเตรียมการเรียนรู้การขุดข้อมูลและการเรียนรู้ของเครื่อง นี่คือแรงบันดาลใจจากการเริ่มเรียนการเรียนรู้ด้วยเครื่องจักรของ Andrew Ngบน Coursera และรู้สึกว่าก่อนที่จะดำเนินการต่อฉันต้องพัฒนาทักษะคณิตศาสตร์ของฉัน ฉันเรียนจบวิทยาลัยมานานแล้วดังนั้นพีชคณิตและสถิติของฉัน (โดยเฉพาะจากวิชารัฐศาสตร์ / จิตวิทยา) เป็นสนิม

คำตอบในเธรดพื้นหลังที่แข็งแกร่งในวิชาคณิตศาสตร์เป็นสิ่งจำเป็นสำหรับ ML หรือไม่? แนะนำเฉพาะหนังสือหรือชั้นเรียนที่เกี่ยวข้องโดยตรงกับการเรียนรู้ของเครื่อง ฉันได้ดูในชั้นเรียนและหนังสือเหล่านั้นแล้วและไม่ทราบแน่ชัดว่าวิชาคณิตศาสตร์จะต้องเรียนอะไร (เช่น: เขตที่อยู่ทางคณิตศาสตร์ที่ได้รับสมการเพื่อ "ลดฟังก์ชั่นต้นทุน") หัวข้ออื่น ๆ ที่แนะนำ ( ทักษะและหลักสูตรที่จำเป็นในการเป็นนักวิเคราะห์ข้อมูล ) กล่าวถึงเฉพาะหมวดหมู่ทักษะที่จำเป็นสำหรับการวิเคราะห์ข้อมูลเท่านั้น ความรู้เบื้องต้นเกี่ยวกับสถิติสำหรับนักคณิตศาสตร์ไม่ได้ใช้เพราะฉันยังไม่มีวุฒิทางคณิตศาสตร์ หัวข้อที่คล้ายกันนักคณิตศาสตร์ต้องการความรู้ที่เทียบเท่ากับระดับสถิติที่มีคุณภาพ มีรายการสถิติหนังสือที่น่าเหลือเชื่อ แต่อีกครั้งฉันกำลังดูคณิตศาสตร์เริ่มต้นจากการจำพีชคณิตและสนิมขึ้นจากที่นั่น

ดังนั้นสำหรับผู้ที่ทำงานในการเรียนรู้ของเครื่องจักรและการขุดข้อมูลคุณต้องใช้วิชาคณิตศาสตร์ในสาขาใด วิชาคณิตศาสตร์ใดที่คุณแนะนำให้เตรียมตัวสำหรับการขุดข้อมูลและการเรียนรู้ของเครื่องและในลำดับใด นี่คือรายการและคำสั่งที่ฉันมี:

  • พีชคณิต
  • Pre-แคลคูลัส
  • แคลคูลัส
  • พีชคณิตเชิงเส้น
  • ความน่าจะเป็น
  • สถิติ (ฟิลด์ย่อยต่าง ๆ มากมายที่นี่ แต่ไม่ทราบวิธีแบ่งย่อย)

สำหรับการขุดข้อมูลและการเรียนรู้ของเครื่องจักรผ่านงานปัจจุบันของฉันฉันสามารถเข้าถึงบันทึกบนเว็บไซต์ / กิจกรรมแอพธุรกรรมลูกค้า / การสมัครสมาชิกและข้อมูลอสังหาริมทรัพย์ (ทั้งแบบคงที่และอนุกรมเวลา) ฉันหวังว่าจะใช้การขุดข้อมูลและการเรียนรู้เครื่องกับชุดข้อมูลเหล่านี้

ขอขอบคุณ!

แก้ไข:

เพื่อเห็นแก่ลูกหลานฉันต้องการแบ่งปันการประเมินตนเองทางคณิตศาสตร์ที่เป็นประโยชน์สำหรับชั้นเรียน Intro Machine Machineของ Geoffrey Gordon / Alex Smola ที่ CMU


3
ในแง่ของข้อกำหนดเบื้องต้นสำหรับคลาส Coursera ข้อมูลนั้นควรมีอยู่ในสื่อของพวกเขา นอกเหนือจากการเรียนของพวกเขา / โดยทั่วไปแล้วคำถามเกี่ยวกับคณิตศาสตร์ที่คุณต้องการสำหรับสถิติ / ML / DM กระทบกับฉันในฐานะซ้ำ มีหลายหัวข้อใน CV ที่ครอบคลุมเนื้อหานี้ ได้แก่ : is-a-strong-background-in-maths-a-requisite-for-ml , & skills-coursework- จำเป็นต้องเป็นนักวิเคราะห์ข้อมูล ( บางทีในหมู่คนอื่น ๆ )
gung - Reinstate Monica

1
กรุณาตรวจสอบกระทู้เหล่านั้นกระทู้ที่เชื่อมโยงมีความเกี่ยวข้องอย่างใกล้ชิดและอาจค้นหาเว็บไซต์ หากคุณยังมีคำถามหลังจากอ่านไปแล้วให้กลับมาที่นี่ & แก้ไขคำถามนี้เพื่อให้มีความโดดเด่นมากขึ้น / ระบุสิ่งที่คุณต้องรู้ให้ชัดเจนยิ่งขึ้นซึ่งไม่ได้กล่าวถึงในที่อื่น
gung - Reinstate Monica

คำตอบ:


15

คำแนะนำที่ @gung ทำนั้นคุ้มค่าที่จะติดตามอย่างแน่นอน เมื่อเรียนจบหลักสูตรฉันคิดว่ารายการของคุณเป็นการเริ่มต้นที่ดี ความคิดเห็นบางส่วน:

  1. พีชคณิตเชิงเส้นและพีชคณิตเมทริกซ์เป็นแบบเดียวกันดังนั้นให้วางหลัง
  2. ในแคลคูลัสต้องแน่ใจว่าได้รวมความแตกต่างบางส่วนไว้ด้วย นี่คือแคลคูลัสที่ใช้กับฟังก์ชั่นของตัวแปรมากกว่าหนึ่งตัว (สัญลักษณ์, ถ้า, พูด,เป็นฟังก์ชันของและคุณต้องการมากกว่า ) โชคดีที่มันไม่ยากx y zzxy dzzxdzdx
  3. ในแคลคูลัสคุณไม่ต้องการอะไรเลยนอกจากการรวมเข้าด้วยกันขั้นพื้นฐาน นี่คือโชคดีเพราะการรวมกันเป็นเรื่องยาก
  4. เพิ่มการเพิ่มประสิทธิภาพพื้นฐานคือการหาค่าสูงสุดหรือต่ำสุดของฟังก์ชั่นซึ่งโดยทั่วไปจะเป็นฟังก์ชันของตัวแปรมากกว่าหนึ่งตัว การแข็งค่าของการลาดลงอย่างน้อยเป็นสิ่งจำเป็น
  5. ในแง่ของความยากลำบากคุณอาจต้องการที่จะอยู่ระหว่างจุดเริ่มต้นและจุดสิ้นสุดของปีที่ 1 ระดับปริญญาตรี
  6. พยายามอ่านความน่าจะเป็นพื้นฐานและข้อความสถิติออนไลน์หรืออย่างอื่น แต่ไม่ต้องกังวลมากเกินไป (คณิตศาสตร์พื้นฐานเป็นสิ่งที่จำเป็นต้องมีก่อนเพื่อทำความเข้าใจความน่าจะเป็นและสถิติ) หากคุณทำหลักสูตรบางอย่างเช่นหลักสูตรที่คุณแนะนำคุณจะเข้าใจว่าคุณต้องเรียนรู้อะไรและความสนใจของคุณอยู่ตรงไหน อย่างน้อยสิ่งแรกที่คุณไม่ต้องการทำคือใช้เวลามากมายในการเรียนรู้เกี่ยวกับการทดสอบสมมติฐาน คุณต้องการคัดท้ายการทำความเข้าใจสถิติพื้นฐาน - ตัวแปรสุ่มการแจกแจงความน่าจะเป็น (PFDs, CDFs), สถิติเชิงพรรณนา - จากนั้นพยายามทำความเข้าใจการถดถอย

5

มีหัวข้อที่ยอดเยี่ยมสองสามข้อในฟอรัมนี้ -รวมถึงหัวข้อนี้ที่ฉันพบว่ามีประโยชน์สำหรับฉันโดยเฉพาะในแง่ของการพัฒนาโครงร่างแนวคิดของทักษะที่สำคัญสำหรับงานด้านวิทยาศาสตร์ข้อมูล

ดังกล่าวข้างต้นมีหลักสูตรออนไลน์มากมาย ตัวอย่างเช่นตอนนี้ Coursera มีความเชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลด้วยหลักสูตรจำนวนหนึ่งที่อาจครอบคลุมเครื่องมือบางอย่างที่คุณต้องการสำหรับการทำงานของคุณ


3

หากคุณกำลังมองหาการเรียนรู้ด้วยเครื่องจักร / การขุดข้อมูลจำนวนมากฉันขอแนะนำให้ใช้การเพิ่มประสิทธิภาพ / พีชคณิตเชิงเส้น / สถิติและความน่าจะเป็น นี่คือรายการหนังสือสำหรับความน่าจะเป็น หวังว่าจะช่วย


3

เท่าที่การแปรงทักษะคณิตศาสตร์ขั้นพื้นฐานมากฉันใช้หนังสือเหล่านี้:

องค์ประกอบของคณิตศาสตร์เพื่อเศรษฐศาสตร์และการเงิน Mavron, Vassilis C. , Phillips, Timothy N หนังสือเล่มนี้กล่าวถึงทักษะทางคณิตศาสตร์ที่จำเป็น (การเพิ่มการแทนที่) เพื่อแยกความแตกต่างบางส่วนการรวมเมทริกซ์และดีเทอร์มินัลและบทเล็ก ๆ เกี่ยวกับการเพิ่มประสิทธิภาพและสมการเชิงอนุพันธ์ มันมีเป้าหมายเพื่อเศรษฐศาสตร์และการเงิน แต่เป็นหนังสือเล่มเล็กลำดับของบทที่เหมาะกับความต้องการของฉันและอ่านง่ายสำหรับฉัน

การวิเคราะห์ทางสถิติ: Microsoft Excel 2010 Conrad Carlberg ครอบคลุมการวิเคราะห์ทางสถิติพื้นฐานการถดถอยหลายครั้งและการวิเคราะห์ความแปรปรวนร่วมและใช้ excel

การค้นหาสถิติโดยใช้ฟิลด์แอนดี้, เจเรมีไมล์, ฟิลด์โซเอ ยังไม่ได้อ่านเลย มันใช้อาร์

พีชคณิตเชิงเส้นเบื้องต้น Ron Larson, David C. Falvo

วิธีเมทริกซ์: พีชคณิตเชิงเส้นประยุกต์โดย Richard Bronson, Gabriel B. Costa ครอบคลุมพีชคณิตเชิงเส้นเบื้องต้นและแคลคูลัสเมทริกซ์

นี่คือหนังสือคณิตศาสตร์พื้นฐานที่ฉันใช้เพื่อเกี่ยวข้องกับการเรียนรู้การทำเหมืองข้อมูล / เครื่องจักร

หวังว่านี่จะช่วยได้


3

มีแหล่งข้อมูลที่เกี่ยวข้องจำนวนมาก (และจัดหมวดหมู่) ที่นี่ที่เรียกว่า "ผู้เชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลโอเพนซอร์ส"

โดยเฉพาะสำหรับคณิตศาสตร์พวกเขารายการ:

  1. พีชคณิตเชิงเส้นและการเขียนโปรแกรม
  2. สถิติ
  3. สมการเชิงอนุพันธ์และแคลคูลัส

คำแนะนำทั่วไปที่น่ารักแม้ว่าพวกเขาจะทำรายการหนังสือเรียนบางเล่มที่คุณอาจพบว่ามีประโยชน์


2
  • ความน่าจะเป็นและสถิติเป็นสิ่งจำเป็น คำหลักบางคำคือการทดสอบสมมติฐาน, การแจกแจงปกติหลายตัวแปร, การอนุมานแบบเบย์ (ความน่าจะเป็นร่วม, ความน่าจะเป็นตามเงื่อนไข), ค่าเฉลี่ย, ความแปรปรวน, ความแปรปรวนร่วม, การเบี่ยงเบน Kullback-Leibler, ...
  • พีชคณิตเชิงเส้นพื้นฐานเป็นสิ่งจำเป็นสำหรับการเรียนรู้ของเครื่อง หัวข้อที่คุณสามารถเรียนรู้ได้คือการสลายตัวของ Eigen และการสลายตัวของค่าเอกพจน์ (แน่นอนคุณควรรู้วิธีคำนวณผลิตภัณฑ์เมทริกซ์)
  • ตามที่ได้กล่าวถึง TooTone แล้ว: การปรับให้เหมาะสมเป็นสิ่งสำคัญ คุณควรรู้ว่าเชื้อสายการไล่ระดับสีคืออะไรและอาจดูวิธีการของนิวตันคือ Levenberg-Marquardt, Broyden-Fletcher-Goldfarb-Shanno
  • แคลคูลัสนั้นไม่สำคัญ แต่มันอาจมีประโยชน์ที่จะรู้วิธีคำนวณอนุพันธ์บางส่วนของฟังก์ชัน (Jacobi matrix, Hesse matrix, ... ) และคุณควรรู้ว่าอินทิกรัลคืออะไร

0

พีชคณิตเชิงเส้น, สถิติ, แคลคูลัส ฉันคิดว่าคุณสามารถเรียนรู้พวกเขาควบคู่ควบคู่กับ ML - หรือแม้กระทั่งหลังจากพื้นฐาน หลักสูตร / หนังสือเริ่มต้นทำงานได้อย่างยอดเยี่ยมด้วยบทคณิตศาสตร์สำหรับผู้เริ่มต้นและคุณเรียนรู้สิ่งจำเป็นทางคณิตศาสตร์ในขณะที่เรียน ML ฉันทำตอนพอดคาสต์เกี่ยวกับคณิตศาสตร์ที่คุณต้องการสำหรับการเรียนรู้ของเครื่องและแหล่งข้อมูลสำหรับการเรียนรู้: คู่มือการเรียนรู้ของเครื่อง # 8


0

ก่อนที่จะเริ่มหลักสูตรการเรียนรู้ของเครื่องให้ผ่านหลักสูตรคณิตศาสตร์ต่อไปนี้ อย่าพยายามขุดด้วยความพยายามเพียงครั้งเดียว เรียนรู้แนวคิดพื้นฐานจากนั้นทำการแปรงทักษะคณิตศาสตร์ของคุณอีกครั้งและทำซ้ำ: -

หัวข้อทางคณิตศาสตร์มีดังนี้: -

  • พีชคณิตเชิงเส้น
  • ความน่าจะเป็น
  • แคลคูลัสพื้นฐาน
  • ฟังก์ชัน Maxima และ Minima
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.