ข้อกำหนดเบื้องต้นทางคณิตศาสตร์สำหรับนักวิจัย AI คืออะไร


12

ข้อกำหนดเบื้องต้นทางคณิตศาสตร์สำหรับการทำความเข้าใจส่วนหลักของอัลกอริทึมในปัญญาประดิษฐ์และการพัฒนาอัลกอริทึมของตัวเองคืออะไร?

โปรดแนะนำหนังสือที่เฉพาะเจาะจงให้ฉันดู

คำตอบ:


9

มูลนิธิคณิตศาสตร์ที่ดี

เริ่มต้นด้วยการรับรองความสามารถอย่างเต็มรูปแบบด้วยพีชคณิตระดับกลางและพื้นฐานอื่น ๆ ของแคลคูลัสและคณิตศาสตร์ไม่ต่อเนื่องรวมถึงคำศัพท์และแนวคิดพื้นฐานภายในหัวข้อเหล่านี้

  • ซีรีย์ไม่มีที่สิ้นสุด
  • หลักฐานเชิงตรรกะ
  • พีชคณิตเชิงเส้นและเมทริกซ์
  • เรขาคณิตวิเคราะห์โดยเฉพาะอย่างยิ่งความแตกต่างระหว่างสุดขั้วระดับโลกและระดับโลก (ต่ำสุดและสูงสุด) จุดอานและจุดผัน
  • ทฤษฎีเซต
  • ความน่าจะเป็น
  • สถิติ

รากฐานของไซเบอร์เนติกส์

Norbert Wiener, Cybernetics, 1948, MIT Press, มีอนุกรมเวลาและแนวคิดการตอบกลับที่มีความชัดเจนและคำสั่งที่ไม่เห็นในงานต่อมา; มันยังมีความรู้เบื้องต้นเกี่ยวกับทฤษฎีข้อมูลที่เริ่มต้นด้วยสูตรบันทึก2ของแชนนอนเพื่อกำหนดปริมาณข้อมูลในบิต นี่เป็นสิ่งสำคัญที่จะต้องเข้าใจการขยายตัวของแนวคิดเอนโทรปีของข้อมูล

แคลคูลัส

ค้นหาหนังสือแคลคูลัสที่ดีและตรวจสอบให้แน่ใจว่าคุณมีความชัดเจนเกี่ยวกับทฤษฎีและการประยุกต์ใช้ที่สำคัญในหมวดหมู่เหล่านี้

  • อนุกรมเวลา
  • ซีรีย์ไม่มีที่สิ้นสุด
  • การบรรจบกัน - เครือข่ายประดิษฐ์ผสมผสานอย่างลงตัวระหว่างการเรียนรู้
  • ความแตกต่างบางส่วน
  • เมทริกซ์จาโคเบียนและเฮสเซียน
  • คณิตศาสตร์หลายตัวแปร
  • เขตแดน
  • คณิตศาสตร์ไม่ต่อเนื่อง

มากของที่อยู่ในแคลคูลัสแปลก, MIT, เลสลีย์-เคมบริดจ์ แม้ว่า PDF จะมีอยู่ในเว็บ แต่เป็นแบบพื้นฐานและไม่ลึกมากนัก หนึ่งในห้องสมุดห้องปฏิบัติการของเราเป็นระดับกลางแคลคูลัส , เฮอร์ลีย์โฮลท์ไรน์ฮาร์และวินสตัน 1980 มันครอบคลุมและในบางวิธีดีกว่าเค้าโครงที่ฉันมีในห้องสมุดบ้านของฉันซึ่ง Princeton ใช้สำหรับนักเรียนปีที่สอง

ให้แน่ใจว่าคุณทำงานในพื้นที่ที่เกิน beyond 2 (เกินกว่า 2D) ตัวอย่างเช่น RNNs มักจะอยู่ในพื้นที่เช่นℝ 4 thorugh ℝ 7เนื่องจากขนาดแนวนอนแนวตั้งความลึกพิกเซลและขนาดกรอบภาพยนตร์

คณิตศาสตร์ จำกัด

โชคไม่ดีที่ไม่มีหนังสือสามเล่มที่ฉันคิดว่ามีทั้งหมดนี้

  • กราฟกำกับ - เรียนรู้ต้นไม้นี้ก่อนหรือวงจร (อวนเทียม) เพราะมันเป็นภูมิประเทศที่ superset ของการกำหนดค่าเหล่านั้นทั้งหมด
  • ต้นไม้สัญลักษณ์นามธรรม (ASTs)
  • ทฤษฎีเซตขั้นสูง
  • ต้นไม้ตัดสินใจ
  • โซ่มาร์คอฟ
  • ทฤษฎีความโกลาหล (โดยเฉพาะความแตกต่างระหว่างการสุ่มและการสุ่มหลอก)
  • ทฤษฎีเกมเริ่มต้นด้วย Von Neumann และ Morgenstern ของทฤษฎีเกมที่บรรลุผลงานในสนามที่
  • การบรรจบกันในระบบที่ไม่ต่อเนื่องโดยเฉพาะอย่างยิ่งการประยุกต์ใช้ทฤษฎีกับความอิ่มตัวของสัญญาณในจำนวนเต็ม, จุดคงที่หรือเลขทศนิยม
  • วิธีการทางสถิติ, การเบี่ยงเบน, สหสัมพันธ์, และแนวคิดที่ก้าวหน้ามากขึ้นของเอนโทรปี, เอนโทรปีสัมพัทธ์, และเอนโทรปีข้าม
  • ข้อต่อโค้ง
  • บิด
  • ความน่าจะเป็นโดยเฉพาะทฤษฎีบทของเบย์
  • ทฤษฎี Algorithmic (ทฤษฎีความไม่แน่นอนของGödelและทัวริงครบถ้วน)

เคมีและประสาทวิทยา

เป็นการดีที่จะนึกถึงดุลยภาพทางเคมีจากวิชาเคมีระดับมัธยมปลาย ยอดคงเหลือมีบทบาทสำคัญในการออกแบบ AI ที่ซับซ้อนยิ่งขึ้น การทำความเข้าใจเกี่ยวกับความสัมพันธ์ทางชีวภาพระหว่างแบบจำลองเชิงกำเนิดและแบบเลือกปฏิบัติใน GANs จะช่วยให้นักเรียนเข้าใจเรื่องนี้มากขึ้น

ฟังก์ชั่นการควบคุมภายในระบบชีวภาพยังคงเป็นแหล่งหลักของการพิสูจน์แนวคิดในการวิจัยปัญญาประดิษฐ์ ในขณะที่นักวิจัยมีความคิดสร้างสรรค์มากขึ้นในการจินตนาการถึงการปรับตัวที่ไม่ได้เลียนแบบบางแง่มุมของชีววิทยาโดยตรง (ความเป็นจริงยังห่างจากการเขียนนี้) ความคิดสร้างสรรค์อาจมีบทบาทใหญ่ในการกำหนดเป้าหมายการวิจัย AI

ถึงแม้ว่า AI จะยังคงเป็นสาขาสหวิทยาการส่วนใหญ่


2
ความคิดเห็นบางอย่าง: 1) ฉันเห็นด้วยกับสิ่งที่จอห์นเขียนไว้ในคำตอบของเขาว่าคำตอบของเขาเป็น "แกนกลาง" ทั่วไปมากกว่าในขณะที่คุณมีสิ่งที่อาจเป็นประโยชน์หรืออาจไม่ขึ้นอยู่กับว่า 2) หลายสิ่งที่คุณอธิบายภายใต้ "คณิตศาสตร์ระดับมัธยมปลาย" ไม่ใช่คณิตศาสตร์ระดับมัธยมศึกษาตอนปลายอย่างน้อยไม่ใช่ในยุโรป (ไม่รู้เกี่ยวกับสหรัฐอเมริกา) ในเนเธอร์แลนด์ฉันไม่ได้เรียนรู้เกี่ยวกับพีชคณิตเชิงเส้นเมทริกซ์ซีรีส์อนันต์หรือทฤษฎีที่ตั้งไว้จนกระทั่งปีแรกของฉันในมหาวิทยาลัย บางคนอาจปรากฏตัวขึ้นก่อนหน้านี้ถ้าฉันเลือกหลักสูตรอื่นในโรงเรียนมัธยม
Dennis Soemers

2
3) การวิเคราะห์เชิงหน้าที่ / ทฤษฎีการวัดอาจมีประโยชน์ที่จะรวมไว้ในบางพื้นที่ แต่อีกครั้งมันมากขึ้นอยู่กับว่าคุณต้องการไปเป็นนักวิจัย AI นักวิจัย AI บางคนในด้านทฤษฎีของสิ่งต่าง ๆ จะพบว่าเกือบทุกสิ่งนี้มีประโยชน์ นักวิจัย AI อื่น ๆ เพิ่มเติมเกี่ยวกับการทดลอง / ซอฟต์แวร์ / การเขียนโปรแกรมต้องการมากน้อยกว่ามาก ทั้งสองยังสามารถส่งออกการวิจัยที่มีคุณค่าสูง
Dennis Soemers

7

ฉันทำงานเป็นอาจารย์และเพิ่งออกแบบข้อกำหนดทางคณิตศาสตร์สำหรับวิชาเอก AI ใหม่โดยปรึกษากับเพื่อนร่วมงานของฉันหลายคนที่สถาบันอื่น

คำตอบอื่น ๆ โดยเฉพาะอย่างยิ่ง @ FauChrisian ทำหน้าที่ได้ดีในการทำรายการหัวข้อทั้งหมดที่อาจเป็นประโยชน์ในที่ใดก็ได้ใน AI แต่ไม่ใช่ทั้งหมดที่มีประโยชน์สำหรับการทำความเข้าใจหัวข้อหลัก ในกรณีอื่น ๆ การทำความเข้าใจหัวข้อนั้นเป็นหลักเหมือนกับการทำความเข้าใจกับอัลกอริทึม AI ที่เกี่ยวข้องดังนั้นเราจึงมักจะสอนพวกเขาด้วยกันแทนที่จะคิดว่าความรู้เบื้องต้น ตัวอย่างเช่นกระบวนการตัดสินใจของมาร์คอฟนั้นไม่ยากที่จะสอนให้คนที่รู้พื้นฐานของทฤษฎีกราฟและความน่าจะเป็นดังนั้นเราจึงมักจะครอบคลุมพวกเขาเมื่อเราสอนการเรียนรู้เสริมในหลักสูตร AI แทนที่จะเป็นหัวข้อแยกต่างหากในวิชาคณิตศาสตร์ หลักสูตร

ข้อกำหนดทางคณิตศาสตร์ที่เราตัดสินมีลักษณะดังนี้:

  • หลักสูตรหนึ่งหรือสองภาคการศึกษาในวิชาคณิตศาสตร์ไม่ต่อเนื่อง นี่เป็นเรื่องที่สร้างความสะดวกสบายด้วยการพิสูจน์และความแม่นยำทางคณิตศาสตร์เช่นเดียวกับหัวข้อเฉพาะในพื้นที่ ส่วนใหญ่เป็นเพียงความรู้ "พื้นฐาน" แต่บิตของมันกลับกลายเป็นว่ามีประโยชน์มาก ความสะดวกสบายกับการสรุปที่ไม่มีที่สิ้นสุด, พื้นฐานของกราฟ, combinatorics และการวิเคราะห์เชิงเส้นกำกับอาจเป็นส่วนที่เกี่ยวข้องโดยตรงที่สุด ผมชอบหนังสือซูซานนา Epp ของ

    • หลักสูตรหนึ่งหรือสองภาคเรียนในพีชคณิตเชิงเส้นซึ่งมีประโยชน์ในหลากหลายหัวข้อใน AI โดยเฉพาะอย่างยิ่งการเรียนรู้ของเครื่องและการทำเหมืองข้อมูล Lay & Layเป็นหนังสือที่ใช้ได้ แต่อาจไม่ใช่หนังสือที่ดีที่สุดแน่นอน Shilovเป็นคำแนะนำจาก Ian Goodfellow และคนอื่น ๆ แต่ฉันไม่ได้ลองด้วยตัวเอง

    • ความน่าจะเป็นของหลักสูตรและอาจเป็นหลักสูตรที่ทันสมัยในสถิติ (เช่นมีการเน้น Bayesian) หลักสูตรที่เก่ากว่าในสถิติหรือหนึ่งที่กำหนดเป้าหมายนักวิทยาศาสตร์สังคมไม่ได้มีประโยชน์มาก เพื่อนร่วมงานด้านสถิติของฉันกำลังใช้Lock5ในขณะนี้และมีประสบการณ์ที่ดีกับมัน

    • อย่างน้อยต่างกันและแคลคูลัสหนึ่งและโดยเฉพาะอย่างยิ่งอนุพันธ์ย่อยบางส่วนในแคลคูลัสเวกเตอร์ แต่บางทีทั้งหลักสูตร สิ่งนี้มีประโยชน์ในการปรับให้เหมาะสมการเรียนรู้ของเครื่องจักรและวิธีการทางเศรษฐศาสตร์ที่ใช้กับ AI สจ๊วตเป็นหนังสือเรียนที่พบมากที่สุด มันครอบคลุมและสามารถใช้สำหรับทั้งสามหลักสูตร แต่คำอธิบายไม่ได้ดีที่สุดเสมอไป ฉันยังคงแนะนำว่า

นั่นคือหัวข้อหลัก หากคุณไม่ได้นอกจากนี้ยังมีพื้นหลังแบบดั้งเดิมในการเขียนโปรแกรมแล้วแน่นอนในทฤษฎีกราฟและพื้นฐานของความซับซ้อน asymptotic หรือการออกแบบอัลกอริทึมและการวิเคราะห์อาจจะมีผลิตภัณฑ์เสริมอาหารที่ดี โดยปกติ AI'ers มักมาจากพื้นฐานทางวิทยาการคอมพิวเตอร์มาตรฐานซึ่งครอบคลุมทุกสิ่งเหล่านั้นได้เป็นอย่างดี


1
@FauChristian ฉันคิดว่าเรามีรายชื่อหัวข้อเดียวกัน: แคลคูลัสและคณิตศาสตร์ จำกัด แน่นอน เราทั้งคู่คิดว่าคุณควรเรียนสองสามครั้งในแต่ละครั้ง ฉันแสดงสถิติและความน่าจะเป็น ฉันคิดว่าถ้าคุณต้องการทำงานที่ทันสมัยใน AI คุณจะไม่ไปไกลขนาดนั้น คุณแสดงวิชาเคมีและประสาทวิทยาศาสตร์ ฉันคิดว่า AI'ers น้อยคนจะคิดว่าหัวข้อเหล่านั้นเป็นหัวข้อที่จำเป็น แน่นอนว่าคุณสามารถผ่าน Russell & Norvig ไปได้โดยไม่ต้องมี หากคุณต้องการทำงานในด้านประสาทวิทยาศาสตร์การคำนวณ (ไม่ใช่การเรียนรู้อย่างลึกซึ้ง) ก็อาจเป็นประโยชน์ได้ ฉันยังสงสัยว่าคุณต้องการเวลา 16 ปีในการมีส่วนร่วม 5-6 แน่นอน
John Doucette

1
@FauChristian นั่นเป็นความจริงทั้งหมด ฉันมักจะคิดว่าถ้าคุณต้องการทำวิจัยในห้องปฏิบัติการ AI สมัยใหม่ส่วนใหญ่คุณยังคงต้องมีความน่าจะเป็น (อย่างน้อยครึ่งหนึ่งของงาน AI สมัยใหม่คือการเรียนรู้ด้วยเครื่องจักรบางประเภทและส่วนใหญ่อยู่ในการเรียนรู้ลึก) . โดยทั่วไปแล้วกรณีที่นักศึกษาระดับบัณฑิตศึกษาทำงานวิจัย ส่วนใหญ่ทำงานวิจัยหลังจากเรียนจบเพียง 1-2 ปี บางส่วนมันค่อนข้างดี คนเหล่านี้มีการศึกษาอย่างเป็นทางการในเรื่องนี้เพียง 4-6 ปี ยิ่งไปกว่านั้นอาจทำให้คุณเร็วขึ้นหรือลึกลงไป แต่ศักยภาพในการทำวิจัยเริ่มต้นที่นั่น
John Doucette

3

สำหรับอัลกอริธึมอย่างง่ายเช่น Gradient Descent นั้นคุณต้องมีความเข้าใจในอนุพันธ์บางส่วน โดยเฉพาะถ้าคุณต้องการใช้โครงข่ายประสาทเทียม นอกจากนี้อัลกอริธึมส่วนใหญ่นั้นใช้เวกเตอร์เพื่อปรับปรุงความเร็วในการคำนวณดังนั้นคุณต้องคุ้นเคยกับคณิตศาสตร์เมทริกซ์ สิ่งนี้เกี่ยวข้องกับความรวดเร็วและสะดวกสบายกับมิติของเมทริกซ์ขนาดของผลิตภัณฑ์การคูณเมทริกซ์ทรานสโพสและอื่น ๆ บ่อยครั้งที่คุณอาจใช้เมทริกซ์แคลคูลัสเพื่อหาวิธีแก้ปัญหาที่เหมาะสมที่สุดดังนั้นผลลัพธ์บางอย่างจากพื้นที่นี้ควรทำ คุณต้องเข้าใจการวิเคราะห์ฟังก์ชั่น นี่เป็นสิ่งจำเป็นเพื่อให้ได้สัญชาตญาณในสิ่งที่ฟังก์ชั่นการเปิดใช้งานเช่น sigmoid และ tanh มีการบันทึก ความเข้าใจถึงความน่าจะเป็นและความคาดหวังก็มีประโยชน์เช่นกัน คุณควรมีความชัดเจนด้วยเวกเตอร์มุมฉากและผลิตภัณฑ์ภายใน

ที่ถูกกล่าวว่าฉันขอแนะนำให้คุณเข้าใจการดำเนินงานแคลคูลัสและเมทริกซ์ขั้นพื้นฐานและลองเรียนรู้แนวคิด AI หากคุณไม่สามารถคิดอะไรออกสำรวจคณิตศาสตร์

หมายเหตุ: นี่เป็นเพียงการเริ่มต้นเท่านั้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.