ตำราเรียนเกี่ยวกับทฤษฎี * ของอัลกอริทึมโครงข่ายประสาท / ML?


23

หนังสือทุกเล่มที่ฉันได้เห็นแล้วอธิบายเกี่ยวกับอัลกอริธึม ML และวิธีการนำไปใช้

มีตำราเรียนที่สร้างทฤษฎีและบทพิสูจน์สำหรับพฤติกรรมของอัลกอริทึมเหล่านั้นหรือไม่? เช่นระบุว่าภายใต้เงื่อนไข , การไล่ระดับสีจะนำไปสู่A , B , C ?x,Y,ZA,B,C


1
มีคู่ของข้อเสนอแนะที่เป็นคำถามของฉันที่นี่ โดยเฉพาะคุณอาจสนุกกับหนังสือที่ฉันแนะนำในคำตอบที่นั่น
Jack M

หนังสือเรียนการปรับให้เหมาะสมจำนวนมากให้การพิสูจน์การลู่เข้าสำหรับอัลกอริทึมการเพิ่มประสิทธิภาพ (เราจำเป็นต้องตรวจสอบอย่างรอบคอบว่าสมมติฐานของทฤษฎีการบรรจบกันเหล่านี้มีความพึงพอใจก่อนที่เราจะสรุปข้อสรุปที่แน่นอนว่าอัลกอริทึมของเรารับประกันว่าจะมาบรรจบกัน)
littleO

คำตอบ:


16

รากฐานของการเรียนรู้ของเครื่องโดย Mehryar Mohri, Afshin Rostamizadeh และ Ameet Talwalkar เป็นหนังสือ 2012 เกี่ยวกับทฤษฎีการเรียนรู้ของเครื่อง

การทำความเข้าใจการเรียนรู้ของเครื่อง: จากทฤษฎีไปจนถึงอัลกอริทึมโดย Shai Shalev-Shwartz และ Shai Ben-David เป็นหนังสือที่คล้ายกันในปี 2014 ที่ค่อนข้างเป็นที่รู้จักและตั้งเป้าหมายเบื้องต้นมากกว่า Mohri / Rostamizadeh / Talwalkar มัน. มันออนไลน์ได้อย่างอิสระ

การเรียนรู้โครงข่ายประสาทเทียม: รากฐานทางทฤษฎีโดยมาร์ตินแอนโธนีและปีเตอร์บาร์ตเลตต์เป็นหนังสือปี 1999 เกี่ยวกับทฤษฎี ML ที่เป็นวลีเกี่ยวกับเครือข่ายประสาท แต่ (ความประทับใจของฉันที่ไม่ได้อ่าน)

หนังสือสามเล่มเหล่านี้ส่วนใหญ่ใช้มุมมองที่โดดเด่นของทฤษฎีการเรียนรู้ทางสถิติ นอกจากนี้ยังมีมุมมองที่น่าสนใจที่เรียกว่าทฤษฎีการเรียนรู้คอมพิวเตอร์ซึ่งได้รับแรงบันดาลใจจากทฤษฎีวิทยาศาสตร์คอมพิวเตอร์ ฉันคิดว่าหนังสือเกริ่นนำมาตรฐานในบริเวณนี้คือทฤษฎีการเรียนรู้เบื้องต้นเกี่ยวกับการคำนวณ , หนังสือปี 1994 โดย Michael Kearns และ Umesh Vazirani

อีกหนังสือมีอิสระที่ดีเยี่ยมและผู้ทรงแนะนำคือเทรเวอร์ Hastie, โรเบิร์ตทิบชิรา นี และเจอโรมฟรีดแมน 2009 รุ่นที่สองขององค์ประกอบของการเรียนรู้ทางสถิติ มันอาจเป็นทฤษฎีน้อยกว่าคนอื่น ๆ และจากมุมมองของนักสถิติมากกว่าผู้เรียนรู้เครื่อง แต่ก็ยังมีความสนใจมากมาย

นอกจากนี้หากคุณสนใจเกี่ยวกับการไล่ระดับสีโดยเฉพาะการอ้างอิงมาตรฐานคือการปรับให้เหมาะสมของนูนโดย Stephen Boyd และ Lieven Vandenberghe หนังสือเล่มนี้เปิดให้ใช้งานในปี 2004 ทางออนไลน์ฟรี

ไม่มีหนังสือเหล่านี้มากมายที่มีทฤษฎีสมัยใหม่เกี่ยวกับเครือข่ายที่ลึกล้ำถ้านั่นคือสิ่งที่คุณสนใจ (ตัวอย่างเช่นทฤษฎีการหาค่าเหมาะที่สุดส่วนใหญ่จะเกี่ยวกับกรณีนูนซึ่งเครือข่ายเชิงลึกไม่ได้ตัดสินใจ) นั่นเป็นเพราะทฤษฎีนี้ใหม่มาก ผลลัพธ์ส่วนใหญ่มาในช่วงไม่กี่ปีที่ผ่านมาเท่านั้น แต่ในภาพรวมของความเข้าใจพื้นฐานของสนามจนถึงตอนนี้พวกเขาคนใดคนหนึ่งจะทำให้คุณเข้าใจเอกสารที่ใช้ในการทำงานได้ดี (ยกเว้น Kearns / Vazirani ซึ่งเน้นการวิเคราะห์ในแง่มุมต่าง ๆ ที่ฉันมี m ไม่แน่ใจว่าได้ถูกนำไปใช้กับเครือข่ายที่ลึก - แต่)


การทำความเข้าใจการเรียนรู้ของเครื่องสามารถใช้งานออนไลน์ได้จากหน้าเว็บของผู้เขียนคนหนึ่ง
Jakub Bartczuk

2

การเรียนรู้ของเครื่อง: มุมมองความน่าจะเป็นโดยเควินพีเมอร์ฟีอธิบายทฤษฎีมากมายจากมุมมองแบบเบย์ (ฉันใช้เพื่อการถดถอยโลจิสติกส์เท่านั้น แต่ฉันคิดว่ามันค่อนข้างดี) หนังสือทั้งเล่มออนไลน์ในรูปแบบ PDF โดยค้นหาใน Google


2
  • การเรียนรู้ลึก (Adaptive การคำนวณและการเรียนรู้ชุดเครื่อง) นี้ถูกเขียนโดยเอียน Goodfellow, โยชัวเบนจิโอแอรอน Courville ตามข้อตกลงของผู้แต่งกับ MIT Press คุณสามารถอ่านสำเนาที่ถูกต้องตามกฎหมายที่มีอยู่บนเบราว์เซอร์ในเว็บไซต์นี้ www.deeplearningbook.orgสิ่งนี้เป็นสิ่งที่ดีสำหรับคณิตศาสตร์และทฤษฎีบริสุทธิ์ของโครงข่ายประสาทและสาขาย่อยที่แตกต่างกัน

นอกเหนือไปจากนี้,

  • องค์ประกอบของการเรียนรู้ทางสถิติ: การทำเหมืองข้อมูลการอนุมานและการทำนายยังเป็นหนังสือที่ดีในการสร้างรากฐานทางทฤษฎีและคณิตศาสตร์ในการเรียนรู้ด้วยเครื่องแบบดั้งเดิม สิ่งนี้เขียนโดยTrevor Hastie, Robert Tibshirani และ Jerome Friedmanและมีให้บริการฟรีโดยผู้เขียนที่https://web.stanford.edu/~hastie/ElemStatLearn/

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.