เครื่องเรียนรู้ตำราอาหาร / บัตรอ้างอิง / สูตรชีท?


57

ฉันค้นหาทรัพยากรเช่นตำราความน่าจะเป็นและสถิติและบัตรอ้างอิง R สำหรับการขุดข้อมูลมีประโยชน์อย่างเหลือเชื่อ เห็นได้ชัดว่าพวกเขาทำหน้าที่เป็นข้อมูลอ้างอิง แต่ยังช่วยฉันในการจัดระเบียบความคิดของฉันในเรื่องและได้รับการวางของแผ่นดิน

ถาม: มีสิ่งใดเช่นทรัพยากรเหล่านี้สำหรับวิธีการเรียนรู้ของเครื่องหรือไม่?

ฉันจินตนาการบัตรอ้างอิงซึ่งสำหรับวิธีการ ML แต่ละอันจะรวมถึง:

  • คุณสมบัติทั่วไป
  • เมื่อวิธีการทำงานได้ดี
  • เมื่อวิธีการทำไม่ดี
  • จากวิธีการใดหรือวิธีอื่นใดที่วิธีการทั่วไป มันถูกแทนที่ส่วนใหญ่?
  • เอกสารเชื้อเกี่ยวกับวิธีการ
  • ปัญหาเปิดที่เกี่ยวข้องกับวิธีการ
  • ความเข้มในการคำนวณ

ทุกสิ่งเหล่านี้สามารถพบได้ด้วยการขุดน้อยที่สุดผ่านตำราเรียนฉันแน่ใจ มันจะสะดวกจริง ๆ มีไว้ในไม่กี่หน้า


5
เป็นเป้าหมายที่ดี แต่ "การขุดตำราน้อยที่สุด" เราจะเริ่มอัดหนังสือทั้ง 20 เล่มนี้เพื่อการเรียนรู้เชิงสถิติและการขุดข้อมูลได้อย่างไร+ mloss.org/software/rating
เดนิส

2
อีกอันหนึ่ง: stats.stackexchange.com/questions/19311/…
steffen

2
(+1) สำหรับ chuzpa หากภาพรวมดังกล่าวมีอยู่ฉันจะจ่ายเงินให้ ปัญหาสำคัญคือนอกเหนือจากคุณสมบัติบางอย่างที่อาจได้มาจากอัลกอริธึมเองคุณสมบัติส่วนใหญ่หรือกฎของนิ้วโป้งนั้นได้มาจากประสบการณ์เช่นการใช้งาน ฉันค่อนข้างมั่นใจว่านักวิจัยประยุกต์ที่ใช้การต่อสู้หรือ ML-framework-programmer / ที่ปรึกษาสามารถเขียนอะไรอย่างนั้นได้ แต่ตอนนี้และตอนนี้
steffen

@Denis: ลิงก์ "20 หนังสือ .. " ไม่ทำงานคุณสามารถตรวจสอบสิ่งนี้ได้หรือไม่
lmsasu

6
ฉันไม่มีผู้เชี่ยวชาญด้านการเรียนรู้ของเครื่องจักรดังนั้นฉันจะเลื่อนเวลาให้ผู้อื่นโพสต์คำตอบ แต่ฉันคิดว่าองค์ประกอบของการเรียนรู้ทางสถิติถือเป็นข้อความที่ดีในหัวข้อและเขียนโดยชื่อที่ยิ่งใหญ่ที่สุดในฟิลด์ ฉันควรเพิ่มว่าหนังสือเล่มนี้เขียนในระดับสูงและผู้ที่ฉันเคยได้ยินแนะนำว่ามันมีปริญญาเอกในสถิติ
มาโคร

คำตอบ:


25

แหล่งข้อมูลที่ดีที่สุดและพร้อมใช้งานบางอย่างได้แก่ :

ตามคำถามของผู้เขียนฉันไม่พบโซลูชัน "ทั้งหมดในหน้าเดียว"


Sergey หนังสือของ Barber เชื่อมโยงกับ Matlab หรือไม่
เดนิส

2
ใช่เพียงดูที่ลิงก์ของหนังสือ: กล่อง BRMLtool มีไว้เพื่อช่วยให้ผู้อ่านเห็นว่าแบบจำลองทางคณิตศาสตร์แปลเป็นรหัส MAT-LAB จริงได้อย่างไร
Sergey

31

หากคุณต้องการที่จะเรียนรู้การเรียนรู้เครื่องผมขอแนะนำให้คุณลงทะเบียนเรียนในหลักสูตร ML ออนไลน์ฟรีในช่วงฤดูหนาวสอนโดยศาสตราจารย์แอนดรูอึ้ง

ฉันทำสิ่งก่อนหน้านี้ในฤดูใบไม้ร่วงและวัสดุการเรียนรู้ทั้งหมดนั้นมีคุณภาพยอดเยี่ยมและมุ่งเน้นไปที่การใช้งานจริงและง่ายขึ้นมากที่จะอ่านหนังสือเล่มเดียว

มันทำมาจากผลไม้ที่ค่อนข้างต่ำพร้อมคำอธิบายที่ใช้งานง่ายและคณิตศาสตร์ขั้นต่ำ


ฉันเพิ่งจบหลักสูตรนี้และมันยอดเยี่ยมมาก! อีกทั้งยังเป็นการเริ่มต้นที่ดีในการทำความเข้าใจหนังสือเกี่ยวกับการเรียนรู้ของเครื่อง
B เซเว่น

1
ฉันคิดว่าลิงก์นี้ในขณะนี้คือcoursera.org/course/ml
n611x007

14

ใช่คุณสบายดี "การจดจำรูปแบบและการเรียนรู้ของเครื่อง" ของ Christopher Bishop เป็นหนังสือที่ยอดเยี่ยมสำหรับการอ้างอิงทั่วไปคุณไม่สามารถผิดพลาดได้

หนังสือเล่มล่าสุดอย่างเป็นธรรม แต่ยังดีมากเขียนและกว้างเท่า ๆ กันคือ "เดวิดตัดผมเหตุผลเบส์และการเรียนรู้เครื่อง "; หนังสือที่ฉันรู้สึกว่าเหมาะสมกว่าสำหรับผู้มาใหม่ในสาขานี้เล็กน้อย

ฉันใช้ "องค์ประกอบของการเรียนรู้เชิงสถิติ" จาก Hastie และคณะ (กล่าวถึงมาโคร) และในขณะที่หนังสือที่แข็งแกร่งมากฉันไม่แนะนำให้ใช้เป็นข้อมูลอ้างอิงแรก บางทีมันอาจจะให้บริการคุณดีขึ้นเป็นข้อมูลอ้างอิงที่สองสำหรับหัวข้อพิเศษเพิ่มเติม ในแง่มุมนั้นหนังสือของ David MacKay, ทฤษฎีข้อมูล, การอนุมานและอัลกอริทึมการเรียนรู้สามารถทำงานได้อย่างยอดเยี่ยม


2
+1 สำหรับบิชอป การพัฒนาที่ชัดเจนพร้อมรายละเอียดในระดับที่เท่าเทียมกัน ในขณะที่ยังดีฉันพบ Hastie และคณะ ขาด ๆ หาย ๆ
conjugateprior

1
+1 - Hastie, Tibshirani และ Friedman เป็นรายการโปรดส่วนตัวของฉัน
StasK

1
+1 เช่นกันสำหรับการแนะนำ Hastie, Tibshirani และ Friedman รายการโปรดส่วนตัวของฉันเช่นกัน และขอบคุณสำหรับคำแนะนำอื่น ๆ ; ฉันจะให้พวกเขาอ่านเพราะฉันต้องการหนังสือที่ดีจริงๆเพื่อแนะนำให้ผู้ที่ไม่ใช่นักสถิติ (หรือบุคคลที่เพิ่งเข้ามาในสนาม)
Néstor

1
+1 สำหรับบิชอป ที่จริงแล้วมันก็เป็นแหล่งที่ดีสำหรับสถิติแบบดั้งเดิมเช่นกัน แต่ได้รับการปรับปรุงและซ่อนเร้น
คาดเดา

10

เนื่องจากฉันทามติดูเหมือนว่าคำถามนี้จะไม่ซ้ำกันฉันต้องการแบ่งปันรายการโปรดของฉันสำหรับผู้เริ่มต้นใช้งานเครื่อง:

ฉันพบว่าProgramming Collective Intelligenceเป็นหนังสือที่ง่ายที่สุดสำหรับผู้เริ่มต้นเนื่องจากผู้เขียนToby Segaranมุ่งเน้นไปที่การอนุญาตให้ผู้พัฒนาซอฟต์แวร์มีเดียยอมให้มือของเขา / เธอสกปรกด้วยการแฮ็คข้อมูลโดยเร็วที่สุด

บททั่วไป: ปัญหาข้อมูลได้รับการอธิบายอย่างชัดเจนแล้วตามด้วยคำอธิบายคร่าวๆเกี่ยวกับวิธีการทำงานของอัลกอริทึมและในที่สุดก็แสดงวิธีสร้างข้อมูลเชิงลึกด้วยรหัสเพียงไม่กี่บรรทัด

การใช้งานของหลามช่วยให้คนหนึ่งเข้าใจทุกอย่างค่อนข้างเร็ว (คุณไม่จำเป็นต้องรู้ว่าหลามอย่างจริงจังฉันไม่เคยรู้จักมาก่อนเช่นกัน) อย่าคิดว่าหนังสือเล่มนี้มุ่งเน้นไปที่การสร้างระบบผู้แนะนำเท่านั้น นอกจากนี้ยังเกี่ยวกับการทำเหมืองข้อความ / การกรองสแปม / การเพิ่มประสิทธิภาพ / การจัดกลุ่ม / การตรวจสอบความถูกต้องเป็นต้นซึ่งจะช่วยให้คุณเห็นภาพรวมที่ประณีตกว่าเครื่องมือพื้นฐานของเครื่องมือขุดข้อมูลทุกตัว


6

Witten and Frank "Data Mining", Elsevier 2005 เป็นหนังสือที่ดีสำหรับการเรียนรู้ด้วยตนเองเนื่องจากมีห้องสมุด Java ของรหัส (Weka) ที่จะไปกับหนังสือเล่มนี้และมุ่งเน้นในทางปฏิบัติ ฉันสงสัยว่าจะมีฉบับที่ใหม่กว่าฉบับที่ฉันมี


1
ใช่หนังสือเล่มนี้จะถูกเรียกว่า "การเรียนรู้ของเครื่องจักร" แต่เปลี่ยนชื่อเป็น "การทำเหมืองข้อมูล" โดยผู้จัดพิมพ์เพื่อนั่งบน hype การทำเหมืองข้อมูลในเวลานั้นอย่างไรก็ตามหนังสือเล่มนี้เกี่ยวกับ ML ไม่ใช่ DM (ทั้งสองเหมือนกัน แต่มีฟิลด์ต่างกัน!)
clyfe

1
หนังสือ "การเรียนรู้ของเครื่องจักร" ของทอมมิทเชลก็ดีมากเช่นกัน สไตล์ค่อนข้างล้าสมัย แต่เนื้อหานั้นยอดเยี่ยม
Dikran Marsupial

ใช่ทอมมิทเชล ML เป็นเหมือนพระคัมภีร์ ML ซึ่งครอบคลุมจริง ๆ ในสนาม!
clyfe

5

ฉันมีการเรียนรู้ของเครื่อง: มุมมองอัลกอริทึมโดย Stephen Marsland และพบว่ามีประโยชน์มากสำหรับการเรียนรู้ด้วยตนเอง รหัสหลามจะได้รับตลอดทั้งเล่ม

ฉันเห็นด้วยกับสิ่งที่กล่าวในการตรวจสอบที่ดีนี้:

http://blog.rtwilson.com/review-machine-learning-an-algorithmic-perspective-by-stephen-marsland/


5

"องค์ประกอบของการเรียนรู้ทางสถิติ" จะเป็นหนังสือที่ดีสำหรับวัตถุประสงค์ของคุณ หนังสือเล่มที่ 5 ซึ่งตีพิมพ์เมื่อต้นปี 2554 สามารถอ่านได้ที่http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf


2
มันเป็นหนังสือหนักคณิตศาสตร์ดังนั้นมันอาจเป็นเรื่องยากสำหรับผู้เรียนด้วยตนเองในการติดตาม
Atilla Ozgur

คุณรู้ไหมว่ามันดาวน์โหลดได้อย่างอิสระบนหน้าส่วนตัวของ Trevor Hastie เมื่อ Springer คิดค่าใช้จ่าย 70 $ หรือไม่?
อัลเฟรดเอ็ม

ฉันไม่รู้แน่ชัด แต่ฉันจินตนาการว่าสปริงเกอร์ต้องการเงินและผู้แต่งส่วนใหญ่ต้องการเผยแพร่หนังสือของพวกเขาอย่างกว้างขวาง ดูเหมือนว่าคล้ายกันมากกับวิธีที่ Springer จะขายบทความที่ตีพิมพ์ให้คุณในขณะที่ "รุ่นกระดาษทำงาน" จำนวนมากมีให้บริการฟรีบนเว็บไซต์ของผู้เขียน
DanB

FYI การดาวน์โหลดสำหรับการพิมพ์ครั้งที่ 5 ของรุ่นที่สอง ฉันรักเชิงอรรถของ eipgraph "ในพระเจ้าที่เราไว้วางใจคนอื่น ๆ ทั้งหมดนำข้อมูล" ซึ่งมีสาเหตุมาจาก Deming เชิงอรรถชี้ให้เห็นถึงการประชดว่าไม่มี "ข้อมูล" ที่สามารถยืนยันได้ว่าเดมิงกำลังพูดสิ่งนี้
HeatfanJohn

คุณควรพูดถึงการแนะนำการเรียนรู้เชิงสถิติด้วย R -มันเป็นเหมือนESL -lite ของพวกเขา(ถ้าคณิตศาสตร์ในESLนั้นน่ากลัวเกินไป)
Steve S

5

ป้อนคำอธิบายรูปภาพที่นี่

บ่อยครั้งที่ส่วนที่ยากที่สุดในการแก้ปัญหาการเรียนรู้ด้วยเครื่องสามารถหาตัวประมาณที่เหมาะสมสำหรับงานได้ ตัวประมาณที่แตกต่างกันนั้นเหมาะสมกว่าสำหรับข้อมูลประเภทต่างๆและปัญหาที่แตกต่างกัน ผังงานด้านล่างนี้ได้รับการออกแบบมาเพื่อให้ผู้ใช้ทราบแนวทางคร่าวๆเกี่ยวกับวิธีการแก้ไขปัญหาเกี่ยวกับตัวประมาณที่จะลองใช้ข้อมูลของคุณ คลิกที่ตัวประมาณค่าใด ๆ ในแผนภูมิด้านล่างเพื่อดูเอกสารประกอบ



3

หนังสือส่วนใหญ่ที่กล่าวถึงในคำตอบอื่น ๆ นั้นดีมากและคุณจะไม่ผิดกับหนังสือเล่มใดเลย นอกจากนี้ฉันพบว่าแผ่นโกงต่อไปนี้สำหรับ Python scikit-learnค่อนข้างมีประโยชน์


2

ฉันชอบ Duda, Hart และนกกระสา "การจำแนกรูปแบบ" นี่คือการแก้ไขข้อความคลาสสิกเมื่อเร็ว ๆ นี้ซึ่งอธิบายทุกอย่างได้ดีมาก ไม่แน่ใจว่าได้รับการอัปเดตเพื่อให้ครอบคลุมเครือข่ายประสาทและ SVM มาก หนังสือโดย Hastie, Tibshirani และ Friedman เป็นหนังสือที่ดีที่สุด แต่อาจมีเทคนิคมากกว่าสิ่งที่คุณกำลังมองหาและมีรายละเอียดมากกว่าภาพรวมของหัวเรื่อง


2

Microsoft Azure ยังมีเอกสารที่คล้ายกันกับ scikit- เรียนรู้หนึ่งโพสต์โดย Anton Tarasenko

เอกสารสูตรคำนวณอัลกอริทึมการเรียนรู้ของ Microsoft Azure

(ที่มา: https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet )

พวกเขามาพร้อมกับประกาศ:

คำแนะนำที่นำเสนอในแผ่นงานโกงอัลกอริทึมนี้เป็นกฎโดยประมาณของนิ้วหัวแม่มือ บางคนอาจงอและบางคนอาจถูกละเมิดอย่างชัดแจ้ง นี่คือจุดประสงค์เพื่อแนะนำจุดเริ่มต้น ( ... )

Microsoft ให้บทความเพิ่มเติมเบื้องต้นซึ่งให้รายละเอียดเพิ่มเติม

โปรดสังเกตว่าวัสดุเหล่านั้นมุ่งเน้นไปที่วิธีการนำไปใช้ใน Microsoft Azure


1

อย่าเริ่มต้นด้วยองค์ประกอบของการเรียนรู้ทางสถิติ มันยอดเยี่ยม แต่เป็นหนังสืออ้างอิงที่ไม่เหมือนสิ่งที่คุณกำลังมองหา ฉันจะเริ่มต้นด้วย Programming Collective Intelligence เพราะมันอ่านง่าย


ฉันไม่แน่ใจว่าฉันจะอธิบายลักษณะ ESL เป็นข้อความอ้างอิง ดูเหมือนว่าฉันจะเห็นภาพรวมมากกว่านี้เช่นคุณจะไม่ได้เรียนรู้รายละเอียดเล็ก ๆ น้อย ๆ ของอะไรเลย คุณจะเห็นเทคนิคในวงกว้างและชุดรูปแบบที่ครอบคลุม
พระคาร์ดินัล

1

สำหรับหนังสือเล่มแรกเกี่ยวกับการเรียนรู้ของเครื่องซึ่งทำได้ดีในการอธิบายหลักการฉันขอแนะนำอย่างยิ่ง

Rogers and Girolami หลักสูตรแรกในการเรียนรู้ของเครื่อง (Chapman & Hall / CRC Machine Learning & การจดจำรูปแบบ), 2011

หนังสือของ Chris Bishop หรือทั้งคู่ของ David Barber เลือกได้ดีสำหรับหนังสือที่มีความกว้างมากกว่าเดิมเมื่อคุณเข้าใจหลักการได้ดี



0

ตรวจสอบการเชื่อมโยงนี้เนื้อเรื่องฟรี ebooks บางอย่างเกี่ยวกับการเรียนรู้เครื่อง: http://designimag.com/best-free-machine-learning-ebooks/ มันอาจมีประโยชน์สำหรับคุณ


0

cheatsheet ดีเป็นหนึ่งในหนังสือแม็กซ์ Kuhn การสร้างแบบจำลองทำนายสมัครแล้ว ในหนังสือมีตารางสรุปที่ดีของโมเดลการเรียนรู้ ML หลายแบบ ตารางอยู่ในภาคผนวก A หน้า 549

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.