หนังสือสำหรับอ่านก่อนองค์ประกอบของการเรียนรู้ทางสถิติ?


50

จากโพสต์นี้ฉันต้องการแยกย่อยองค์ประกอบของการเรียนรู้ทางสถิติ โชคดีมีให้ฟรีและฉันเริ่มอ่านมัน

ฉันไม่มีความรู้เพียงพอที่จะเข้าใจ คุณช่วยแนะนำหนังสือที่แนะนำหัวข้อในหนังสือได้ดีขึ้นหรือไม่? หวังว่าสิ่งที่จะให้ความรู้ที่จำเป็นในการเข้าใจมัน?

ที่เกี่ยวข้อง:

ภูมิหลังที่แข็งแกร่งในวิชาคณิตศาสตร์เป็นสิ่งจำเป็นสำหรับ ML หรือไม่?


12
ฉันพบว่าพีชคณิตเชิงเส้นของ Strang และแอปพลิเคชั่นของ Strang นั้นมีประโยชน์อย่างมากในการทำความเข้าใจกับการปรับเปลี่ยนเมทริกซ์ซึ่งเป็นองค์ประกอบส่วนใหญ่
richiemorrisroe

คำตอบ:


18

ฉันซื้อ แต่ยังไม่ได้อ่าน

S. Marsland, การเรียนรู้ของเครื่อง: มุมมองอัลกอริทึม , Chapman & Hall, 2009

อย่างไรก็ตามความคิดเห็นนั้นดีและระบุว่าเหมาะสำหรับผู้เริ่มต้นมากกว่าหนังสือ ML อื่น ๆ ที่มีความลึกมากกว่า การพลิกหน้ากระดาษมันดูดีสำหรับฉันเพราะฉันมีพื้นฐานทางคณิตศาสตร์น้อย


ดูดี - เข้าถึงได้มาก
B เซเว่น

ฉันดาวน์โหลดและอ่าน "ตัวอย่าง" - ทั้งหมด 19 หน้า (ว้าว) มันง่ายกว่าที่จะเข้าใจมากกว่าองค์ประกอบของการเรียนรู้ทางสถิติ ดูเหมือนจะเป็นสิ่งที่ฉันกำลังมองหาอย่างแน่นอน ขอบคุณ
B เซเว่น

4
ฉันได้แก้ไขคำถามของคุณเพื่อให้มีการอ้างอิงสำหรับหนังสือ โดยทั่วไปแล้วการใส่คำว่า "ฉันชอบสิ่งนี้ " ในคำตอบนั้นไม่ได้รับการสนับสนุนเพราะหากการเชื่อมโยงขาดหายไปจะไม่มีใครรู้ว่า "อันนี้" หมายถึงอะไร ไชโย
พระคาร์ดินัล

ฉันเพิ่งได้รับสิ่งนี้และเริ่มอ่านมัน (75 หน้าแรก) มันเจ๋งนะ. ง่ายต่อการเข้าใจ แต่มีรายละเอียดเพียงพอที่จะใช้งานได้จริงและมีประโยชน์ ขอแนะนำสำหรับทุกคนที่ต้องการใช้การเรียนรู้ของเครื่อง สิ่งที่ฉันกำลังมองหา ขอบคุณ!
B Seven

39

ผู้เขียนองค์ประกอบการเรียนรู้ทางสถิติออกมาพร้อมกับหนังสือเล่มใหม่ (ส.ค. 2013) มุ่งเป้าไปที่ผู้ใช้ที่ไม่มีพื้นฐานด้านคณิตศาสตร์อย่างหนัก บทนำของการเรียนรู้เชิงสถิติ: กับการใช้งานใน R

รุ่น PDF ฟรีของหนังสือเล่มนี้ปัจจุบันสามารถพบได้ที่นี่


ฉันจะแนะนำสิ่งนี้นับตั้งแต่เปิดตัวเมื่อเร็ว ๆ นี้และมีความเกี่ยวข้องอย่างมากกับข้อความวัตถุประสงค์ของโปสเตอร์ คำแนะนำที่ดี
Chris Simokat

3
ยังดีกว่าผู้เขียนได้ประกาศว่าไฟล์ PDF ออนไลน์ฟรีของหนังสือเล่มนี้จะสามารถใช้ได้ตั้งแต่เดือนมกราคม 2013 (มันถูกใช้ใน MOOC ที่พวกเขากำลังทำงานอยู่)
Flounderer

16

ฉันพบว่าการเขียนโปรแกรม Collective Intelligenceเป็นหนังสือที่ง่ายที่สุดสำหรับผู้เริ่มต้นเนื่องจากผู้เขียน Toby Segaran มุ่งเน้นที่การอนุญาตให้ผู้พัฒนาซอฟต์แวร์มีเดียยอมให้มือของเขา / เธอสกปรกด้วยการแฮ็คข้อมูลโดยเร็วที่สุด

บททั่วไป: ปัญหาข้อมูลได้รับการอธิบายอย่างชัดเจนแล้วตามด้วยคำอธิบายคร่าวๆเกี่ยวกับวิธีการทำงานของอัลกอริทึมและในที่สุดก็แสดงวิธีสร้างข้อมูลเชิงลึกด้วยรหัสเพียงไม่กี่บรรทัด

การใช้งานของหลามช่วยให้คนหนึ่งเข้าใจทุกอย่างค่อนข้างเร็ว (คุณไม่จำเป็นต้องรู้ว่าหลามอย่างจริงจังฉันไม่เคยรู้จักมาก่อนเช่นกัน) อย่าคิดว่าหนังสือเล่มนี้มุ่งเน้นไปที่การสร้างระบบผู้แนะนำเท่านั้น นอกจากนี้ยังเกี่ยวกับการทำเหมืองข้อความ / การกรองสแปม / การเพิ่มประสิทธิภาพ / การจัดกลุ่ม / การตรวจสอบความถูกต้องเป็นต้นซึ่งจะช่วยให้คุณเห็นภาพรวมที่ประณีตกว่าเครื่องมือพื้นฐานของเครื่องมือขุดข้อมูลทุกตัว

บทที่ 10 จะเกี่ยวข้องกับข้อมูลตลาดหุ้น แต่การโฟกัสไม่ได้อยู่ที่การทำเหมืองข้อมูลอนุกรมเวลา อาจเป็นข้อเสียเปรียบเพียงอย่างเดียว (สำหรับคุณ) ของหนังสือที่ยอดเยี่ยมนี้


มันมีอยู่ในซาฟารีหนังสือออนไลน์safaribooksonline.com ขอบคุณ
B เซเว่น

1
รับหนังสือเล่มนี้และเริ่มทำงานกับมัน มันเป็นจริงมาก ใน 18 หน้าแรกคุณจะใช้เอ็นจิ้นการแนะนำที่สมบูรณ์ (ขั้นพื้นฐาน)
B เซเว่น

ว้าวหนังสือเล่มนี้เหลือเชื่อจริงๆ มันสอนวิธีการใช้งานอัลกอริทึมการเรียนรู้ทุกประเภทด้วยรหัส Python เพียงเล็กน้อย หนึ่งในหนังสือที่ใช้งานได้จริงที่สุด ข้อเสียเปรียบเพียงอย่างเดียวคือ Python ได้รับการอัปเดตตั้งแต่หนังสือถูกตีพิมพ์ นอกจากนี้ยังใช้ API จำนวนมากซึ่งมีการเปลี่ยนแปลงด้วย ดังนั้นฉันไม่คิดว่าตัวอย่างจะทำงานได้หากไม่มีการปรับแต่ง
B Seven

@ ทั้งเจ็ดขอบคุณนะไม่รู้ว่า ฉันไม่แน่ใจว่าฉันชอบหนังสือที่ใช้ไลบรารี่ที่มีอยู่แล้ว (ซึ่งโดยทั่วไปแล้วเป็นสิ่งที่ควร) หรือรหัสของตัวเอง (ซึ่งใช้ได้กับตัวอย่างหนังสือทั้งหมด แต่อาจมีความทนทานน้อยลงเนื่องจากผู้ใช้น้อยกว่า)
steffen

1
ฉันคิดว่าทุกวันนี้ทางเลือกเดียวคือห้องสมุดที่มีอยู่แล้ว พวกมันแพร่หลายใช้งานง่ายข้ามแพลตฟอร์มหลายภาษาและรวดเร็ว นอกจากนั้นหากหนังสือมีรหัสของตัวเองมันก็ยากที่จะแก้ไข ง่ายกว่าในการแก้ไขการโทรไปยังห้องสมุด ขอบคุณสำหรับคำแนะนำ มันเป็นทรัพยากรที่ยอดเยี่ยม
B เซเว่น

12

รู้เบื้องต้นเกี่ยวกับการเรียนรู้ของเครื่องโดย E. Alpaydin (MIT Press, 2010, 2nd ed.) ครอบคลุมหัวข้อมากมายพร้อมภาพประกอบที่ดี (เหมือนกับการจดจำรูปแบบของ Bishopและการเรียนรู้ของเครื่อง )

นอกจากนี้แอนดรูวมัวร์มีบทเรียนที่ดีบางอย่างเกี่ยวกับสถิติการทำเหมืองข้อมูล


(+1) ไม่ทราบว่าหนังสือ แต่บทเรียนของแอนดรูมัวร์ที่ดี (และแม้กระทั่งความบันเทิงบางครั้ง)
เตฟเฟน


1
+1 Alpaydin เป็นวิธีที่ถูกต้อง ฉันอยู่ในสถานการณ์เดียวกันกับ OP เมื่อไม่กี่เดือนที่ผ่านมา การดิ้นรนอย่างไม่ดีกับ Tibshirani และจากนั้นก็ข้าม Alpaydin และสิ่งต่าง ๆ ได้ดีขึ้นตั้งแต่ ในที่สุดแม้ว่าฉันคิดว่า Tibshirani จะต้องอ่าน
แอนดี้

10

อาจจะเป็นที่สนใจของสถิติทั้งหมดของ Wasserman คุณสามารถสุ่มตัวอย่างหนังสือจากลิงก์ที่ให้ไว้ - และเพียงไม่กี่ย่อหน้าแรกของคำนำหน้าทำการขายอย่างหนักในตลาดของคุณ - และคุณสามารถดาวน์โหลดหนังสือเล่มนี้ได้ฟรีผ่าน Springer หากคุณเชื่อมโยงกับมหาวิทยาลัย

แก้ไข:โอ๊ะไม่ได้สังเกตว่าข้อความนี้มีความโบราณเพียงใด


5
ไม่สำคัญการแนะนำใหม่ยังคงมีประโยชน์สำหรับคนอื่น ๆ ที่อ่านเธรด (เช่นฉัน; o)
Dikran Marsupial

1
หนังสือยอดเยี่ยม แต่ในความเป็นธรรมหากสามารถอ่านและทำความเข้าใจกับสถิติทั้งหมดส่วนที่ดีของESLนั้นซ้ำซ้อน
usεr11852พูดว่า Reinstate Monic

7

องค์ประกอบของการเรียนรู้ทางสถิติอาจเป็นการอ่านที่ยากลำบากโดยเฉพาะอย่างยิ่งสำหรับผู้เรียนด้วยตนเอง ขณะที่การค้นหาคำอธิบายบางอย่างในบทที่สองผมได้สะดุดในทรัพยากรต่อไปนี้: https://waxworksmath.com/Authors/G_M/Hastie/WriteUp/Weatherwax_Epstein_Hastie_Solution_Manual.pdf มันมีคำอธิบายประกอบและคำอธิบายมากกว่า 100 หน้าซึ่งจะอธิบายช่วงเวลาที่ซับซ้อนของหนังสือ แหล่งข้อมูลที่ดีสำหรับทุกคนที่อ่านหนังสือเล่มนี้ ข้อความเสริมนี้รวมถึงวิธีแก้ปัญหาสำหรับการออกกำลังกาย


5

ฉันขอแนะนำหลักสูตรแรกในการเรียนรู้ของเครื่องโดย Rogers และ Girolami มันครอบคลุมความคิดที่สำคัญในลำดับที่สมเหตุสมผลมากพร้อมด้วยตัวอย่างที่ดีและระดับคณิตศาสตร์ขั้นต่ำที่จะมีพื้นฐานที่เหมาะสมในพื้นฐาน มันไม่มีขอบเขตที่ครอบคลุมของหนังสือบางเล่ม แต่นั่นเป็นเหตุผลว่าทำไมมันถึงดีในฐานะที่เป็นข้อความเกริ่นนำ


ดูเหมือนหนังสือเล่มแรกที่ดี และมีรุ่น Kindle
B เซเว่น

3

หนังสืออีกเล่มที่น่าสนใจมากคือการใช้เหตุผลแบบเบย์และการเรียนรู้ของเครื่องโดย David Barber หนังสือเล่มนี้มีให้ดาวน์โหลดฟรีจากเว็บไซต์ของผู้แต่ง: http://www.cs.ucl.ac.uk/staff/d.barber/brml/

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.