จะเริ่มอ่านเกี่ยวกับ data mining ได้อย่างไร?


14

ฉันเป็นสามเณรที่จะเริ่มอ่านเกี่ยวกับการขุดข้อมูล ฉันมีความรู้พื้นฐานเกี่ยวกับ AI และสถิติ เนื่องจากหลายคนกล่าวว่าการเรียนรู้ของเครื่องจักรก็มีบทบาทสำคัญในการขุดข้อมูลด้วยเช่นกันจำเป็นต้องอ่านเกี่ยวกับการเรียนรู้ของเครื่องก่อนที่ฉันจะสามารถทำการขุดข้อมูลได้หรือไม่?


1
การขุดข้อมูล: แนวคิดและเทคนิคโดย Jiawei Han เป็นการเริ่มต้นที่ดี
aaronjg

คำตอบ:


12

อยู่ในตำแหน่งนี้ด้วยตัวเองฉันจะพยายามให้ความเข้าใจ

ประการแรกดาวน์โหลดองค์ประกอบของการเรียนรู้ทางสถิติ มันสันนิษฐานแคลคูลัสและพีชคณิตเชิงเส้นและแม้ว่ามันจะเป็นเทคนิคมาก แต่ก็ยังเขียนได้ดีมาก

ประการที่สอง (หรือประการแรก) ดูบทเรียนของ Andrew Ng เกี่ยวกับการเรียนรู้ของเครื่อง

สามรับข้อมูลและเริ่มพยายามวิเคราะห์ข้อมูล คุณจะต้องแบ่งออกเป็นชุดฝึกอบรมและชุดทดสอบจากนั้นสร้างแบบจำลองในชุดฝึกอบรมและทดสอบกับชุดทดสอบ ฉันพบชุดอักขระคาเร็ตสำหรับ R มีประโยชน์มากสำหรับสิ่งนี้ทั้งหมด หลังจากนั้นให้ฝึกฝนฝึกฝนฝึกฝน (เหมือนเกือบทุกอย่าง)


1
คุณจะทำให้คนจนแตกตื่นไปตลอดกาล!
Neil McGuigan

หลักสูตรของ Andew Ng จะ 'เสนอให้ฟรีและออนไลน์' สู่โลกกว้างของนักเรียนในช่วงฤดูใบไม้ร่วง 2011 ตามml-class.org
Andre Holzner

5

รู้เบื้องต้นเกี่ยวกับการขุดข้อมูลโดย Tan, Steinbech, Kumar เป็นหนังสือแนะนำเบื้องต้นที่ดีที่สุด

http://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367

บันทึก EoSL เมื่อคุณต้องการที่จะขุดลึกลงไป มันเป็นข้อมูลอ้างอิงมากกว่า


4

การทำเหมืองข้อมูลสามารถอธิบายหรือพยากรณ์

ในอีกด้านหนึ่งถ้าคุณสนใจในการขุดข้อมูลเชิงพรรณนาการเรียนรู้ด้วยเครื่องก็ไม่ได้ช่วยอะไร

ในทางตรงกันข้ามหากคุณสนใจการทำเหมืองข้อมูลแบบคาดการณ์การเรียนรู้ของเครื่องจะช่วยให้คุณเข้าใจว่าคุณพยายามลดความเสี่ยงที่ไม่รู้จัก (ความคาดหวังของฟังก์ชั่นการสูญเสีย) เมื่อลดความเสี่ยงเชิงประจักษ์: ข้อผิดพลาดและการตรวจสอบข้าม ตัวอย่างเช่นสำหรับเรื่องของความมั่นคง -NN สำหรับตัวอย่างการฝึกอบรมของขนาดควรเป็นเช่นนั้น:nkn

  • nkไปที่อินฟินิตี้เมื่อไปที่อินฟินิตี้n
  • nknไปที่ 0 เมื่อไปที่อนันต์n

3
มันน่าสังเกตว่านักเขียนบางคนชอบที่จะทำให้ความแตกต่างระหว่าง DM และ ML ขึ้นอยู่กับขนาดของ n ฉันชอบแนวทางของ Radford Neale ในหลักสูตรของเขาเกี่ยวกับวิธีการทางสถิติสำหรับการเรียนรู้ของเครื่องจักรและการทำเหมืองข้อมูล : ปัญหาการเรียนรู้ของเครื่องจำนวนมากมีตัวแปรจำนวนมาก k/n
chl

3

ฉันเพิ่มแหล่งบทเรียนที่ดีมากในการเรียนรู้การขุดข้อมูล / เครื่องจักรโดยTom Mitchellเท่านั้น

เขาอธิบายอย่างชัดเจนมากและคุณสามารถดาวน์โหลดงานนำเสนอของเขาจากเว็บไซต์ของเขา (พร้อมกับดูการบรรยายของเขาที่นั่น)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.