หนังสือเกี่ยวกับ“ วิทยาศาสตร์” ในวิทยาศาสตร์ข้อมูล? [ปิด]


26

หนังสือเกี่ยวกับวิทยาศาสตร์และคณิตศาสตร์เบื้องหลังวิทยาศาสตร์ข้อมูลคืออะไร รู้สึกเหมือนหนังสือ "วิทยาศาสตร์ข้อมูล" จำนวนมากเป็นบทเรียนการเขียนโปรแกรมและไม่ได้สัมผัสสิ่งต่าง ๆ เช่นกระบวนการสร้างข้อมูลและการอนุมานเชิงสถิติ ฉันสามารถเขียนโค้ดแล้วสิ่งที่ฉันอ่อนแอคือคณิตศาสตร์ / สถิติ / ทฤษฎีที่อยู่เบื้องหลังสิ่งที่ฉันทำ

หากฉันพร้อมที่จะเผาหนังสือ 1,000 ดอลลาร์ (ประมาณ 10 เล่ม ... ถอนหายใจ) ฉันจะซื้ออะไรได้บ้าง

ตัวอย่าง: การวิเคราะห์ข้อมูลอย่างละเอียดของ Agresti , ตัวแบบผสมเชิงเส้นสำหรับข้อมูลระยะยาวฯลฯ ... ฯลฯ ...


การถามเกี่ยวกับหนังสือที่ "ดี" จะดึงดูดคำตอบจากความคิดเห็น ถูกตั้งค่าสถานะ
Spacedman

3
ฉันเปลี่ยนมันแล้วฉันก็แค่มองหาหนังสือ ไม่มีความคิดเห็น
Anton

มันเป็นสถิติที่สะกดแล้ว :) ยึดติดกับบางสิ่งที่เน้นการทำนายมากกว่าการอนุมาน ทั้งองค์ประกอบของการเรียนรู้ทางสถิติและความรู้เบื้องต้นเกี่ยวกับสถิตินั้นอยู่ในรายชื่อของคนส่วนใหญ่
Dirk Eddelbuettel

ฉันยังไม่สามารถเพิ่มความคิดเห็นได้ แต่มีเพียง FYI ESL ออนไลน์ฟรีในรูปแบบ pdf
idclark

1
ฉันคิดว่าคำถามนี้ควรถูกทำเครื่องหมายว่าเป็นวิกิชุมชน
Shagun Sodhani

คำตอบ:


21

เบื้องต้น:

ขุดลึกลงไป:

ตัวอย่างความสนใจพิเศษ:

การอ้างอิงที่กว้างกว่าทำงานกับการเรียนรู้ของเครื่อง (ไม่ใช่สิ่งที่คุณขอ แต่เพื่อความสมบูรณ์):

กระดาษโบนัส:


2
+1 สำหรับกระดาษโบนัส ยอดเยี่ยมอ่าน
Santiago Cepas

13

ถ้าฉันสามารถแนะนำคุณได้เพียงคนเดียวนั่นก็คือ: องค์ประกอบของการเรียนรู้ทางสถิติและการทำนายโดย Hastie, Tibshirani และ Friedman มันให้คณิตศาสตร์ / สถิติที่อยู่เบื้องหลังเทคนิคที่ใช้กันทั่วไปในด้านวิทยาศาสตร์ข้อมูล

สำหรับเทคนิคแบบเบย์การวิเคราะห์ข้อมูลแบบเบย์โดย Gelman, Carlin, Stern, Dunson, Vehtari และ Rubin นั้นยอดเยี่ยม

อนุมานทางสถิติโดย Casella และ Berger เป็นตำราเรียนระดับบัณฑิตศึกษาที่ดีบนรากฐานทางทฤษฎีของสถิติ หนังสือเล่มนี้ต้องการความสะดวกสบายในระดับสูงทางคณิตศาสตร์ (ทฤษฎีความน่าจะเป็นขึ้นอยู่กับทฤษฎีการวัดซึ่งไม่น่าเข้าใจ)

เกี่ยวกับกระบวนการสร้างข้อมูลฉันไม่มีคำแนะนำสำหรับหนังสือ สิ่งที่ฉันสามารถพูดได้ก็คือความเข้าใจที่ดีเกี่ยวกับสมมติฐานของเทคนิคที่ใช้และสร้างความมั่นใจว่าข้อมูลถูกรวบรวมหรือสร้างในลักษณะที่ไม่ละเมิดสมมติฐานเหล่านั้นไปไกลในการวิเคราะห์ที่ดี


7

คำตอบอื่น ๆ แนะนำชุดหนังสือที่ดีเกี่ยวกับคณิตศาสตร์ที่อยู่เบื้องหลังวิทยาศาสตร์ข้อมูล แต่อย่างที่คุณพูดถึงมันไม่ใช่แค่คณิตศาสตร์และกิจกรรมเช่นการรวบรวมข้อมูลและการอนุมานจากข้อมูลมีกฎและทฤษฎีของตัวเองแม้ว่าจะไม่ได้เข้มงวดเท่ากับภูมิหลังทางคณิตศาสตร์ (แต่)

สำหรับชิ้นส่วนเหล่านี้ฉันขอแนะนำหนังสือBeautiful Data: เรื่องเบื้องหลังการแก้ไขข้อมูลที่สวยงามซึ่งมียี่สิบกรณีศึกษาเช่นบทที่เขียนโดยผู้ที่เกี่ยวข้องกับปัญหาการวิเคราะห์ข้อมูลในโลกแห่งความเป็นจริง มันไม่ได้มีคณิตศาสตร์ใด ๆ แต่สำรวจพื้นที่เช่นการรวบรวมข้อมูลการหาวิธีการปฏิบัติของการใช้ข้อมูลในการวิเคราะห์การปรับขนาดและการเลือกโซลูชั่นที่ดีที่สุดได้เป็นอย่างดี

หนังสือที่น่าสนใจอีกเรื่องหนึ่งคือการคิดด้วยข้อมูล: วิธีเปลี่ยนข้อมูลเป็นข้อมูลเชิงลึกซึ่งไม่ใช่ด้านเทคนิค (= การสอนการเขียนโปรแกรม) แต่ครอบคลุมหัวข้อที่สำคัญเกี่ยวกับวิธีการใช้พลังข้อมูลวิทยาศาสตร์ในการตัดสินใจและปัญหาโลกแห่งความจริง


7

ฉันชอบคำแนะนำของ Amir Ali Akbari และฉันจะเพิ่มของฉันเองโดยมุ่งเน้นที่หัวข้อและทักษะที่ไม่ครอบคลุมในหนังสือเรียนรู้เครื่องและการวิเคราะห์ข้อมูลส่วนใหญ่ที่เน้นเรื่องคณิตศาสตร์และ / หรือการเขียนโปรแกรม

การทำความสะอาดข้อมูล:

การวิเคราะห์ข้อมูลแบบเบส์ (ทางเลือกในการทดสอบนัยสำคัญของ Null Hypothesis Test):

การอนุมานในหน้าของความไม่แน่นอน, ความไม่สมบูรณ์, ความขัดแย้ง, ความคลุมเครือ, ความไม่แน่นอน, ความไม่รู้ ฯลฯ :

การทดลอง:

จำลอง:

การสอบถามจากผู้เชี่ยวชาญการประมาณความน่าจะเป็น:

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.