หนังสือเล่มใดที่ให้ภาพรวมของสถิติการคำนวณตามที่ใช้กับวิทยาศาสตร์คอมพิวเตอร์


15

ในฐานะวิศวกรซอฟต์แวร์ฉันสนใจในหัวข้อต่าง ๆ เช่นอัลกอริธึมเชิงสถิติการขุดข้อมูลการเรียนรู้เครื่องเครือข่ายแบบเบย์อัลกอริธึมการจำแนกเครือข่ายนิวรัลเครือข่ายมาร์คอฟวิธีการของมอนติคาร์โลและการสร้างตัวเลขสุ่ม

โดยส่วนตัวฉันไม่ได้มีความสุขที่ได้ทำงานด้วยเทคนิคเหล่านี้ แต่ฉันต้องทำงานกับซอฟต์แวร์ที่อยู่ภายใต้ประทุนใช้พวกเขาและต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับพวกเขาในระดับสูง ฉันกำลังมองหาหนังสือที่ครอบคลุมความกว้างมาก - ไม่จำเป็นต้องเจาะลึก ฉันคิดว่าฉันสามารถเรียนรู้มากมายเกี่ยวกับการพัฒนาซอฟต์แวร์หากฉันสามารถเข้าใจรากฐานทางคณิตศาสตร์ที่อยู่เบื้องหลังอัลกอริทึมและเทคนิคที่ใช้

ชุมชนการวิเคราะห์เชิงสถิติสามารถแนะนำหนังสือที่ฉันสามารถใช้เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับการใช้องค์ประกอบทางสถิติต่าง ๆ ในซอฟต์แวร์ได้หรือไม่

คำตอบ:



3

คุณอาจต้องการที่จะอ่านคำถามที่นิยมอย่างมากในกองมากเกินใน สิ่งที่สถิติเป็นโปรแกรมเมอร์หรือนักวิทยาศาสตร์คอมพิวเตอร์ควรรู้


โทรดีมาก ฉันใช้ SO และฉันก็ไม่รู้ว่ายังมีคำถามอยู่ เป็นการดีที่มีการเชื่อมโยงข้ามเวลาที่คำถามอาจปรากฏในการแลกเปลี่ยนหลายครั้ง
โธมัสโอเวนส์

3

นี่คือหนังสือที่ดีมากจาก James E. Gentle, Computational Statistics (Springer, 2009) ซึ่งครอบคลุมทั้งด้านการคำนวณและสถิติของการวิเคราะห์ข้อมูล อ่อนโยนยังประพันธ์หนังสือที่ยอดเยี่ยมอื่น ๆ ตรวจสอบสิ่งพิมพ์ของเขา

หนังสือยอดเยี่ยมอีกเล่มหนึ่งคือคู่มือสถิติการคำนวณจาก Gentle et al (Springer, 2004); มันกำลังหมุนเวียนอยู่ในรูปแบบ PDF ที่ใดที่หนึ่งบนเว็บดังนั้นให้ลองดูบน Google


2

คุณได้พูดถึงเทคนิค ML บางอย่างดังนั้นหนังสือสองเล่มที่ค่อนข้างดี (ค่อนข้างน่าเสียดายที่ฉันชอบเป็นภาษาโปแลนด์):
http://www.amazon.com/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1420067184
http: / /ai.stanford.edu/~nilsson/mlbook.html

สำหรับข้อมูลที่เป็นตัวเลขเช่นการสร้างหมายเลขแบบสุ่ม:
http://www.nr.com/


+1 หนังสือ Marsland ค่อนข้างดีและเติมเต็มช่องว่างขนาดใหญ่ในหนังสือ ML ที่มีอยู่แล้ว
ARS

1

ฉันหยิบสำเนาของความน่าจะเป็นและสถิติสำหรับนักวิทยาศาสตร์คอมพิวเตอร์ - Michael Baron มาขายพร้อมหนังสือสถิติอีกเล่มหนึ่ง (ฉันซื้ออย่างสุจริตเพราะชื่อ - ฉันต้องการหนังสือที่จะดูสถิติจากมุมมองของวิทยาศาสตร์คอมพิวเตอร์ แม้ว่ามันจะไม่สมบูรณ์แบบก็ตาม) ฉันยังไม่มีโอกาสอ่านหรือแก้ไขปัญหาใด ๆ ในตอนนี้ แต่ดูเหมือนว่าจะเป็นหนังสือที่เป็นของแข็ง

คำนำของหนังสือเล่มนี้บอกว่ามันเหมาะสำหรับนักเรียนระดับปริญญาตรีตอนบนและนักศึกษาระดับเริ่มต้นและฉันก็เห็นด้วยกับเรื่องนี้ ความเข้าใจความน่าจะเป็นและสถิติบางอย่างจำเป็นต้องเข้าใจเนื้อหาของหนังสือเล่มนี้

หัวข้อรวมถึงความน่าจะเป็นตัวแปรสุ่มไม่ต่อเนื่องการแจกแจงแบบต่อเนื่องวิธีมอนติคาร์โลกระบวนการสโทแคสติกระบบการเข้าคิวการอนุมานเชิงสถิติและการถดถอย


1

แม้ว่าจะไม่ใช่สถิติการคำนวณโดยเฉพาะ แต่หนังสือคู่มือการวิเคราะห์ทางสถิติโดยใช้ R - Brian S. Everitt และ Torsten Hothornครอบคลุมหัวข้อมากมายที่ฉันได้เห็นในหนังสือสถิติพื้นฐานและขั้นกลาง - การอนุมาน ANOVA การถดถอยเชิงเส้นการถดถอยเชิงตรรกะการประมาณความหนาแน่นการแบ่งส่วนแบบวนซ้ำการวิเคราะห์องค์ประกอบหลักและการวิเคราะห์กลุ่มโดยใช้ภาษา R นี่อาจเป็นที่สนใจของผู้ที่สนใจในการเขียนโปรแกรม

อย่างไรก็ตามไม่เหมือนหนังสือเล่มอื่น ๆ ที่เน้นอยู่ที่การใช้ภาษา R เพื่อทำหน้าที่ทางสถิติเหล่านี้ หนังสือเล่มอื่นที่ฉันเคยเห็นใช้พีชคณิตและแคลคูลัสเพื่อแสดงสถิติ หนังสือเล่มนี้เน้นการวิเคราะห์ข้อมูลโดยใช้ภาษา R และเพื่อให้มีประโยชน์มากยิ่งขึ้นชุดข้อมูลที่ผู้เขียนใช้อยู่ใน CRAN - R Repository


1

การคำนวณทางสถิติด้วย R - Maria L. Rizzoครอบคลุมหัวข้อมากมายในความน่าจะเป็นและสถิติสำหรับนักวิทยาศาสตร์คอมพิวเตอร์ - ความน่าจะเป็นพื้นฐานและสถิติตัวแปรสุ่มสถิติแบบเบย์โซ่มาร์คอฟการสร้างภาพข้อมูลหลายตัวแปรวิธีมอนติคาร์โล การประมาณความหนาแน่นและวิธีเชิงตัวเลข

สมการและสูตรที่ใช้ถูกนำเสนอทั้งเป็นสูตรทางคณิตศาสตร์เช่นเดียวกับในรหัส R ฉันจะบอกว่าความรู้พื้นฐานของความน่าจะเป็นสถิติแคลคูลัสและคณิตศาสตร์แบบแยกอาจจะแนะนำสำหรับผู้ที่ต้องการอ่านหนังสือเล่มนี้ พื้นหลังการเขียนโปรแกรมก็มีประโยชน์เช่นกัน แต่มีการอ้างอิงบางอย่างสำหรับภาษา R ตัวดำเนินการและไวยากรณ์


1

ในฐานะวิศวกรคอมพิวเตอร์ที่กำลังวิเคราะห์ข้อมูลด้วยตัวเองหนังสือที่อ่านได้จริงๆซึ่งครอบคลุมเนื้อหาจากมุมมองที่ไม่น่าเชื่อและอ่านง่าย (ที่ราคาไม่ครอบคลุมเท่าที่หนังสืออื่น ๆ แนะนำที่นี่) คือ Programming Collective Intelligence โดย Toby Segaran ฉันพบว่ามันเข้าถึงได้ง่ายกว่าหนังสือของบิชอปซึ่งเป็นการอ้างอิงที่ดี แต่มีความลึกมากกว่าที่คุณอาจต้องการเมื่อผ่านครั้งแรก ใน amazon: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325


1

CRAN มีตัวอย่างที่ดีหลายเล่มเกี่ยวกับการโปรแกรมเชิงสถิติ บางคนจะไม่เกี่ยวข้องกับการเรียนรู้ของเครื่องและ MCMC แต่แต่ละรายการจะมีคำอธิบายประกอบดังนั้นคุณควรมีความคิดคร่าวๆว่าหนังสือแต่ละเล่มจะมีอะไรให้ดำน้ำอีกสักหน่อย http://www.r-project.org/doc/bib/R-books.html

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.