คำขออ้างอิง: สถิติคลาสสิคสำหรับนักวิทยาศาสตร์ด้านข้อมูลการทำงาน


10

ฉันเป็นนักวิทยาศาสตร์ข้อมูลที่ทำงานด้วยประสบการณ์ที่แข็งแกร่งในการถดถอยอัลกอริธึมชนิดการเรียนรู้ของเครื่องอื่น ๆ และการเขียนโปรแกรม (ทั้งสำหรับการวิเคราะห์ข้อมูลและการพัฒนาซอฟต์แวร์ทั่วไป) ชีวิตการทำงานส่วนใหญ่ของฉันมุ่งเน้นไปที่การสร้างแบบจำลองเพื่อความแม่นยำในการคาดการณ์ (ทำงานภายใต้ข้อ จำกัด ทางธุรกิจต่าง ๆ ) และการสร้างท่อส่งข้อมูลเพื่อสนับสนุนงานของฉันเอง

ฉันไม่มีสถิติการฝึกอบรมอย่างเป็นทางการการศึกษาในมหาวิทยาลัยของฉันเน้นที่คณิตศาสตร์บริสุทธิ์ เช่นนี้ทำให้พลาดการเรียนรู้หัวข้อคลาสสิกจำนวนมากโดยเฉพาะการทดสอบสมมติฐานยอดนิยมต่างๆและเทคนิคการอนุมาน

มีการอ้างอิงใด ๆ สำหรับหัวข้อเหล่านี้ที่เหมาะสำหรับใครบางคนที่มีพื้นฐานและระดับประสบการณ์หรือไม่? ฉันสามารถจัดการ (และชื่นชม) ความแม่นยำทางคณิตศาสตร์และเพลิดเพลินไปกับมุมมองอัลกอริทึม ฉันมักจะชอบอ้างอิงที่เสนอแบบฝึกหัดที่มีผู้อ่านซึ่งมีทั้งแบบ (หรืออย่างใดอย่างหนึ่ง) โฟกัสการเขียนโปรแกรมทางคณิตศาสตร์และ (หรือ)


2
ในฐานะที่เป็นแมตต์อีกคนหนึ่งจากภูมิหลังทางคณิตศาสตร์ที่มีความรู้เต็มไปด้วยช่องว่างของสถิติฉันสามารถสร้างความสัมพันธ์! มีพื้นที่ / แอพพลิเคชั่นที่คุณสนใจหรือไม่? สิ่งหนึ่งที่ต้องระวังเกี่ยวกับสถิติแบบคลาสสิกคือข้อสมมติฐานที่ใช้
GeoMatt22

5
มีการอ้างอิงที่ดีอยู่เล็กน้อยที่นี่: mathoverflow.net/questions/31655/statistics-for-mathematicians
Alex R.

คำตอบ:


3

Larry Wasserman's All of Statisticsเป็นหนังสือที่ดีสำหรับการสำรวจสถิติทางคณิตศาสตร์ มันเป็นหนังสือเล่มแรกเกี่ยวกับสถิติทางคณิตศาสตร์ที่ฉันใช้เอง มันรวมถึงคลาสสิกเช่นการทดสอบสมมติฐานและการประเมินความเป็นไปได้สูงสุด แต่ก็ยังมีความครอบคลุมมากมายของหัวข้อที่ได้รับการพัฒนาเมื่อเร็ว ๆ นี้ แต่มีความสำคัญเท่าเทียมกันเช่น bootstrapping Wasserman มีสถิติหนึ่งฟุตเสมอและอีกวิธีหนึ่งคือการเรียนรู้ของเครื่องจักรซึ่งฉันคิดว่านักวิเคราะห์ข้อมูลร่วมสมัยควรทำ หากคุณคุ้นเคยกับหนึ่งสาขาในสองฟิลด์คุณจะหายไปมาก นอกจากนี้หนังสือเล่มนี้ยังมีแบบฝึกหัดที่ดีมากมาย

ถ้าคุณมีพื้นหลังในการวิเคราะห์จริงและคุณต้องการดิบสิ่งเจียระไนโดยที่ผมหมายถึงการรักษาที่วัดตามทฤษฎีความน่าจะเป็นและสถิติลองมาร์คเจ Schervish ของทฤษฎีสถิติ Schervish เป็นครึ่งหนึ่งของ DeGroot และ Schervish ซึ่งหนังสือทางเทคนิคน้อยกว่าความน่าจะเป็นและสถิติอาจเป็นหนังสือที่ได้รับความนิยมมากที่สุดในสถิติทางคณิตศาสตร์ในปัจจุบัน ทฤษฎีสถิติเป็นหนังสือพูดคุยที่เป็นประโยชน์สำหรับหัวข้อที่สงวนไว้สำหรับนักศึกษาระดับบัณฑิตศึกษาที่ควรจะทำงานทั้งหมดด้วยตนเอง พูดตามตรงฉันพบว่าหนังสือเล่มนี้ยากมาก (แม้ว่าจะไม่ยากเท่ากับสถิติทางคณิตศาสตร์ของ Jun Shao) และในที่สุดก็มาถึงความพยายามอันยิ่งใหญ่ที่จำเป็นในการควบคุมมันไม่ได้ใช้เวลาของฉันในฐานะนักวิเคราะห์ข้อมูล แต่ฉันยังคงเรียนรู้มากมายและหลุดพ้นไปด้วยความเข้าใจที่ดีว่าทฤษฎีการวัดคืออะไรและจะใช้ในการทำความสะอาดปัญหาทางทฤษฎีที่มีขนดกที่เกิดขึ้นในแนวทางแบบดั้งเดิมที่ไร้เดียงสาต่อทฤษฎีความน่าจะเป็น ฉันยังได้ชื่นชมความคล้ายคลึงและความแตกต่างของการแลกเปลี่ยนและความเป็นอิสระที่ดีขึ้น


2

นอกเหนือคำแนะนำที่ดีมากของ Kodiologist (+1) ฉันยังอยากจะขอแนะนำให้มองไปที่เรื่องของการศึกษาเชิง ฉันคิดว่ามันเป็นเขตข้อมูลที่ไม่ได้รับการชื่นชมมากนักระหว่างข้อมูล - นักวิทยาศาสตร์แม้ว่าข้อเท็จจริงที่ว่าในหลาย ๆ กรณีข้อมูลที่วิเคราะห์นั้นมีลักษณะเชิงสังเกตการณ์ ฉันคิดว่าเป็นเพราะส่วนใหญ่ของบรรณานุกรม (โดยเฉพาะอย่างยิ่งในชีวสถิติ) สันนิษฐานว่ามีการออกแบบกึ่งทดลองอยู่แล้ว หนังสือของ Paul Rosenbaum การศึกษาเชิงสังเกตและการออกแบบของ Observational Studiesเป็นหนังสืออ้างอิงที่ใช้บ่อยที่สุด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.