ความแตกต่างระหว่างวิทยาศาสตร์คอมพิวเตอร์และวิทยาศาสตร์ข้อมูลคืออะไร? [ปิด]


9

พื้นหลัง: ปริญญาเอกของฉันอยู่ใน 'วิทยาศาสตร์การคำนวณ' วิทยานิพนธ์ของฉันอยู่ที่การวิเคราะห์ข้อมูลการเลี้ยวเบนของรังสีเอกซ์และการวิเคราะห์นิวเคลียสที่ถูกรบกวนทางความร้อนในการวิเคราะห์แบบไดนามิกโดยรวมของความหนาแน่นของอิเล็กตรอนโมเลกุลสำหรับฟิสิกส์สถานะของแข็ง Takeaway หรือไม่ มันมีพื้นฐานทางวิทยาศาสตร์เป็นอย่างมาก

ในความคิดของฉันวิทยาศาสตร์การคำนวณคือการแสวงหาวิทยาศาสตร์ "... องค์กรที่เป็นระบบที่สร้างและจัดการความรู้ในรูปแบบของคำอธิบายที่ทดสอบได้และคำทำนายเกี่ยวกับจักรวาล" ( วิกิ ) โดยใช้วิธีการคำนวณ

อย่างไรก็ตามตำแหน่งส่วนใหญ่สำหรับ 'วิทยาศาสตร์ข้อมูล' ดูเหมือนจะเป็นงานประเภท 'การวิเคราะห์ข้อมูล' มากกว่า นั่นคือคิวรี SQL จำนวนมากโดยใช้โมเดล R และ Python ที่สร้างไว้ล่วงหน้า (การถดถอยเชิงเส้น ฯลฯ ) เพื่อดึงข้อสรุปจากข้อมูลที่มีโครงสร้างและไม่มีโครงสร้าง

วิทยาศาสตร์คอมพิวเตอร์เป็นศาสตร์ด้านข้อมูลหรือไม่? พวกเขาใช้แทนกันได้หรือไม่ วิทยาศาสตร์ข้อมูลเป็น 'วิทยาศาสตร์' จริงหรือไม่ วิทยาศาสตร์การคำนวณเป็น 'วิทยาศาสตร์' จริงหรือไม่


ฉันคิดว่าคำถามมีคุณค่าบางอย่าง แต่คุณจะต้องใช้มันออกมาเล็กน้อย ร่างของรายงานใน CSE นี้อาจมีประโยชน์ พวกเขามีการพูดถึงเกี่ยวกับความสัมพันธ์ระหว่างทั้งสอง คุณอาจนึกถึงความสัมพันธ์ที่คล้ายคลึงกับความสัมพันธ์ระหว่างวิทยาศาสตร์เชิงทดลองและทฤษฎีอย่างใด
nicoguaro

คำตอบ:


10

พวกเขาไม่สามารถใช้แทนกันได้

  • วิทยาศาสตร์การคำนวณมีแนวโน้มที่จะอ้างถึง HPC มากขึ้นเทคนิคการจำลอง (สมการเชิงอนุพันธ์พลศาสตร์โมเลกุล ฯลฯ ) และมักเรียกกันว่าการคำนวณทางวิทยาศาสตร์

  • วิทยาศาสตร์ข้อมูลมีแนวโน้มที่จะอ้างถึงการวิเคราะห์ข้อมูลแบบเข้มข้นเช่น "ข้อมูลขนาดใหญ่", ชีวสารสนเทศศาสตร์, การเรียนรู้ของเครื่อง (การเพิ่มประสิทธิภาพ), การวิเคราะห์แบบเบย์โดยใช้ MCMC ฯลฯ ฉันคิดว่ามันเหมือนกับสิ่งที่เคยถูกอ้างถึงว่าเป็นสถิติเชิงคำนวณ มันเป็นการผสมผสานของวิทยาการคอมพิวเตอร์ที่มีสถิติ แต่เทคนิคต่าง ๆ ที่ได้รับการพัฒนาทำให้การทดสอบทางสถิติของชาวประมงเข้มงวดขึ้น (การจัดกลุ่มเทคนิคการตรวจสอบข้ามการสร้างภาพข้อมูล) แต่เก็บส่วนของข้อมูลไว้

คำอธิบายที่ชัดเจนที่สุดของมันมาถึงฉันเมื่อฉันสอนเวิร์คช็อปเกี่ยวกับ Julia สำหรับวิทยาศาสตร์ข้อมูลและการคำนวณทางวิทยาศาสตร์ นักวิทยาศาสตร์ด้านข้อมูลต้องการเรียนรู้ Julia เพื่อทำการวิเคราะห์ "ข้อมูลขนาดใหญ่" อย่างรวดเร็วเช่นการถดถอยและ GLMs อื่น ๆ ในข้อมูลขนาดใหญ่ นักวิทยาศาสตร์การคำนวณ (นักวิทยาศาสตร์คอมพิวเตอร์?) ต้องการทราบวิธีเขียนโค้ดเพื่อแก้ปัญหาระบบเชิงเส้นขนาดใหญ่บน HPC และ GPU

สังเกตว่าวิธีการพูดการคำนวณที่เหมือนกันสองวิธี แต่มีความหมายแตกต่างกันมาก ดังนั้นในความรู้สึกบางอย่างที่คล้ายกัน แต่ยังคงแตกต่างกัน (และมีการข้ามระหว่างสาขาวิชาเช่นการใช้เครื่องเรียนรู้เพื่อเรียนรู้พารามิเตอร์สำหรับ PDE จากข้อมูล)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.