สถิติและสารสนเทศต่างกันอย่างไร


10

เรามักจะบอกว่าสถิติเป็นเพียงการจัดการกับข้อมูล แต่เราก็รู้ว่าสารสนเทศก็ยังได้รับความรู้จากการวิเคราะห์ข้อมูล ตัวอย่างเช่นคนชีวสารสนเทศสามารถไปโดยสิ้นเชิงโดยไม่ชีวสถิติ ฉันต้องการทราบว่าอะไรคือความแตกต่างที่สำคัญระหว่างสถิติและสารสนเทศ


7
ไม่นี่เป็นเพียงเพราะคำว่า "สารสนเทศ" ได้หายไปจากความหมายที่ชัดเจน "ชีวสารสนเทศศาสตร์" ถูกบัญญัติไว้เพียงเพื่อ "ชีววิทยาที่ทำบนคอมพิวเตอร์" ไม่มีอะไรที่ลึกซึ้งในเรื่องนี้

1
@mbq เห็นด้วย "สารสนเทศ" และ "ชีวสารสนเทศศาสตร์" ได้ทำให้คำจำกัดความที่มีความหมายหายไป
Fomite

อย่างชัดเจนชีวสารสนเทศศาสตร์ (ใช้ผลการวิจัยของคุณเพื่อสังเกตผลลัพธ์ของคุณในทางชีวภาพ)
Kamal Alblwei

คำตอบ:


20

คำถามยอดเยี่ยม !!

ฉันได้ยินหลายครั้งว่านักชีวสารสนเทศสามารถไปได้โดยไม่มีชีวสถิติหรือแม้แต่ไม่มีสถิติ มันเป็นความจริงอย่างสมบูรณ์แบบจนกว่ามันจะกลายเป็นเท็จ ในความเห็นของฉันการขาดความรู้ทางสถิติโดยทั่วไปมีผลร้ายแรงในสาขาดังที่Keith Baggerlyแสดง ฉันยังสามารถสังเกตได้ว่าการขาดความรู้พื้นฐานในสถิติ (และพีชคณิตเชิงเส้น) เป็นสาเหตุของความซบเซาของชีวสารสนเทศในระยะยาว: หากไม่มีความรู้เชิงลึกเกี่ยวกับทฤษฎีพวกเขามีแนวโน้มที่จะบูรณาการล้อและวิธีแก้ปัญหาแบบเฉพาะกิจไม่มีอะไรนอกจากปัญหาของพวกเขาเอง

แต่ตอนนี้เพื่อตอบคำถามของคุณฉันยอมรับว่าโดยรวมแล้วสถิติไม่สามารถทำได้หากไม่มีคอมพิวเตอร์ในสมัยนั้น แต่หนึ่งในแง่มุมที่สำคัญของสถิติคือการอนุมานซึ่งไม่มีอะไรเกี่ยวข้องกับคอมพิวเตอร์ การอนุมานเชิงสถิติเป็นสิ่งที่ทำให้วิทยาศาสตร์เป็นสถิติเพราะมันจะบอกคุณว่าข้อสรุปของคุณมีอยู่ในบริบทอื่นหรือไม่

ในระยะสั้นคุณสามารถวิเคราะห์นรกจากข้อมูลของคุณคุณจะต้องมีสถิติเพื่อทราบความถูกต้องของการคาดการณ์หรือการตัดสินใจที่คุณจะทำตามการวิเคราะห์ของคุณ


ขอบคุณ คุณช่วยอธิบายเพิ่มเติมเกี่ยวกับหลักการทั่วไปที่อยู่เบื้องหลังชีวสารสนเทศศาสตร์เพื่อให้เป็นวินัยได้อย่างไร สำหรับสถิติการพูดโดยทั่วไปมีสองส่วนหลักส่วนหนึ่งคือการจัดการข้อมูลที่บริสุทธิ์ส่วนที่เหลือคือการอนุมานเชิงสถิติซึ่งขึ้นอยู่กับความน่าจะเป็นซึ่งเป็นหนึ่งในคณิตศาสตร์บริสุทธิ์ ขึ้นอยู่กับแบบจำลองทางสถิติ (แบบจำลองความน่าจะเป็น) ผู้คนสามารถทำวิทยาศาสตร์ได้ แล้วชีวสารสนเทศศาสตร์ล่ะ?
Honglang Wang

4
ชีวสารสนเทศศาสตร์เป็นเพียงการใช้คอมพิวเตอร์เพื่อศึกษาคำถามทางชีววิทยา โดยทั่วไปแล้วระเบียบวินัยจะถูกกำหนดโดยคำถามที่พวกเขาถามไม่ใช่ด้วยวิธีการของพวกเขาดังนั้นสารสนเทศชีวภาพควรเป็นส่วนหนึ่งของชีววิทยาในความคิดของฉัน มันมีชื่อพิเศษเพราะนักชีววิทยาไม่ดีกับคอมพิวเตอร์ดังนั้นคนที่สามารถทำได้ต้องมีป้ายกำกับพิเศษ ฉันไม่แน่ใจว่าใน 50 ปีที่นักชีววิทยาจะเก่งด้านไอทีและคณิตศาสตร์จะยังคงมีข้อมูลชีวภาพอยู่
gui11aume

2
เป็นเรื่องดีที่ได้เห็นคนอื่นเห็นคุณค่าของความพยายามของคี ธ แน่นอนเขาไม่ได้เบือนหน้าหนีจากการทะเลาะวิวาทหรือสถานการณ์มืออาชีพที่ยุ่งยาก
พระคาร์ดินัล

@cardinal Saw Keith พูดคุยที่การประชุม APHA เมื่อสองปีก่อน มันเป็นหนึ่งในการเจรจาที่ดีที่สุดที่ฉันเคยเห็น
Fomite

9

มุมมองของฉันคือในขณะที่มีการทับซ้อนระหว่างฟิลด์จำนวนมากพอสมควร แต่ก็มีความแตกต่างที่สำคัญ โดยทั่วไปนักเรียนสถิติ (ในระดับที่สูงกว่า) จะใช้เวลาเรียนทฤษฎีมากขึ้น (คณิตศาสตร์และคณิตศาสตร์) กว่านักเรียนสารสนเทศ แต่นักเรียนสารสนเทศจะได้เรียนรู้การคำนวณมากขึ้น (โดยเฉพาะส่วนฐานข้อมูล)

การพัฒนาการทดสอบสถิติใหม่จะทำให้นักสถิติตกหล่นมากกว่านักสถิติ แต่การออกแบบอินเตอร์เฟสสำหรับผู้ใช้เพื่อป้อนข้อมูลและสร้างตารางและพล็อตจะตกอยู่กับนักสถิติมากกว่านักสถิติ

สำหรับนักสถิติคอมพิวเตอร์เป็นเครื่องมือที่ช่วยเกี่ยวกับสถิติ ข้อมูลสถิติเป็นเครื่องมือที่ช่วยรวบรวมและแจกจ่ายข้อมูล (ผ่านคอมพิวเตอร์ทั่วไป)

แก้ไขด้านล่างที่นี่ -----

เพื่อออกไปนี่เป็นตัวอย่าง ฉันทำงานเกี่ยวกับโครงการกับนักข้อมูล (ฉันเป็นนักสถิติ) ที่แพทย์ต้องการมีระบบที่ใช้ข้อมูลผู้ป่วยในการทำนายความเสี่ยงของอาการบางอย่าง (เช่นการพัฒนาลิ่มเลือด) และต้องการได้รับรูปแบบบางอย่างของ แจ้งเตือนให้พวกเขาทราบเกี่ยวกับความเสี่ยง บทบาทของฉันในโครงการ (บทบาททางสถิติ) คือการพัฒนาแบบจำลองที่จะทำนายความเสี่ยงจากตัวแปรตัวทำนาย บทบาทสารสนเทศในโครงการคือการพัฒนาเครื่องมือที่รวบรวมตัวแปรทำนายใช้โมเดลของฉันกับพวกเขาแล้วส่งผลลัพธ์ไปหาแพทย์ ข้อมูลอาจถูกรวบรวมจากเวชระเบียนอิเล็กทรอนิกส์หรือผ่านหน้าจอป้อนข้อมูลสำหรับพยาบาลเพื่อกรอกข้อมูลหรืออื่น ๆ

ตอนนี้ฉัน (และนักสถิติอื่น ๆ ) รู้มากพอเกี่ยวกับการเขียนโปรแกรมที่ฉันสามารถสืบค้นฐานข้อมูลเพื่อรับตัวทำนายและสร้างการแจ้งเตือนบางประเภท แต่ฉันยินดีที่จะปล่อยให้ผู้รู้สารสนเทศ (และพวกเขาทำได้ดีกว่า) มีผู้ให้ข้อมูลซึ่งรู้สถิติเพียงพอที่จะเหมาะสมกับตัวแบบการถดถอยโลจิสติกส์ ดังนั้นโครงการที่เรียบง่ายของโครงการนี้สามารถทำได้โดยนักสถิติเท่านั้นหรือผู้เชี่ยวชาญด้านข้อมูล แต่จะดีที่สุดเมื่อทั้งสองทำงานร่วมกัน หากคุณดูที่โครงการนี้และคิดว่าส่วนการสร้างแบบจำลองเป็นส่วนที่สนุกและการรวบรวมข้อมูลการแจ้งเตือนและอินเทอร์เฟซอื่น ๆ เป็นเพียงเครื่องมือในการย้ายข้อมูลไปและกลับจากแบบจำลองแสดงว่าคุณเป็นนักสถิติมากขึ้น หากคุณเห็นการออกแบบส่วนต่อประสานการปรับตั้งค่าข้อมูลย้อนกลับการทดสอบการแจ้งเตือนประเภทต่างๆเป็นต้น


(+1) ฉันชอบความสมดุลของคำตอบนี้ ฉันไม่แน่ใจว่าฉันค่อนข้างเข้าใจสิ่งที่ตั้งใจโดยประโยคสุดท้าย
พระคาร์ดินัล

1
ฉันคิดว่าตัวอย่างของคุณดีมากและให้ภาพที่ดีของการวางพื้นฐานของที่ดิน ฉันหวังว่าฉันจะสามารถลงคะแนนได้อีกครั้งสำหรับส่วนนั้น ไชโย
พระคาร์ดินัล

ตัวอย่างของคุณเจ๋งจริงๆ ขอบคุณมาก. ตอนนี้ฉันแค่สงสัยคำถามหนึ่ง สำหรับนักสถิติแบบจำลองทางสถิติทั้งหมดควรมีการอนุมานส่วนเช่นช่วงความมั่นใจหรือการทดสอบสมมติฐาน มิฉะนั้นจะจัดการกับชุดข้อมูลโดยการพล็อตและการสรุปเท่านั้น
Honglang Wang

9

สถิติinfersจากข้อมูล สารสนเทศดำเนินการกับข้อมูล แน่นอนว่าพวกเขาทับซ้อนกัน แต่คำถามที่มีขอบเขตขนาดใหญ่ขึ้นไม่มีคำตอบ


"สถิติอนุมานจากข้อมูลสารสนเทศดำเนินการกับข้อมูล" นี่คือสิ่งที่ฉันต้องการยืนยัน สำหรับการอนุมานนั้นขึ้นอยู่กับการแจกแจงความน่าจะเป็นเสมอมันควรรวมถึงช่วงความมั่นใจหรือการทดสอบสมมติฐาน มิฉะนั้นคุณจะใช้งานกับข้อมูล
Honglang Wang
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.