ฉันจะหยุดพักที่นี่แม้ว่าฉันจะไม่ได้เป็นนักสถิติ แต่อย่างใด แต่ทำขึ้นเพื่อทำ 'การสร้างแบบจำลอง' มากมาย - สถิติและไม่ใช่สถิติ
ก่อนอื่นเรามาเริ่มด้วยพื้นฐาน:
โมเดลคืออะไรกันแน่
แบบจำลองเป็นตัวแทนของความเป็นจริงแม้ว่าจะง่ายขึ้นมาก ลองนึกถึงหุ่นขี้ผึ้งหรือไม้สำหรับบ้าน คุณสามารถสัมผัส / รู้สึก / ดมได้ ตอนนี้แบบจำลองทางคณิตศาสตร์เป็นการแสดงถึงความเป็นจริงโดยใช้ตัวเลข
'ความจริง' นี่คืออะไรฉันได้ยินคุณถาม ตกลง. ดังนั้นคิดว่าสถานการณ์ง่าย ๆ นี้: ผู้ว่าการรัฐของคุณใช้นโยบายที่บอกว่าราคาบุหรี่หนึ่งซองจะมีราคา $ 100 สำหรับปีถัดไป 'เป้าหมาย' คือขัดขวางผู้คนจากการซื้อบุหรี่ดังนั้นการลดการสูบบุหรี่จึงทำให้ผู้สูบบุหรี่มีสุขภาพดีขึ้น (เพราะพวกเขาต้องการเลิกสูบบุหรี่)
หลังจาก 1 ปีผู้ว่าการรัฐขอให้คุณ - นี่เป็นความสำเร็จหรือไม่ คุณจะพูดอย่างนั้นได้อย่างไร คุณสามารถเก็บข้อมูลเช่นจำนวนของแพ็คเก็ตที่ขาย / วันหรือต่อปีการตอบแบบสำรวจข้อมูลที่สามารถวัดได้ที่คุณสามารถรับมือได้ซึ่งเกี่ยวข้องกับปัญหา คุณเพิ่งเริ่มต้น 'จำลอง' ปัญหา ตอนนี้คุณต้องการวิเคราะห์ว่า 'รุ่น' นี้พูดอะไร นั่นคือสิ่งที่การสร้างแบบจำลองทางสถิติมีประโยชน์ คุณสามารถเรียกใช้พล็อตสหสัมพันธ์ / สแกตเตอร์เพื่อดูว่าโมเดล 'มีลักษณะอย่างไร' คุณอาจนึกอยากรู้สาเหตุเช่นถ้าราคาที่เพิ่มขึ้นนำไปสู่การลดลงของการสูบบุหรี่หรือมีปัจจัยอื่นที่ทำให้สับสนในการเล่น (เช่นอาจเป็นอย่างอื่นบ้างและแบบจำลองของคุณอาจพลาดไป)
ตอนนี้การสร้างแบบจำลองนี้ทำได้โดย 'ชุดของกฎ' (เช่นแนวทางเพิ่มเติม) คืออะไร / ไม่ถูกกฎหมายหรืออะไรที่ไม่สมเหตุสมผล คุณควรรู้ว่าคุณกำลังทำอะไรและจะตีความผลลัพธ์ของรุ่นนี้ได้อย่างไร การสร้าง / การดำเนินการ / การตีความโมเดลนี้จำเป็นต้องมีความรู้พื้นฐานด้านสถิติ ในตัวอย่างข้างต้นคุณจำเป็นต้องรู้เกี่ยวกับความสัมพันธ์ / แผนการกระจายการถดถอย (uni และหลายตัวแปร) และสิ่งอื่น ๆ ฉันขอแนะนำให้อ่านสถิติการทำความเข้าใจอย่างสนุกสนาน / ให้ข้อมูลอย่างสังหรณ์ใจ: ค่า p คืออะไรมันเป็นคำแนะนำเกี่ยวกับสถิติที่น่าขบขันและจะสอนให้คุณ 'สร้างแบบจำลอง' ตลอดเส้นทางจากง่ายไปจนถึงขั้นสูง (เช่นการถดถอยเชิงเส้น) จากนั้นคุณสามารถไปอ่านสิ่งอื่นได้
ดังนั้นจำรูปแบบเป็นตัวแทนของความเป็นจริงและที่ว่า"ทุกรุ่นจะผิด แต่บางคนจะมีประโยชน์มากกว่าคนอื่น ๆ" แบบจำลองเป็นการนำเสนอความเป็นจริงที่ง่ายขึ้นและคุณไม่สามารถพิจารณาทุกสิ่งได้แต่คุณต้องรู้ว่าต้องทำอะไรและไม่ควรพิจารณาถึงแบบจำลองที่ดีที่สามารถให้ผลลัพธ์ที่มีความหมายแก่คุณ
มันไม่ได้หยุดอยู่แค่นี้ คุณสามารถสร้างแบบจำลองเพื่อจำลองความเป็นจริงได้เช่นกัน! นั่นคือจำนวนของตัวเลขจะเปลี่ยนไปตามเวลา (พูด) ตัวเลขเหล่านี้จับคู่กับการตีความที่มีความหมายในโดเมนของคุณ คุณยังสามารถสร้างแบบจำลองเหล่านี้เพื่อขุดข้อมูลของคุณเพื่อดูว่ามาตรการต่าง ๆ เกี่ยวข้องกันอย่างไร (การประยุกต์ใช้สถิติที่นี่อาจเป็นปัญหา แต่ไม่ต้องกังวลตอนนี้) ตัวอย่าง: คุณดูที่ร้านขายของชำสำหรับร้านค้าต่อเดือนและตระหนักว่าเมื่อใดก็ตามที่มีการซื้อเบียร์จะมีผ้าอ้อมหนึ่งชุด (คุณสร้างแบบจำลองที่วิ่งผ่านชุดข้อมูลและแสดงให้คุณเห็นถึงความสัมพันธ์นี้) มันอาจจะแปลก แต่ก็อาจบอกเป็นนัย ๆ ว่าพ่อส่วนใหญ่ซื้อสิ่งนี้ในช่วงสุดสัปดาห์เมื่อทารกนั่งเลี้ยงลูกของพวกเขา? ใส่ผ้าอ้อมใกล้เบียร์และคุณอาจเพิ่มยอดขายของคุณ! Aaah! การสร้างแบบจำลอง :)
นี่เป็นเพียงตัวอย่างและไม่ได้มีการอ้างอิงสำหรับการทำงานระดับมืออาชีพ โดยทั่วไปคุณสร้างแบบจำลองเพื่อทำความเข้าใจ / ประเมินความเป็นจริงที่ว่า / จะทำหน้าที่อย่างไรและเพื่อการตัดสินใจที่ดีขึ้นตามผลลัพธ์ สถิติหรือไม่คุณอาจทำแบบจำลองตลอดชีวิตของคุณโดยไม่รู้ตัว ขอให้โชคดี :)