สวยมากทุกแหล่งหรือบุคคลที่ผมเคยมีความสัมพันธ์ที่เคยมียกเว้นแหล่งวุลแฟรมคุณเชื่อมโยงหมายถึงกระบวนการที่เหมาะสมแบบจำลองข้อมูล สิ่งนี้สมเหตุสมผลเนื่องจากตัวแบบเป็นวัตถุแบบไดนามิกและข้อมูลเป็นแบบสแตติก (aka ถาวรและคงที่)
ในการพูดถึงเรื่องนี้ฉันชอบวิธีการของ Larry Wasserman ในเรื่องนี้ ในการบอกของเขาแบบจำลองทางสถิติคือชุดของการแจกแจง ตัวอย่างเช่นการรวบรวมการแจกแจงปกติทั้งหมด:
{ ปกติ( μ , σ) : μ , σ∈ R , σ> 0 }
หรือชุดการแจกแจงปัวซองทั้งหมด:
{ Poisson ( λ ) : λ ∈ R , λ > 0 }
การกระจายข้อมูลไปยังข้อมูลที่เหมาะสมคืออัลกอริธึมใด ๆ ที่รวมโมเดลสถิติเข้ากับชุดข้อมูล (ข้อมูลได้รับการแก้ไข) และเลือกการกระจายอย่างใดอย่างหนึ่งจากแบบจำลองอย่างที่ดีที่สุดสะท้อนถึงข้อมูล
แบบจำลองเป็นสิ่งที่เปลี่ยนแปลง (เรียงลำดับ): เรากำลังยุบจากการรวบรวมความเป็นไปได้ทั้งหมดเป็นทางเลือกที่ดีที่สุด ข้อมูลเป็นเพียงข้อมูล ไม่มีอะไรเกิดขึ้นกับมันเลย