ให้เราพิจารณาสถานการณ์ง่ายๆที่ไม่มีข้อมูล covariate ในข้อมูลของคุณ บอกว่าคุณเพียงแค่ต้องสังเกต{R}Y1,Y2,…,Yn∈R
หากคุณใช้การแจกแจงแบบปกติเพื่อทำโมเดลข้อมูลของคุณคุณอาจจะเขียนมัน
Yi∼N(μ,σ2) ,
จากนั้นลองประเมินและอาจผ่านการประเมินความเป็นไปได้สูงสุดμσ
แต่สมมุติว่าข้อมูลของคุณเป็นข้อมูลนับและไม่กระจายตามปกติ กรณีนี้ไม่ได้ต่อเนื่องดังนั้นคุณอาจใช้การกระจายปัวซองแทน:
Yi∼Poisson(λ)แลมบ์ดา)
อย่างไรก็ตามคุณมีพารามิเตอร์เดียวที่นี่! เดียวพารามิเตอร์กำหนดทั้งค่าเฉลี่ยและความแปรปรวนโดยและ\ สิ่งนี้จะเกิดขึ้นเมื่อคุณใช้การแจกแจงแบบเบอร์โนลลีหรือทวินาม แต่คุณอาจมีความแปรปรวนมากขึ้นหรือน้อยลงในข้อมูลของคุณอาจเป็นเพราะการสังเกตนั้นไม่ได้เป็นจริงหรือการกระจายที่คุณเลือกนั้นไม่สมจริงพอλE[Yi]=λVar[Yi]=λ
ดังนั้นผู้คนจึงเพิ่มพารามิเตอร์การกระจายเพื่อให้ได้ระดับความอิสระเพิ่มขึ้นในการสร้างแบบจำลองค่าเฉลี่ยและความแปรปรวนพร้อมกัน ฉันเดาว่าตำราเรียนใด ๆ เกี่ยวกับ GLM จะให้รายละเอียดและคำอธิบายทางคณิตศาสตร์เกี่ยวกับมันคืออะไร แต่ฉันเชื่อว่าแรงบันดาลใจนั้นค่อนข้างง่ายเช่นนี้