นี่เป็นคำถามที่ยอดเยี่ยม
เรารู้ว่าแบบจำลองต่างๆเช่นโลจิสติกปัวซอง ฯลฯ ตกอยู่ภายใต้ร่มของตัวแบบเชิงเส้นทั่วไป
ก็ใช่และไม่ใช่ ด้วยบริบทของคำถามเราต้องระมัดระวังในการระบุสิ่งที่เรากำลังพูดถึง - และ "โลจิสติก" และ "ปัวซอง" เพียงอย่างเดียวไม่เพียงพอที่จะอธิบายสิ่งที่ตั้งใจ
(i) "Poisson" เป็นการแจกแจง เป็นคำอธิบายของการแจกแจงแบบมีเงื่อนไขไม่ใช่เส้นตรง (และไม่ใช่ GLM) เว้นแต่คุณจะระบุโมเดลเชิงเส้น (ในพารามิเตอร์) เพื่ออธิบายค่าเฉลี่ยตามเงื่อนไข (กล่าวคือมันไม่เพียงพอที่จะพูดว่า "ปัวซอง") เมื่อผู้คนระบุว่า "ปัวซองถดถอย" พวกเขาเกือบจะตั้งใจจะเป็นแบบจำลองที่เป็นเชิงเส้นในพารามิเตอร์และดังนั้นจึงเป็น GLM แต่ "ปัวซอง" เพียงอย่างเดียวอาจเป็นจำนวนเท่าใดก็ได้ *
(ii) "Logistic" ในอีกทางหนึ่งหมายถึงคำอธิบายของค่าเฉลี่ย (นั่นหมายถึงค่าขนส่งในการทำนาย) ไม่ใช่ GLM เว้นแต่คุณจะรวมเข้ากับการแจกแจงแบบมีเงื่อนไขซึ่งอยู่ในตระกูลเลขชี้กำลัง เมื่อคนพูดว่า " การถดถอยโลจิสติก " ในทางกลับกันพวกเขามักจะหมายถึงรูปแบบทวินามที่มีลิงค์ logit - นั่นหมายความว่านั่นคือโลจิสติกส์ในตัวทำนายแบบจำลองเป็นเส้นตรงในพารามิเตอร์และอยู่ในตระกูลชี้แจง
โมเดลประกอบด้วยฟังก์ชันที่ไม่เชิงเส้นของพารามิเตอร์
ดีอีกครั้งใช่และไม่ใช่
η= g( μ )η= Xβ
ซึ่งในทางกลับกันก็สามารถสร้างแบบจำลองโดยใช้กรอบโมเดลเชิงเส้นโดยใช้ฟังก์ชั่นลิงค์ที่เหมาะสม
แก้ไข
ฉันสงสัยว่าถ้าคุณพิจารณาสถานการณ์ (สอน?) เช่นการถดถอยโลจิสติกเป็น:
(ฉันกำลังเปลี่ยนลำดับคำถามของคุณที่นี่)
โมเดลเชิงเส้นเนื่องจากลิงก์เปลี่ยนเราเป็นเฟรมเวิร์กโมเดลเชิงเส้น
เป็นเรื่องปกติที่จะเรียก GLM ว่า "เส้นตรง" ด้วยเหตุผลนี้ อันที่จริงก็สวยชัดเจนว่านี่คือการประชุมเพราะมันมีสิทธิในชื่อ
แบบไม่เชิงเส้นกำหนดรูปแบบของพารามิเตอร์
เราจะต้องระมัดระวังอย่างมากที่นี่เพราะ "ไม่เชิงเส้น" โดยทั่วไปหมายถึงรูปแบบที่ไม่เชิงเส้นในพารามิเตอร์ การถดถอยแบบไม่เชิงเส้นตรงกับตัวแบบเชิงเส้นทั่วไป
ดังนั้นหากคุณต้องการใช้คำว่า "ไม่เชิงเส้น" เพื่ออธิบาย GLM สิ่งสำคัญคือการระบุสิ่งที่คุณหมายถึงอย่างระมัดระวัง - โดยทั่วไปแล้วค่าเฉลี่ยนั้นไม่เกี่ยวข้องกับตัวทำนายเชิงเส้น
อันที่จริงถ้าคุณทำใช้ "ไม่เชิงเส้น" เพื่ออ้างถึง GLMs คุณจะได้รับเป็นความยากลำบากไม่เพียงกับการประชุม (และดังนั้นไม่ว่าจะมีแนวโน้มที่จะเข้าใจผิด) แต่ยังเมื่อพยายามที่จะพูดคุยเกี่ยวกับทั่วไปรุ่นที่ไม่เป็นเชิงเส้น มันค่อนข้างยากที่จะอธิบายถึงความแตกต่างถ้าคุณกำหนดว่า GLM เป็น "แบบไม่เชิงเส้น" อยู่แล้ว!
ก.( μ )
Y∼ ปัวซอง( μx)
xYxμxx
μx= α + exp( βx ).
xα
ในระยะแรกนั้นหมายถึงอัตราการตายที่คงที่เนื่องจากอุบัติเหตุ (หรือพูดว่า) (หรือผลกระทบอื่น ๆ ที่ไม่สัมพันธ์กับอายุ) ในขณะที่ภาคที่สองมีอัตราการตายเพิ่มขึ้นเนื่องจากอายุ รูปแบบดังกล่าวอาจจะเป็นไปได้ในบางครั้งในช่วงสั้น ๆ ของผู้ใหญ่ที่มีอายุน้อยกว่า มันเป็นกฎของ Makeham เป็นหลัก (มีการนำเสนอเป็นฟังก์ชั่นความเสี่ยง แต่สำหรับอัตรารายปีจะเป็นการประมาณที่สมเหตุสมผล)
นั่นเป็นรูปแบบที่ไม่ใช่เชิงเส้นทั่วไป