แบบจำลองเชิงเส้นแบบไม่เชิงเส้นกับแบบเชิงเส้นทั่วไป: คุณอ้างถึงการถดถอยแบบลอจิสติกปัวซอง ฯลฯ อย่างไร


23

ฉันมีคำถามเกี่ยวกับความหมายที่ฉันต้องการความคิดเห็นของนักสถิติเพื่อน

เรารู้ว่าแบบจำลองต่างๆเช่นโลจิสติกปัวซอง ฯลฯ ตกอยู่ภายใต้ร่มของตัวแบบเชิงเส้นทั่วไป ตัวแบบมีฟังก์ชั่นไม่เชิงเส้นของพารามิเตอร์ซึ่งอาจถูกจำลองโดยใช้เฟรมเวิร์กโมเดลเชิงเส้นโดยใช้ฟังก์ชันลิงก์ที่เหมาะสม

ฉันสงสัยว่าถ้าคุณพิจารณาสถานการณ์ (สอน?) เช่นการถดถอยโลจิสติกเป็น:

  1. แบบไม่เชิงเส้นกำหนดรูปแบบของพารามิเตอร์
  2. โมเดลเชิงเส้นเนื่องจากลิงก์เปลี่ยนเราเป็นเฟรมเวิร์กโมเดลเชิงเส้น
  3. พร้อมกัน (1) และ (2): มัน "เริ่มต้น" เป็นโมเดลที่ไม่ใช่เชิงเส้น แต่อาจทำงานด้วยวิธีที่ทำให้เราคิดว่ามันเป็นโมเดลเชิงเส้น

หวังว่าฉันจะสามารถตั้งค่าแบบสำรวจที่แท้จริง ...

คำตอบ:


24

นี่เป็นคำถามที่ยอดเยี่ยม

เรารู้ว่าแบบจำลองต่างๆเช่นโลจิสติกปัวซอง ฯลฯ ตกอยู่ภายใต้ร่มของตัวแบบเชิงเส้นทั่วไป

ก็ใช่และไม่ใช่ ด้วยบริบทของคำถามเราต้องระมัดระวังในการระบุสิ่งที่เรากำลังพูดถึง - และ "โลจิสติก" และ "ปัวซอง" เพียงอย่างเดียวไม่เพียงพอที่จะอธิบายสิ่งที่ตั้งใจ

(i) "Poisson" เป็นการแจกแจง เป็นคำอธิบายของการแจกแจงแบบมีเงื่อนไขไม่ใช่เส้นตรง (และไม่ใช่ GLM) เว้นแต่คุณจะระบุโมเดลเชิงเส้น (ในพารามิเตอร์) เพื่ออธิบายค่าเฉลี่ยตามเงื่อนไข (กล่าวคือมันไม่เพียงพอที่จะพูดว่า "ปัวซอง") เมื่อผู้คนระบุว่า "ปัวซองถดถอย" พวกเขาเกือบจะตั้งใจจะเป็นแบบจำลองที่เป็นเชิงเส้นในพารามิเตอร์และดังนั้นจึงเป็น GLM แต่ "ปัวซอง" เพียงอย่างเดียวอาจเป็นจำนวนเท่าใดก็ได้ *

(ii) "Logistic" ในอีกทางหนึ่งหมายถึงคำอธิบายของค่าเฉลี่ย (นั่นหมายถึงค่าขนส่งในการทำนาย) ไม่ใช่ GLM เว้นแต่คุณจะรวมเข้ากับการแจกแจงแบบมีเงื่อนไขซึ่งอยู่ในตระกูลเลขชี้กำลัง เมื่อคนพูดว่า " การถดถอยโลจิสติก " ในทางกลับกันพวกเขามักจะหมายถึงรูปแบบทวินามที่มีลิงค์ logit - นั่นหมายความว่านั่นคือโลจิสติกส์ในตัวทำนายแบบจำลองเป็นเส้นตรงในพารามิเตอร์และอยู่ในตระกูลชี้แจง

โมเดลประกอบด้วยฟังก์ชันที่ไม่เชิงเส้นของพารามิเตอร์

ดีอีกครั้งใช่และไม่ใช่

η=ก.(μ)η=Xβ

ซึ่งในทางกลับกันก็สามารถสร้างแบบจำลองโดยใช้กรอบโมเดลเชิงเส้นโดยใช้ฟังก์ชั่นลิงค์ที่เหมาะสม

แก้ไข

ฉันสงสัยว่าถ้าคุณพิจารณาสถานการณ์ (สอน?) เช่นการถดถอยโลจิสติกเป็น:

(ฉันกำลังเปลี่ยนลำดับคำถามของคุณที่นี่)

โมเดลเชิงเส้นเนื่องจากลิงก์เปลี่ยนเราเป็นเฟรมเวิร์กโมเดลเชิงเส้น

เป็นเรื่องปกติที่จะเรียก GLM ว่า "เส้นตรง" ด้วยเหตุผลนี้ อันที่จริงก็สวยชัดเจนว่านี่คือการประชุมเพราะมันมีสิทธิในชื่อ

แบบไม่เชิงเส้นกำหนดรูปแบบของพารามิเตอร์

เราจะต้องระมัดระวังอย่างมากที่นี่เพราะ "ไม่เชิงเส้น" โดยทั่วไปหมายถึงรูปแบบที่ไม่เชิงเส้นในพารามิเตอร์ การถดถอยแบบไม่เชิงเส้นตรงกับตัวแบบเชิงเส้นทั่วไป

ดังนั้นหากคุณต้องการใช้คำว่า "ไม่เชิงเส้น" เพื่ออธิบาย GLM สิ่งสำคัญคือการระบุสิ่งที่คุณหมายถึงอย่างระมัดระวัง - โดยทั่วไปแล้วค่าเฉลี่ยนั้นไม่เกี่ยวข้องกับตัวทำนายเชิงเส้น

อันที่จริงถ้าคุณทำใช้ "ไม่เชิงเส้น" เพื่ออ้างถึง GLMs คุณจะได้รับเป็นความยากลำบากไม่เพียงกับการประชุม (และดังนั้นไม่ว่าจะมีแนวโน้มที่จะเข้าใจผิด) แต่ยังเมื่อพยายามที่จะพูดคุยเกี่ยวกับทั่วไปรุ่นที่ไม่เป็นเชิงเส้น มันค่อนข้างยากที่จะอธิบายถึงความแตกต่างถ้าคุณกำหนดว่า GLM เป็น "แบบไม่เชิงเส้น" อยู่แล้ว!

ก.(μ)

Y~Poisson(μx)

xYxμxx

μx=α+ประสบการณ์(βx).

xα

ในระยะแรกนั้นหมายถึงอัตราการตายที่คงที่เนื่องจากอุบัติเหตุ (หรือพูดว่า) (หรือผลกระทบอื่น ๆ ที่ไม่สัมพันธ์กับอายุ) ในขณะที่ภาคที่สองมีอัตราการตายเพิ่มขึ้นเนื่องจากอายุ รูปแบบดังกล่าวอาจจะเป็นไปได้ในบางครั้งในช่วงสั้น ๆ ของผู้ใหญ่ที่มีอายุน้อยกว่า มันเป็นกฎของ Makeham เป็นหลัก (มีการนำเสนอเป็นฟังก์ชั่นความเสี่ยง แต่สำหรับอัตรารายปีจะเป็นการประมาณที่สมเหตุสมผล)

นั่นเป็นรูปแบบที่ไม่ใช่เชิงเส้นทั่วไป


ขอบคุณสำหรับข้อมูลของคุณ นี่คือสิ่งที่ฉันพยายามจะทำ เห็นได้ชัดว่า "เชิงเส้น" อยู่ในชื่อของ GLM ฉันพยายามที่จะจัดรูปแบบผู้ที่มีความไม่เป็นเชิงเส้นโดยเนื้อแท้ (พวกเขามีไม่เป็นเชิงเส้นในพารามิเตอร์) ยังเป็น "เชิงเส้น transformably" จึงตกอยู่ภายใต้กรอบ GLM ฉันเดาว่าฉันอาจตอบคำถามของตัวเอง - วิธีที่ดีที่สุดในการอ้างถึงพวกเขาคือ "ไม่เชิงเส้นแปรปรวน"
Meg

1
วิธีที่ใช้กันทั่วไปในการอ้างถึงแบบจำลองที่สามารถแสดงผลแบบเส้นตรงในพารามิเตอร์โดยการแปลงคือ "linearizable" (ตรงกันข้ามกับ "instrincically nonlinear") ฉันคิดว่าเราต้องชัดเจนว่ามันคืออะไรแบบเชิงเส้น (เทียบกับสิ่งที่ไม่ใช่เชิงเส้น) เมื่อพูดถึงแบบจำลองและบางทีอาจจะชัดเจนว่าสิ่งต่าง ๆ นั้นถูกเรียกตามอัตภาพอย่างไรเนื่องจากผู้คนต้องสามารถค้นหาข้อมูลและเข้าใจได้ เมื่อพูดถึงพวกเขา คนที่พูดถึง GLM ในฐานะ "ไม่เชิงเส้น" มีแนวโน้มที่จะเข้าใจผิดเว้นแต่ว่าพวกเขาจะเพิ่มตัวระบุที่ถูกต้องซึ่งทำให้ความหมายชัดเจน
Glen_b -Reinstate Monica

ฉันเห็นด้วย. ฉันเพิ่งเห็นว่ามันจัดว่าเป็นการถดถอยแบบไม่เชิงเส้นในตำราและยังได้รับการสอนโดยอาจารย์ของฉันว่ามันไม่เชิงเส้น ฉันพบว่ามันสับสนเพราะเราจัดการกับมันในกรอบ GLM แต่ฉันก็สามารถเห็นอกเห็นใจ (อย่างน้อย) เอาใจใส่ด้วยการเรียกมันว่าอย่างใดอย่างหนึ่ง ฉันคิดว่าฉันจะไปกับเส้นตรง / เปลี่ยนรูปเชิงเส้นและการอภิปรายของวิธีที่เราได้รับจากจุด A ถึงจุด B (เช่นวิธีที่เราเริ่มต้นด้วยฟังก์ชั่นไม่เชิงเส้นและเปลี่ยนเป็นเชิงเส้นเชิงเส้น)
เม็ก

ใช่ฉันเข้าใจโดยสิ้นเชิง ในขณะที่ฉันยังเห็นอกเห็นใจกับแรงกระตุ้นของพวกเขาที่จะทำเช่นนั้นถ้าฉันมีหูพวกเขาฉันจะเตือนพวกเขาไม่ให้ฝึกเรียกพวกนางแบบไม่เชิงเส้น (อย่างน้อยก็ไม่ได้โดยไม่ต้องมีคุณสมบัติเสมอ) นั่นเป็นส่วนสำคัญที่ทำให้ฉันคิดว่านี่เป็นคำถามที่สำคัญ - บางครั้งผู้คนเรียกพวกเขาว่าไม่เป็นเชิงเส้นซึ่งฉันคิดว่าดีตราบใดที่เรายังชัดเจนเกี่ยวกับสิ่งที่เราเรียกว่าไม่เชิงเส้นเนื่องจากไม่ใช่วิธีธรรมดาที่สุด อ้างถึงโมเดล - เมื่อเราต่อต้านการประชุมเราควรทำอย่างระมัดระวังและจงใจ
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.