อะไรคือความแตกต่างระหว่าง "ฟังก์ชั่นลิงค์" และ "ฟังก์ชั่นลิงก์แบบบัญญัติ" สำหรับ GLM


65

ความแตกต่างระหว่างคำว่า 'ฟังก์ชั่นการเชื่อมโยง' และ 'ฟังก์ชั่นการเชื่อมโยงแบบบัญญัติ' คืออะไร? นอกจากนี้ยังมีข้อดี (ทางทฤษฎี) ของการใช้อย่างใดอย่างหนึ่งมากกว่าที่อื่น ๆ ?

ตัวอย่างเช่นตัวแปรการตอบสนองแบบไบนารีสามารถสร้างแบบจำลองโดยใช้ฟังก์ชั่นลิงค์จำนวนมากเช่นlogit , probitเป็นต้น แต่logitที่นี่ถือเป็นฟังก์ชันลิงก์ "canonical"


10
ฉันพูดคุยเกี่ยวกับฟังก์ชั่นการเชื่อมโยงอย่างกว้างขวางที่นี่: ความแตกต่างระหว่างรุ่น logit และ probitโดยมุ่งเน้นที่การถดถอยสำหรับตัวแปรตอบกลับแบบไบนารี่ แม้ว่าการสนทนาเพียงเล็กน้อยเท่านั้นจะมุ่งเน้นไปที่ความหมายของฟังก์ชั่นลิงค์ว่าเป็น 'บัญญัติ' แต่ก็อาจเป็นประโยชน์ในการอ่าน โปรดทราบว่าการเข้าใจความแตกต่าง b / t & ข้อดีของฟังก์ชันลิงก์แบบ canonical vs non-canonical นั้นจำเป็นต้องมีความลึกลงไปในคณิตศาสตร์พื้นฐานของ GLiM
gung - Reinstate Monica

คำตอบ:


68

คำตอบข้างต้นนั้นใช้งานได้ง่ายขึ้นดังนั้นฉันจึงพยายามอย่างเข้มงวดมากขึ้น

GLM คืออะไร

Y=(y,x)ypx=(x1,,xp)E(y)=μi=1,,nyi

f(yi;θi,ϕ)=exp{[yiθiγ(θi)]/ϕ+τ(yi,ϕ)}
θiϕγτnpการอธิบายตัวแปรจะแสดงด้วยพี เราสมมติว่าอินพุตเวกเตอร์มีอิทธิพลต่อ (1) ผ่านฟังก์ชันเชิงเส้นเท่านั้น, ตัวทำนายเชิงเส้น, η i = β 0 + β 1 x ฉัน1 + + β p x i p ตามที่θ ฉันขึ้นอยู่กับ ในขณะที่มันสามารถแสดงให้เห็นว่าθ = ( γ ) - 1 ( μ )x1,,xp
ηi=β0+β1xi1++βpxip
θiθ=(γ)1(μ)การพึ่งพานี้ถูกสร้างขึ้นโดยการเชื่อมต่อตัวทำนายเชิงเส้นและθผ่านค่าเฉลี่ย โดยเฉพาะอย่างยิ่งค่าเฉลี่ยμถูกมองว่าเป็นฟังก์ชั่นกลับด้านและเรียบของตัวทำนายเชิงเส้นคือ g ( μ ) = η หรือ μ = g - 1 ( η ) ตอนนี้เพื่อตอบคำถามของคุณ:ηθμ
g(μ)=η or μ=g1(η)

g()μηθηθg=(γ)1

Xyixijyij=1,,pμ

ดังนั้นพวกเขามักจะใช้โดยค่าเริ่มต้น อย่างไรก็ตามโปรดทราบว่าไม่มีเหตุผลเบื้องต้นว่าทำไมเอฟเฟกต์ในโมเดลควรเพิ่มขึ้นในสเกลที่กำหนดโดยลิงก์นี้หรือลิงก์อื่นใด


5
+1 นี่เป็นคำตอบที่ดีจริงๆ @Momo ฉันพบว่าสมการบางอันยากที่จะอ่านเมื่อถูกฝังไว้ในย่อหน้าดังนั้นฉันจึง 'ปิดกั้น' พวกเขาโดยใช้เครื่องหมายดอลลาร์สองครั้ง (เช่น$ $) ฉันหวังว่าไม่เป็นไร (ถ้าไม่คุณสามารถย้อนกลับด้วยคำขอโทษของฉัน)
gung - Reinstate Monica

1
@ โมโมคำถามดั้งเดิมที่นี่อย่างไรรวมถึงสิ่งที่ Wei ถามเกี่ยวกับดังนั้นจึงเป็นมูลค่าชี้ให้เห็นว่ายังไม่ได้รับคำตอบอย่างชัดเจน
Glen_b

1
θη=θg(μ)=θθ=(γ)1(μ)θθμg(.)=(γ)1(.)

1
γ(θ)=π=exp(θ)1+exp(θ)(γ)1(.)=logit(.)η=θg(.)θ=logit(π)=ηθηมีอยู่ถ้าเราใช้ฟังก์ชันลิงก์แบบบัญญัติ
Druss2k

2
μθηθ

16

gung อ้างถึงคำอธิบายที่ดี: ลิงก์แบบบัญญัติมีคุณสมบัติทางทฤษฎีพิเศษของความพอเพียงน้อยที่สุด ซึ่งหมายความว่าคุณสามารถกำหนดโมเดล logit แบบมีเงื่อนไข (ซึ่งนักเศรษฐศาสตร์เรียกว่าโมเดลเอฟเฟกต์แบบคงที่) โดยการ จำกัด จำนวนผลลัพธ์ แต่คุณไม่สามารถกำหนดโมเดล probit ที่มีเงื่อนไขได้เนื่องจากไม่มีสถิติเพียงพอที่จะใช้กับลิงก์ probit


คุณสามารถอธิบายเพิ่มเติมเกี่ยวกับความเพียงพอเพียงเล็กน้อยได้หรือไม่? จากคำอธิบายข้างต้นเรายังคงสามารถกำหนดโมเดล probit ได้ใช่ไหม มันจะไม่เป็นฟังก์ชั่นการเชื่อมโยงที่ยอมรับได้แน่นอน แต่สิ่งที่เป็นอันตรายในการใช้ฟังก์ชั่นการเชื่อมโยงที่ไม่เป็นที่ยอมรับ
pikachuchameleon

9

นี่คือแผนภาพเล็ก ๆ ที่ได้แรงบันดาลใจมาจากคลาส18.650ของ MIT ซึ่งฉันคิดว่ามีประโยชน์มากเพราะช่วยให้เห็นภาพความสัมพันธ์ระหว่างฟังก์ชั่นเหล่านี้ ฉันใช้สัญกรณ์เดียวกับในโพสต์ของ @ momo:

ป้อนคำอธิบายรูปภาพที่นี่

  • γ(θ)
  • g(μ)

g

แผนภาพอนุญาตให้ไปจากทิศทางหนึ่งไปอีกทิศทางหนึ่งได้อย่างง่ายดายตัวอย่างเช่น:

η=g(γ(θ))
θ=γ1(g1(η))

ฟังก์ชั่นลิงค์ Canonical

g

γ1g1=(gγ)1=I
θ=η

1

คำตอบข้างต้นได้กล่าวถึงสิ่งที่ฉันต้องการจะพูดไปแล้ว เพียงชี้แจงบางจุดในฐานะนักวิจัยของการเรียนรู้ของเครื่อง:

  1. ฟังก์ชั่นการเชื่อมโยงคืออะไร แต่สิ่งที่ตรงกันข้ามของฟังก์ชั่นการเปิดใช้งาน ตัวอย่างเช่น logit คือค่าผกผันของ sigmoid, probit เป็นค่าผกผันของฟังก์ชันการแจกแจงสะสมของ Gaussian

  2. wTxwx

การสนทนาข้างต้นไม่มีส่วนเกี่ยวข้องกับครอบครัวชี้แจง แต่สามารถพบการสนทนาที่ดีในหนังสือ PRML ของ Christopher Bishop บทที่ 4.3.6

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.