ความหมายของ 'จำนวนพารามิเตอร์' ใน AIC


21

เมื่อคำนวณ AIC

AIC=2k2lnL

k หมายถึง 'จำนวนพารามิเตอร์' แต่สิ่งที่นับเป็นพารามิเตอร์ ตัวอย่างเช่นในโมเดล

y=ax+b

a และ b ถูกนับเป็นพารามิเตอร์เสมอหรือไม่ ถ้าฉันไม่สนใจเกี่ยวกับคุณค่าของการสกัดกั้นฉันจะเพิกเฉยหรือไม่ก็นับได้หรือไม่

เกิดอะไรขึ้นถ้า

y=af(c,x)+b

โดยที่fคือฟังก์ชันของ c และ x ตอนนี้ฉันจะนับ 3 พารามิเตอร์หรือไม่


9
นี่เป็นคำถามที่ดีเพราะมีความละเอียด: คือจำนวนของพารามิเตอร์ที่สามารถระบุได้ที่จะประมาณ ยกตัวอย่างเช่นแม้ว่าในรูปแบบการถดถอยY ~ N ( β 0 + β 1 X 1 + β 2 X 2 + β 3 ( X 1 + X 2 ) , σ 2 )ห้าพารามิเตอร์จะเขียน แต่k = 4 (รุ่นนี้เทียบเท่ากับY N (kYN(β0+β1X1+β2X2+β3(X1+X2),σ2) k=4ด้วย α 1 = β 1 + β 3และ α 2 = β 2 + β 3ซึ่งต้องการพารามิเตอร์เพียงสี่ตัวเท่านั้น)YN(β0+α1X1+α2X2,σ2)α1=β1+β3α2=β2+β3
whuber

3
อย่างเคร่งครัดคุณจะนับพารามิเตอร์อิสระที่สามารถระบุตัวได้ทั้งหมด - ค่าเฉลี่ยพารามิเตอร์พารามิเตอร์รูปร่างและสเกลพารามิเตอร์ใด ๆ ก็ตาม (และเป็นสิ่งสำคัญสำหรับ AIC C ) แต่สำหรับ AIC นั้นจะไม่มีผลใด ๆ หากคุณไม่ใช้พารามิเตอร์ทั่วไป ตัวอย่างเช่นในการถดถอยคุณควรนับพารามิเตอร์ผลต่าง ดังนั้นโดยการนับของฉันพารามิเตอร์ทั้งหมดของคุณนับในคำถามของคุณเป็นหนึ่งสั้น - แต่ถ้ามีอย่างแน่นอนในทุกรูปแบบก็ไม่เจ็บที่จะลดลงสำหรับ AIC R นับพารามิเตอร์ความแปรปรวนอย่างชัดเจนเมื่อคำนวณ AIC ในแบบจำลองการถดถอย C
Glen_b -Reinstate Monica

@whuber ทำไมความคิดเห็นที่ยอดเยี่ยมนี้ไม่ได้โพสต์เป็นคำตอบ? :)
Alexis

ขอบคุณ @Alexis ฉันโพสต์ความคิดนี้เป็นความคิดเห็นเพราะความคิดนั้นได้รับการครอบคลุมอย่างเพียงพอในคำตอบของ P Schnell: ฉันต้องการเพียงเพื่อเน้นย้ำอีกเล็กน้อย
whuber

คำตอบ:


17

ดังที่ mugen กล่าวไว้แสดงถึงจำนวนของพารามิเตอร์ที่ประมาณไว้ กล่าวอีกนัยหนึ่งคือจำนวนปริมาณเพิ่มเติมที่คุณต้องทราบเพื่อระบุรุ่นทั้งหมด ในโมเดลการถดถอยเชิงเส้นอย่างง่าย y = a x + b คุณสามารถประมาณa , bหรือทั้งคู่ ไม่ว่าคุณจะประมาณปริมาณเท่าใดคุณต้องแก้ไข ไม่มี "ละเว้น" พารามิเตอร์ในแง่ที่คุณไม่รู้จักและไม่สนใจมัน โมเดลที่พบบ่อยที่สุดที่ไม่ได้ประเมินทั้งaและbคือโมเดลที่ไม่มีการดักจับซึ่งเราจะแก้ไขb = 0k

y=ax+b
ababb=0เป็นรุ่นที่ไม่มีการสกัดกั้นที่เราจะแก้ไขปัญหานี้จะมี 1 พารามิเตอร์ คุณสามารถได้อย่างง่ายดายเพียงแก้ไขหรือ b = 1หากคุณมีเหตุผลที่จะเชื่อว่ามันสะท้อนความเป็นจริง (จุดที่ดี: σa=2b=1σยังเป็นพารามิเตอร์ในการถดถอยเชิงเส้นอย่างง่าย แต่เนื่องจากมีในทุกรุ่นคุณจึงสามารถวางได้โดยไม่กระทบกับการเปรียบเทียบ AIC)

หากโมเดลของคุณคือ จำนวนพารามิเตอร์ขึ้นอยู่กับว่าคุณจะแก้ไขค่าใด ๆ เหล่านี้และในรูปแบบของฉ ตัวอย่างเช่นถ้าเราต้องการประมาณa , b , cและรู้ว่าf ( c , x ) = x cดังนั้นเมื่อเราเขียนโมเดลเรามี y = a x c + b พร้อมพารามิเตอร์ที่ไม่รู้จักสามตัว อย่างไรก็ตามถ้าf ( c ,

y=af(c,x)+b
fa,b,cf(c,x)=xc
y=axc+b
f(c,x)=cxจากนั้นเรามีโมเดล ซึ่งมีเพียงสองพารามิเตอร์เท่านั้น: a cและ b
y=acx+b
acb

มันเป็นสิ่งสำคัญที่เป็นครอบครัวของฟังก์ชั่นการจัดทำดัชนีโดยค หากคุณรู้ว่าf ( c , x )นั้นต่อเนื่องและขึ้นอยู่กับcและxคุณก็จะโชคไม่ดีเพราะมีฟังก์ชั่นต่อเนื่องมากมายนับไม่ถ้วนf(c,x)cf(c,x)cx


2
(+1) อาจจะมีมูลค่าการกล่าวขวัญว่าตลอด "การประมาณการ" หมายถึง "การประมาณการโดยโอกาสสูงสุด"
Scortchi - Reinstate Monica

มันสำคัญจริงๆเหรอ? ในความเป็นจริงของฉันเป็นแบบจำลองขนาดใหญ่ไม่สามารถแยกวิเคราะห์และใช้เวลาในการคำนวณ ฉันลองกับc ที่แตกต่างกันประมาณ 20 ค่าเพราะนั่นคือทั้งหมดที่เรามีเวลาและฉันก็ติดกับค่าcที่ให้r 2ที่ดีที่สุดในตอนท้ายของวัน ดังนั้นในลักษณะของการพูดฉันได้ประเมินอย่างดีที่สุดเท่าที่จะทำได้แม้ว่าจะไม่ใช่อย่างที่คุณต้องการในการถดถอย แน่นอนว่ามันยังนับเป็นพารามิเตอร์สำหรับ AIC f(c,x)ccr2c
แทรกบ๊อบ

2
@ScreenBob: ใช่ - เมื่อคุณเปรียบเทียบแบบจำลองทั้งสองแบบความแตกต่างในความเป็นไปได้สูงสุดในการบันทึกคือตัวประมาณค่าความลำเอียงของความแตกต่างในการสูญเสียข้อมูล Kullback-Leibler ที่คาดไว้และระยะเวลาการลงโทษใน AIC โดยประมาณ
Scortchi - Reinstate Monica

1
@ScreenBob: ฉันควรจะพูดถึงว่ามีการดัดแปลงของ AIC สำหรับการประมาณสมการทั่วไปและสิ่งที่คล้ายกัน - พวกเขาใช้โอกาสเสมือนจริงสูงสุดและระยะการลงโทษที่ซับซ้อนมากขึ้น
Scortchi - Reinstate Monica

4

สำหรับโมเดลเชิงสถิติใด ๆ ค่า AIC คือ Aผม=2k-2LN(L) โดยที่ k คือจำนวนพารามิเตอร์ในตัวแบบและ L คือค่าสูงสุดของฟังก์ชันความน่าจะเป็นสำหรับตัวแบบ

(ดูที่นี่ )

อย่างที่คุณเห็น kแสดงถึงจำนวนของพารามิเตอร์ที่ประมาณไว้ในแต่ละรุ่น หากแบบจำลองของคุณมีจุดตัด (นั่นคือถ้าคุณคำนวณจุดประมาณความแปรปรวนและช่วงความเชื่อมั่นสำหรับจุดตัด) มันจะนับเป็นพารามิเตอร์ ในทางกลับกันถ้าคุณกำลังคำนวณโมเดลโดยไม่มีการสกัดกั้นมันจะไม่นับ

โปรดจำไว้ว่า AIC ไม่เพียง แต่จะสรุปความดีของความพอดี แต่ยังพิจารณาถึงความซับซ้อนของแบบจำลอง นั่นเป็นเหตุผลk มีอยู่เพื่อลงโทษโมเดลด้วยพารามิเตอร์เพิ่มเติม

ฉันรู้สึกไม่มีความรู้เพียงพอที่จะตอบคำถามที่สองของคุณฉันจะปล่อยให้สมาชิกคนอื่นของชุมชน


1
นั่นหมายความว่าถ้าฉัน Box-Cox แปลงทั้ง x และ y แล้ว λจากการแปลงแต่ละครั้งจะนับเป็นพารามิเตอร์ด้วยหรือไม่
แทรกบ๊อบ

1
ใช่แน่นอน
PA6OTA

1

อันดับแรกสำหรับผู้ที่อาจไม่คุ้นเคยกับ AIC: Akaike Information Criterion (AIC) เป็นตัวชี้วัดที่ออกแบบมาง่าย ๆ เพื่อเปรียบเทียบ "ความดี" ของแบบจำลอง

จากข้อมูลของ AIC เมื่อพยายามเลือกระหว่างสองโมเดลที่แตกต่างกันที่ใช้กับอินพุตและตัวแปรตอบกลับเดียวกันเดียวกันนั่นคือโมเดลที่ออกแบบมาเพื่อแก้ปัญหาเดียวกันโมเดลที่มี AIC ต่ำกว่าจะถือว่า "ดีกว่า"

ในสูตร AIC kหมายถึงจำนวนของตัวแปร (คุณสมบัติการป้อนข้อมูลหรือคอลัมน์) ในรูปแบบ โมเดลที่ซับซ้อนมากขึ้นคือ (ตัวแปรที่จำเป็นสำหรับการประมาณค่าหรือการทำนาย) ยิ่ง AIC ยิ่งสูง สิ่งนี้ทำให้มั่นใจได้ว่าในสองรุ่นที่มีพลังการทำนายหรือความแม่นยำเท่ากันโมเดลที่เรียบง่ายจะเป็นผู้ชนะ นี่คือรูปแบบหนึ่งของ Occam's razor

ดังนั้นคำตอบง่ายๆสำหรับคำถามสุดท้ายคือ: ถ้าcใน(,x)เป็นค่าคงที่ที่ไม่เปลี่ยนแปลงกับการสังเกตจากนั้นไม่ควรรวมอยู่ในk.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.