มาตรการของความซับซ้อนของแบบจำลอง


19

เราจะเปรียบเทียบความซับซ้อนของทั้งสองรุ่นด้วยจำนวนพารามิเตอร์เท่ากันได้อย่างไร

แก้ไข 09/19 : เพื่อชี้แจงความซับซ้อนของแบบจำลองเป็นการวัดความยากในการเรียนรู้จากข้อมูลที่ จำกัด เมื่อทั้งสองรุ่นเหมาะสมกับข้อมูลที่มีอยู่อย่างเท่าเทียมกันโมเดลที่มีความซับซ้อนต่ำกว่าจะทำให้เกิดข้อผิดพลาดน้อยลงสำหรับข้อมูลในอนาคต เมื่อมีการใช้การประมาณค่านี้อาจไม่จริงเสมอไปทางเทคนิค แต่ก็ไม่เป็นไรถ้ามันมีแนวโน้มที่จะเป็นจริงในทางปฏิบัติ การประมาณค่าต่าง ๆ ให้มาตรการความซับซ้อนที่แตกต่างกัน


คุณสามารถให้ข้อมูลเพิ่มเติมเกี่ยวกับคุณลักษณะที่มีให้กับโมเดลได้หรือไม่
shabbychef

นี่เป็นคำถามเปิดดังนั้นคำถามของฉันคือ - ฉันต้องใช้คุณลักษณะใดในการวัดความซับซ้อน ในระดับพื้นฐานที่สุดแบบจำลองความน่าจะเป็นคือชุดของการแจกแจงความน่าจะเป็นและฉันพอดีกับแบบจำลองกับข้อมูลโดยเลือกสมาชิกที่เหมาะสมที่สุด
Yaroslav Bulatov

3
อะไรคือ "ความซับซ้อน" อย่างแม่นยำ? (นี่ไม่ใช่คำถามที่ผิดพลาด!) ในกรณีที่ไม่มีคำจำกัดความที่เป็นทางการเราไม่สามารถหวังที่จะทำการเปรียบเทียบบางอย่างที่ถูกต้อง
whuber

นั่นคือสิ่งที่ฉันขอเป็นหลัก
Yaroslav Bulatov

2
แต่อย่างน้อยคุณไม่สามารถให้คำแนะนำแก่เราเกี่ยวกับแง่มุมของแบบจำลองที่คุณพยายามจะจับในคำว่า "ความซับซ้อน" หรือไม่? หากปราศจากคำถามนี้ก็จะเป็นการคลุมเครือที่จะยอมรับคำตอบที่สมเหตุสมผล
whuber

คำตอบ:


12

นอกเหนือจากมาตรการต่าง ๆ ของคำอธิบายขั้นต่ำความยาว (เช่นความเป็นไปได้สูงสุดปกติการประมาณข้อมูลฟิชเชอร์) มีสองวิธีอื่นที่ควรกล่าวถึง:

  1. Parametric Bootstrap มันง่ายกว่าที่จะใช้งานมากกว่ามาตรการ MDL ที่เรียกร้อง กระดาษที่ดีคือ Wagenmaker และเพื่อนร่วมงาน:
    Wagenmakers, E.-J. , Ratcliff, R. , Gomez, P. , & Iverson, GJ (2004) การประเมินล้อเลียนรูปแบบการใช้บูตพารา วารสารจิตวิทยาคณิตศาสตร์ , 48, 28-50
    นามธรรม:

    เรานำเสนอขั้นตอนการสุ่มตัวอย่างทั่วไปเพื่อวัดปริมาณการจำลองแบบจำลองซึ่งกำหนดให้เป็นความสามารถของแบบจำลองในการพิจารณาข้อมูลที่สร้างขึ้นโดยแบบจำลองการแข่งขัน ขั้นตอนการสุ่มตัวอย่างนี้เรียกว่าวิธีการข้ามสายรัดข้อต่อพาราเมตริก (PBCM; cf. วิลเลียมส์ (นักสถิติของ JR Soc. B 32 (1970) 350; ชีวภาพ 26 (1970) 23)) สร้างการกระจายของความแตกต่างในความเหมาะสม คาดหวังไว้ภายใต้โมเดลการแข่งขันแต่ละแบบ ในรุ่นข้อมูลที่แจ้งของ PBCM ตัวแบบการสร้างมีค่าพารามิเตอร์เฉพาะที่ได้รับโดยการปรับข้อมูลการทดลองให้เหมาะสมภายใต้การพิจารณา ข้อมูลที่ได้จากการแจกแจงความแตกต่างนั้นสามารถนำมาเปรียบเทียบกับความแตกต่างที่สังเกตได้ในความดีของพอดีเพื่อให้มีการวัดปริมาณของแบบจำลองความเพียงพอ ใน PBCM เวอร์ชันที่ไม่มีข้อมูล แบบจำลองการสร้างมีช่วงกว้างของค่าพารามิเตอร์ขึ้นอยู่กับความรู้ก่อน การประยุกต์ใช้ทั้งข้อมูลที่แจ้งและข้อมูลที่ไม่เป็นไปตามมาตรฐาน PBCM นั้นมีหลายตัวอย่าง

    ปรับปรุง: การประเมินรูปแบบล้อเลียนในภาษาอังกฤษธรรมดา คุณใช้หนึ่งในสองโมเดลการแข่งขันและสุ่มเลือกชุดพารามิเตอร์สำหรับโมเดลนั้น (ไม่ว่าข้อมูลจะแจ้งหรือไม่ก็ตาม) จากนั้นคุณสร้างข้อมูลจากรุ่นนี้ด้วยชุดพารามิเตอร์ที่เลือก ถัดไปคุณปล่อยให้ทั้งสองรุ่นสอดคล้องกับข้อมูลที่ผลิตและตรวจสอบว่าตัวเลือกใดที่เหมาะสมที่สุด หากทั้งสองรุ่นมีความยืดหยุ่นหรือซับซ้อนเท่ากันโมเดลที่คุณสร้างข้อมูลควรให้พอดี อย่างไรก็ตามหากรุ่นอื่นมีความซับซ้อนมากขึ้นก็สามารถให้แบบที่ดีขึ้นแม้ว่าข้อมูลที่ผลิตจากรุ่นอื่น ๆ คุณทำซ้ำหลายครั้งกับทั้งสองรุ่น (เช่นให้ทั้งสองรุ่นสร้างข้อมูลและดูว่าแบบใดเหมาะกับสองแบบที่ดีกว่า) โมเดลที่ "overfits" ข้อมูลที่ผลิตโดยรุ่นอื่นนั้นมีความซับซ้อนมากกว่า

  2. การตรวจสอบข้าม : มันค่อนข้างง่ายที่จะใช้ ดูคำตอบของคำถามนี้ อย่างไรก็ตามโปรดทราบว่าปัญหาที่เกิดขึ้นคือตัวเลือกระหว่างกฎการตัดตัวอย่าง (การลาออกหนึ่งครั้ง, K-fold และอื่น ๆ ) เป็นสิ่งที่ไม่มีหลักการ


ฉันไม่เข้าใจ "แบบจำลองล้อเลียน" จริง ๆ แต่การตรวจสอบข้ามดูเหมือนจะเลื่อนงานการประเมินความซับซ้อน หากคุณใช้ข้อมูลเพื่อเลือกพารามิเตอร์และแบบจำลองของคุณเช่นเดียวกับการตรวจสอบความถูกต้องของคำถามที่เกี่ยวข้องจะกลายเป็นวิธีประมาณการจำนวนข้อมูลที่จำเป็นสำหรับ "meta" นี้ - ฟิตเตอร์ให้ทำงานได้ดี
Yaroslav Bulatov

@Yaroslaw: ฉันไม่เข้าใจปัญหาของคุณกับการตรวจสอบข้าม แต่จริงๆแล้วฉันไม่มีผู้เชี่ยวชาญ อย่างไรก็ตามฉันอยากจะให้เป็นจุดสำหรับการวัดล้อเลียนแบบจำลอง ดังนั้นดูคำตอบที่อัปเดตของฉัน
Henrik

4

ฉันคิดว่ามันจะขึ้นอยู่กับขั้นตอนการติดตั้งอุปกรณ์รุ่นจริง สำหรับมาตรการที่ใช้โดยทั่วไปคุณอาจพิจารณาองศาอิสระทั่วไปที่อธิบายไว้ในYe 1998 - โดยพื้นฐานแล้วความอ่อนไหวของการเปลี่ยนแปลงของแบบจำลองการประมาณเพื่อรบกวนการสังเกต - ซึ่งใช้งานได้ดีเช่นเดียวกับการวัดความซับซ้อนของแบบจำลอง


หืมมมม…เอกสารเกี่ยวกับการถดถอยฉันสงสัยว่าสิ่งนี้สามารถใช้สำหรับการประมาณค่าความน่าจะเป็นแบบแยกได้หรือไม่ นอกจากนี้ฉันไม่เข้าใจแรงจูงใจที่เขามอบให้ - gdf คือระดับความอ่อนไหวของพารามิเตอร์ต่อการเปลี่ยนแปลงเล็กน้อยของข้อมูล แต่ทำไมจึงมีความสำคัญ ฉันสามารถเลือกการกำหนดพารามิเตอร์ที่แตกต่างกันซึ่งการเปลี่ยนแปลงเล็กน้อยในพารามิเตอร์ในการกำหนดพารามิเตอร์ดั้งเดิมสอดคล้องกับการเปลี่ยนแปลงขนาดใหญ่ในการกำหนดพารามิเตอร์ใหม่ดังนั้นมันจึงดูอ่อนไหวต่อข้อมูล แต่เป็นรูปแบบเดียวกัน
Yaroslav Bulatov

Yaroslav:> * ฉันสามารถเลือกการกำหนดพารามิเตอร์ที่แตกต่างกันซึ่งการเปลี่ยนแปลงเล็กน้อยในพารามิเตอร์ในการกำหนดพารามิเตอร์ดั้งเดิมสอดคล้องกับการเปลี่ยนแปลงขนาดใหญ่ในการกำหนดพารามิเตอร์ใหม่ดังนั้นจึงดูเหมือนว่าจะมีความไวต่อข้อมูลมากขึ้น * คุณสามารถยกตัวอย่างได้ ขอขอบคุณ
user603

1
อานนท์ในการถดถอยเชิงเส้นทำงานตามรอยเมทริกซ์ของหมวกหรือผลรวมของความไว - ดังนั้นแรงจูงใจ / แนวคิดจึงไม่ใช่สิ่งที่ไกลออกไป Tibshirani & Knight เสนอเงื่อนไขการแปรปรวนของความแปรปรวนร่วมซึ่งดูที่ความแปรปรวนร่วมของแบบจำลองการประเมินแทนความไว ดูเหมือนว่า GDF จะถูกนำไปใช้ในขั้นตอนของแบบจำลองหลายอย่างเช่นเกวียนและเวฟเล็ต thresholding (กระดาษของ Ye ในการเลือกแบบจำลองการปรับตัวมีรายละเอียดเพิ่มเติม) และในวิธีการทั้งมวลในการควบคุมความซับซ้อน อาจจะมีมูลค่าพยายาม ...
ARS

ไม่ทราบเกี่ยวกับ "ตัวเลียนแบบตัวประมาณจำนวนเท่ากัน" แต่สมมติว่าเราพึ่งพาตัวประมาณค่าความน่าจะเป็นสูงสุดแทน ให้ q = f (p) โดยที่ f คือ bijection บางอย่าง ให้ p0, q0 แสดงถึงการประมาณ MLE ในการกำหนดพารามิเตอร์ที่สอดคล้องกัน p0, q0 จะมีความแปรปรวนแบบซีโมติกต่างกัน แต่ในแง่ของการสร้างแบบจำลองข้อมูลพวกมันจะเทียบเท่ากัน ดังนั้นคำถามมาถึง - ในการปรับพารามิเตอร์ที่เป็นความไวของพารามิเตอร์ที่เป็นตัวแทนของความเสี่ยงที่คาดหวัง?
Yaroslav Bulatov

4

ความยาวขั้นต่ำคำอธิบาย (MDL) และความยาวข้อความต่ำสุด (MML) คุ้มค่าที่จะเช็คเอาท์

เท่าที่เกี่ยวข้องกับ MDL, กระดาษธรรมดาที่แสดงขั้นตอนปกติโอกาสสูงสุด (NML) เช่นเดียวกับการประมาณ asymptotic คือ:

S. de Rooij & P. ​​Grünwald การศึกษาเชิงประจักษ์เกี่ยวกับการเลือกแบบจำลองความยาวต่ำสุดของคำอธิบายที่มีความซับซ้อนเชิงพารามิเตอร์แบบไม่สิ้นสุด วารสารจิตวิทยาคณิตศาสตร์, 2549, 50, 180-192

ที่นี่พวกเขาดูความซับซ้อนของตัวแบบของการกระจายแบบเรขาคณิตกับแบบปัวซอง บทแนะนำที่ยอดเยี่ยม (ฟรี) เกี่ยวกับ MDL สามารถพบได้ที่นี่ที่นี่

อีกวิธีหนึ่งคือกระดาษอยู่กับความซับซ้อนของการกระจายชี้แจงการตรวจสอบที่มีทั้ง MML และ MDL สามารถพบได้ที่นี่ น่าเสียดายที่ไม่มีบทช่วยสอนล่าสุดใน MML แต่หนังสือเล่มนี้เป็นหนังสืออ้างอิงที่ดีเยี่ยมและแนะนำเป็นอย่างยิ่ง


1
ฉันได้อ่านบทความนี้แล้วและดูเหมือนว่า Stochastic Complexity ช่วยแก้ปัญหาที่ไม่สามารถแยกแยะความแตกต่างระหว่างแบบจำลองในมิติเดียวกัน แต่แนะนำปัญหาที่บางครั้งไม่สามารถแยกความแตกต่างระหว่างแบบจำลองของมิติที่แตกต่างกันได้ การกระจายเชิงเรขาคณิตได้รับการกำหนดความซับซ้อนที่ไม่มีที่สิ้นสุดแน่นอนไม่ใช่สิ่งที่เราคาดหวังสำหรับรูปแบบที่เรียบง่ายเช่นนี้!
Yaroslav Bulatov

จุดที่ดีมากเกี่ยวกับความซับซ้อนแบบไม่สิ้นสุด (SC) การแก้ปัญหาของอนันต์เซาท์แคโรไลนามีอยู่จริง แต่ไม่ค่อยสง่างาม การทำงานผิดปกติของ Rissanen ทำงานได้ดีในแบบจำลองเชิงเส้น แต่ไม่ใช่เรื่องง่ายสำหรับปัญหาปัวซอง / เรขาคณิต การเข้ารหัส MML (หรือ SMML) ของข้อมูล Poisson / Geometric นั้นใช้ได้
emakalic

3

คำอธิบายขั้นต่ำความยาวอาจเป็นถนนที่คุ้มค่าในการติดตาม


2
เพียงบันทึกย่อ: ความยาวรายละเอียดขั้นต่ำนั้นมีประสิทธิภาพและมีประโยชน์มาก แต่อาจต้องใช้เวลานานกว่าจะได้ผลลัพธ์โดยเฉพาะอย่างยิ่งเมื่อใช้ความน่าจะเป็นมาตรฐานสูงสุดด้วยชุดข้อมูลขนาดใหญ่กว่า ฉันเคยใช้เวลา 10 วันในการเรียกใช้รหัส FORTRAN เพื่อรับมันสำหรับรุ่นเดียว
Dave Kellen

2

โดย "ความซับซ้อนของรูปแบบ" มักจะหมายถึงความร่ำรวยของพื้นที่รูปแบบ โปรดทราบว่าคำจำกัดความนี้ไม่ได้ขึ้นอยู่กับข้อมูล สำหรับโมเดลเชิงเส้นความสมบูรณ์ของพื้นที่จำลองนั้นวัดได้เล็กน้อยโดยการลดพื้นที่ นี่คือสิ่งที่ผู้เขียนบางคนเรียกว่า "องศาอิสระ" (แม้ว่าในอดีตจะมีการสงวนองศาความเป็นอิสระไว้สำหรับความแตกต่างระหว่างพื้นที่ตัวอย่างและพื้นที่ตัวอย่าง) สำหรับแบบจำลองที่ไม่ใช่เชิงเส้นการวัดความสมบูรณ์ของพื้นที่นั้นเป็นเรื่องเล็กน้อย องศาความคิดเห็นทั่วไป (ดูคำตอบของ ars) เป็นวิธีการวัด เป็นเรื่องทั่วไปมากและสามารถใช้กับพื้นที่จำลอง "แปลก" เช่นต้นไม้, KNN และไลค์ได้ มิติ VC เป็นตัวชี้วัดอื่น

ดังกล่าวข้างต้นคำจำกัดความของ "ความซับซ้อน" นี้เป็นข้อมูลที่เป็นอิสระ ดังนั้นสองรุ่นที่มีจำนวนพารามิเตอร์เท่ากันจึงมักจะมี "ความซับซ้อน" เหมือนกัน


1

จากความคิดเห็นของยาโรสลาฟถึงคำตอบของเฮนริก:

แต่การตรวจสอบข้ามดูเหมือนจะเพิ่งเลื่อนงานการประเมินความซับซ้อน หากคุณใช้ข้อมูลเพื่อเลือกพารามิเตอร์และแบบจำลองของคุณเช่นเดียวกับการตรวจสอบความถูกต้องคำถามที่เกี่ยวข้องจะกลายเป็นวิธีประมาณการจำนวนข้อมูลที่จำเป็นสำหรับ "meta" นี้ - ตัวกรองทำงานได้ดี

kkkV(k)kkเพิ่ม ) จะซับซ้อนน้อยกว่า หนึ่ง.

คุณสามารถให้รสชาติ 'นัยสำคัญ' กับสิ่งนี้ได้เนื่องจากผลลัพธ์ของขั้นตอนนั้นอยู่ในเงื่อนไข (หน่วย) ที่มีความแตกต่างจากข้อผิดพลาดการพยากรณ์ตัวอย่างโดยตรง


1
ฉันจะยอมรับว่าการตรวจสอบข้ามแก้ปัญหาการวัดความซับซ้อนของแบบจำลอง บางทีฉันอาจจะถามคำถามผิดเพราะคำถามเชิงปฏิบัติคือความซับซ้อนของตัวอย่างที่เหมาะสม ผู้เรียนที่ผ่านการตรวจสอบความถูกต้องจะลองรูปแบบที่แตกต่างกันและเลือกหนึ่งที่มีข้อผิดพลาดการตรวจสอบข้ามต่ำสุด ตอนนี้คำถามคือ - ผู้เรียนรายนี้มีแนวโน้มที่จะมีความเหมาะสมมากกว่าคนที่เหมาะกับรูปแบบเดียวโดยมีโอกาสสูงสุดหรือไม่?
Yaroslav Bulatov

Yaroslav Bulatov:> ใช่ แต่คุณสามารถใช้ ML เพื่อเปรียบเทียบโมเดลที่ซ้อนกันได้ ตราบเท่าที่คุณระบุ (ในคำถามของคุณ) กล่าวถึงโมเดลที่มีจำนวนพารามิเตอร์เท่ากันดังนั้นจึงไม่สามารถซ้อนกันได้
user603

อีกปัญหาหนึ่งคือการตรวจสอบข้ามไม่ได้เพิ่มความเข้าใจในความซับซ้อนของแบบจำลองของเรา มาตรการเช่น AIC / BIC ทำให้ชัดเจนว่าพารามิเตอร์จำนวนมากสนับสนุนให้มีการล้น ตอนนี้คำถามจะกลายเป็น - แง่มุมใดของโมเดลที่นอกเหนือจากมิติที่เพิ่มความจุให้มากเกินไป?
Yaroslav Bulatov

Yaroslav:> อีกครั้งจุดที่ดีมาก
user603

หาก overfitting เป็นแนวโน้มของขั้นตอนการปรับแบบจำลองเพื่อให้พอดีกับสัญญาณรบกวนนอกเหนือจากสัญญาณแล้วเราสามารถดูขั้นตอนที่กำหนดเพื่อดูว่าแนวโน้มดังกล่าวอาจเกิดขึ้นได้อย่างไร อาจเป็นเพราะขาดจินตนาการหรือความรู้ในขณะที่พิจารณาขั้นตอนที่แตกต่างกันเล็กน้อยฉันไม่สามารถต้มสิ่งนี้ลงไปเป็นสิ่งที่ไม่สามารถเรียกคืนได้ว่า "จำนวนพารามิเตอร์" (หรือ "จำนวนพารามิเตอร์ที่มีประสิทธิภาพ") เราสามารถพลิกสิ่งนี้บนหัวของมันและถาม: สิ่งอื่นเท่ากันจะเกิดอะไรขึ้นเมื่อเรานำสัญญาณรบกวนข้อมูลของเราไปใช้? จากนั้นเราก็ไปถึงมาตรการต่าง ๆ เช่น GDF ของ Ye
ARS

0

เกณฑ์ข้อมูลสำหรับการเปรียบเทียบแบบจำลองเป็นอย่างไร ดูเช่น http://en.wikipedia.org/wiki/Akaike_information_criterion

ความซับซ้อนของโมเดลอยู่ที่นี่จำนวนพารามิเตอร์ของโมเดล


AIC ไม่ใช่ตัวชี้วัดความซับซ้อนของแบบจำลอง
Sven Hohenstein

@SvenHohenstein จากประโยคสุดท้ายของเขาฉันรวบรวมว่าเขาไม่ได้บอกว่า AIC นั้นเป็นเครื่องวัดความซับซ้อนของแบบจำลอง Brause42 โปรดทราบว่าคำถามจะถามเฉพาะรุ่นที่มีพารามิเตอร์จำนวนเท่ากัน ดังนั้น AIC จะลดลงเป็น SSE หรือเบี่ยงเบนหรืออะไรก็ตาม
gung - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.