หมายความว่าอย่างไรเมื่อเราบอกว่าเรามีแบบจำลองที่อิ่มตัว?
หมายความว่าอย่างไรเมื่อเราบอกว่าเรามีแบบจำลองที่อิ่มตัว?
คำตอบ:
แบบจำลองอิ่มตัวคือหนึ่งในที่มีพารามิเตอร์ประมาณเป็นจุดข้อมูล ตามคำนิยามสิ่งนี้จะนำไปสู่ความลงตัวที่สมบูรณ์แบบ แต่จะมีการใช้งานทางสถิติน้อยเนื่องจากคุณไม่มีข้อมูลเหลือสำหรับการประมาณความแปรปรวน
ตัวอย่างเช่นถ้าคุณมีจุดข้อมูล 6 จุดและพอดีกับพหุนามลำดับที่ 5 กับข้อมูลคุณจะมีรูปแบบอิ่มตัว (หนึ่งพารามิเตอร์สำหรับแต่ละ 5 พลังของตัวแปรอิสระของคุณบวกหนึ่งสำหรับคำคงที่)
แบบจำลองที่อิ่มตัวคือแบบจำลองที่มีพารามิเตอร์มากเกินไปจนถึงจุดที่โดยทั่วไปแล้วเพียงแค่ทำการประมาณค่าข้อมูล ในการตั้งค่าบางอย่างเช่นการบีบอัดภาพและการสร้างใหม่สิ่งนี้ไม่จำเป็นต้องเป็นเรื่องเลวร้าย แต่ถ้าคุณกำลังพยายามสร้างแบบจำลองการทำนายมันเป็นปัญหามาก
กล่าวโดยสรุปแล้วตัวแบบอิ่มตัวนั้นจะนำไปสู่การทำนายความแปรปรวนสูงซึ่งถูกรบกวนโดยเสียงรบกวนมากกว่าข้อมูลจริง
ลองจินตนาการว่าคุณมีแบบจำลองที่อิ่มตัวและมีเสียงรบกวนจากข้อมูลจากนั้นลองจินตนาการถึงแบบจำลองที่เหมาะสมสักสองสามร้อยครั้งในแต่ละครั้งที่มีการรับรู้เสียงที่แตกต่างกันจากนั้นจึงคาดเดาจุดใหม่ คุณมีแนวโน้มที่จะได้รับผลลัพธ์ที่แตกต่างอย่างสิ้นเชิงในแต่ละครั้งทั้งเพื่อความพอดีและการคาดการณ์ของคุณ (และโมเดลพหุนามมีความสำคัญอย่างยิ่งในเรื่องนี้) กล่าวอีกนัยหนึ่งความแปรปรวนของความพอดีและตัวทำนายนั้นสูงมาก
ในทางตรงกันข้ามแบบจำลองที่ไม่อิ่มตัวจะ (ถ้าสร้างขึ้นอย่างสมเหตุสมผล) ให้เหมาะสมที่สอดคล้องกันมากยิ่งขึ้นแม้จะอยู่ภายใต้การทำให้เกิดเสียงที่แตกต่างกันและความแปรปรวนของตัวทำนายก็จะลดลงเช่นกัน
แบบจำลองจะอิ่มตัวหากมีพารามิเตอร์มากเท่าที่มีจุดข้อมูล (การสังเกต) หรือวางไว้เป็นอย่างอื่นในรูปแบบที่ไม่อิ่มตัวองศาอิสระมีขนาดใหญ่กว่าศูนย์
สิ่งนี้หมายความว่าแบบจำลองนี้ไร้ประโยชน์เพราะมันไม่ได้อธิบายข้อมูลอย่างละเอียดมากกว่าข้อมูลดิบ (และการอธิบายข้อมูลโดยทั่วไปนั้นเป็นความคิดที่อยู่เบื้องหลังการใช้แบบจำลอง) นอกจากนี้โมเดลที่อิ่มตัวสามารถ (แต่ไม่จำเป็น) ให้พอดี (ไร้ประโยชน์) เพราะพวกมันแค่แทรกหรือย้ำข้อมูล
ยกตัวอย่างเช่นค่าเฉลี่ยเป็นแบบจำลองสำหรับข้อมูลบางอย่าง หากคุณมีจุดข้อมูลเพียงจุดเดียว (เช่น 5) โดยใช้ค่าเฉลี่ย (เช่น 5; โปรดทราบว่าค่าเฉลี่ยเป็นแบบจำลองที่อิ่มตัวสำหรับจุดข้อมูลเดียวเท่านั้น) ไม่ได้ช่วยอะไรเลย อย่างไรก็ตามหากคุณมีจุดข้อมูลสองจุดอยู่แล้ว (เช่น 5 และ 7) โดยใช้ค่าเฉลี่ย (เช่น 6) เป็นแบบจำลองจะให้คำอธิบายที่ละเอียดยิ่งกว่าข้อมูลต้นฉบับ
อย่างที่ทุกคนพูดไว้ก่อนหน้านี้หมายความว่าคุณมีพารามิเตอร์มากพอที่คุณมีจุดข้อมูล ดังนั้นไม่มีความดีของการทดสอบแบบพอดี แต่นี่ไม่ได้หมายความว่า "ตามคำจำกัดความ" รุ่นสามารถพอดีกับจุดข้อมูลใด ๆ ฉันสามารถบอกคุณได้จากประสบการณ์ส่วนตัวของการทำงานกับรุ่นอิ่มตัวบางอย่างที่ไม่สามารถทำนายจุดข้อมูลเฉพาะได้ มันค่อนข้างหายาก แต่เป็นไปได้
อีกเรื่องที่สำคัญคือความอิ่มตัวไม่ได้หมายความว่าไร้ประโยชน์ ตัวอย่างเช่นในแบบจำลองทางคณิตศาสตร์ของการรับรู้ของมนุษย์พารามิเตอร์แบบจำลองมีความเกี่ยวข้องกับกระบวนการทางความรู้เฉพาะที่มีพื้นหลังทางทฤษฎี หากแบบจำลองมีความอิ่มตัวคุณสามารถทดสอบความเพียงพอของแบบจำลองนั้นได้โดยทำการทดลองที่มุ่งเน้นพร้อมกับการปรับเปลี่ยนที่ควรส่งผลต่อพารามิเตอร์เฉพาะเท่านั้น หากการทำนายเชิงทฤษฎีตรงกับความแตกต่างที่สังเกตได้ (หรือขาด) ในการประมาณค่าพารามิเตอร์ก็สามารถบอกได้ว่าแบบจำลองนั้นถูกต้อง
ตัวอย่าง: ลองนึกภาพตัวอย่างเช่นโมเดลที่มีพารามิเตอร์สองชุดหนึ่งชุดสำหรับการประมวลผลทางปัญญาและอีกชุดสำหรับการตอบสนองของมอเตอร์ ลองนึกภาพตอนนี้ว่าคุณมีการทดสอบสองเงื่อนไขโดยหนึ่งในนั้นความสามารถของผู้เข้าร่วมในการตอบสนองจะลดลง (พวกเขาสามารถใช้มือเดียวแทนที่จะเป็นสองมือ) และในเงื่อนไขอื่น ๆ ที่ไม่มีการด้อยค่า หากแบบจำลองนั้นถูกต้องความแตกต่างในการประมาณค่าพารามิเตอร์สำหรับทั้งสองเงื่อนไขควรเกิดขึ้นสำหรับพารามิเตอร์การตอบกลับของมอเตอร์เท่านั้น
นอกจากนี้โปรดทราบว่าแม้ว่าแบบจำลองหนึ่งจะไม่อิ่มตัว แต่ก็อาจจะไม่สามารถระบุตัวตนได้ซึ่งหมายความว่าการรวมกันของค่าพารามิเตอร์ที่แตกต่างกันจะให้ผลลัพธ์ที่เหมือนกัน
หากคุณต้องการค้นหาข้อมูลเพิ่มเติมเกี่ยวกับปัญหาเหล่านี้โดยทั่วไปคุณอาจต้องการดูเอกสารเหล่านี้:
Bamber, D. , & van Santen, JPH (1985) โมเดลสามารถมีพารามิเตอร์กี่ตัวและยังสามารถทดสอบได้? วารสารจิตวิทยาคณิตศาสตร์, 29, 443-473
Bamber, D. , & van Santen, JPH (2000) วิธีประเมินความสามารถในการทดสอบและการระบุตัวตนของโมเดล วารสารจิตวิทยาคณิตศาสตร์, 44, 20-40
ไชโย
นอกจากนี้ยังมีประโยชน์หากคุณจำเป็นต้องคำนวณ AIC สำหรับแบบจำลองความน่าจะเป็น การประมาณการกระจายตัวควรมาจากแบบจำลองที่อิ่มตัว คุณจะหาร LL ที่คุณเหมาะสมด้วยการกระจายตัวโดยประมาณจากแบบจำลองอิ่มตัวในการคำนวณ AIC
ในบริบทของ SEM (หรือการวิเคราะห์เส้นทาง) โมเดลอิ่มตัวหรือโมเดลที่ระบุเพียงอย่างเดียวคือโมเดลที่จำนวนพารามิเตอร์อิสระตรงกับจำนวนความแปรปรวนและค่าความแปรปรวนร่วมที่ไม่ซ้ำกัน ตัวอย่างเช่นโมเดลต่อไปนี้เป็นโมเดลอิ่มตัวเนื่องจากมีจุดข้อมูล 3 * 4/2 (ความแปรปรวนและความแปรปรวนร่วมที่ไม่ซ้ำกัน) และพารามิเตอร์อิสระ 6 ตัวที่จะถูกประมาณ: