มิติ VC ของตัวแบบการถดถอย


12

ในชุดการเรียนรู้การบรรยายจากข้อมูลอาจารย์กล่าวว่ามิติ VC วัดความซับซ้อนของแบบจำลองว่ามีจุดแตกต่างกันอย่างไร ดังนั้นวิธีนี้ใช้งานได้ดีอย่างสมบูรณ์แบบสำหรับการจำแนกประเภทที่เราสามารถบอกได้ว่าไม่มีคะแนน N หากตัวแยกประเภทสามารถจำแนกคะแนน k ได้อย่างมีประสิทธิภาพการวัดขนาด VC จะเป็น K แต่ก็ไม่ชัดเจนสำหรับฉัน ?


คำตอบ:


3

จากองค์ประกอบของการเรียนรู้ทางสถิติหน้า 238:

จนถึงตอนนี้เราได้พูดถึงมิติ VC ของฟังก์ชันตัวบ่งชี้เท่านั้น แต่สิ่งนี้สามารถขยายไปยังฟังก์ชันที่มีคุณค่าจริง มิติ VC ของคลาสของฟังก์ชันที่มีมูลค่าจริงถูกกำหนดให้เป็นมิติ VC ของคลาสตัวบ่งชี้1 ( g ( x , α ) - β > 0 )โดยที่βรับค่าในช่วงของ ก.ก.(x,α)1(ก.(x,α)-β>0)β

หรือ (เล็กน้อย) โดยสังหรณ์ใจยิ่งขึ้นเมื่อต้องการค้นหามิติ VC ของคลาสของฟังก์ชันที่มีคุณค่าจริง ๆ เราสามารถค้นหามิติ VC ของคลาสของฟังก์ชันตัวบ่งชี้ที่สามารถเกิดขึ้นได้โดยการกำหนดระดับชั้นของฟังก์ชันมูลค่าจริง


แต่นี่จะให้มิติ VC สำหรับตัวบ่งชี้ขีด จำกัด และที่มูลค่าฉันไม่เห็นวิธีรับขอบเขต PAC สำหรับตัวบ่งชี้ขีดบอกคุณมากเกี่ยวกับประสิทธิภาพของฟังก์ชันการถดถอยของคุณ บางทีคุณอาจเกิดข้อโต้แย้งที่คุณค้นหาไบนารี่มากกว่าค่าที่ถดถอย (สำหรับโดเมนเอาต์พุตที่มีขอบเขต)
VF1

@ VF1 จริง วิธีตีความมิติ VC ของฟังก์ชันการถดถอยอาจเป็นคำถามที่ดีและแยกออกจากกัน
ฌอนอีสเตอร์

ฉันโพสต์คำถามแยกต่างหาก แต่ฉันเชื่อว่าคำตอบนั้นเป็นเพียง "อย่าใช้ VC สลัวสำหรับการถดถอย" เนื่องจาก Rademacher จะช่วยให้คุณทำอะไรได้มากเท่ากับการสูญเสียขอบเขตโดยพลการ
VF1

@ VF1 ฉันจะอ่านคำตอบที่พูดอย่างนั้นด้วยความสนใจ! ทั้งหมดที่ฉันหมายถึงคือการแนะนำว่ามาตรฐาน CV คือการ จำกัด คำถามให้กับคำถามเดียวต่อโพสต์และ OP ไม่ได้สัมผัสกับการตีความหรือวัตถุประสงค์
ฌอนอีสเตอร์

0

ดูส่วนที่ 5.2 ของการเรียนรู้ทางสถิติ (Vapnik) สำหรับเคล็ดลับของตัวบ่งชี้การกำหนดค่าสถานะใหม่โดยใช้มาตรการ Lebesgue-Stieltjes AFAIK นี่คือการอ้างอิงเท่านั้นและชัดเจน คุณควรทราบแล้วว่าจะหาหนังสือเล่มนี้ได้ที่ไหน (และคนอื่น ๆ จาก Vapnik พวกเขาล้วนยอดเยี่ยม)


1
มันจะช่วยถ้าคุณสามารถสรุปการโต้แย้งมากกว่าเพียงแค่ให้การอ้างอิง
mdewey
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.