VC มิติเป็นจำนวนบิตของข้อมูล (ตัวอย่าง) หนึ่งในความต้องการในการสั่งซื้อที่จะหาวัตถุที่เฉพาะเจาะจง (ฟังก์ชั่น) ในชุดของวัตถุ ยังไม่มีข้อความ(ฟังก์ชั่น)
Vคมิติมาจากแนวคิดที่คล้ายคลึงกันในทฤษฎีข้อมูล ทฤษฎีข้อมูลเริ่มต้นจากการสังเกตของแชนนอนดังต่อไปนี้:
หากคุณมีวัตถุและอยู่ในหมู่วัตถุเหล่านี้คุณกำลังมองหาวัตถุเฉพาะ กี่บิตของข้อมูลที่คุณจะต้องไปหาวัตถุนี้ ? คุณสามารถแบ่งชุดของวัตถุออกเป็นสองครึ่งและถามว่า "วัตถุที่ฉันกำลังค้นหาอยู่ครึ่งหนึ่งอยู่ที่ไหน" . คุณได้รับ "ใช่" ถ้าอยู่ในครึ่งแรกหรือ "ไม่" ถ้าอยู่ในช่วงครึ่งหลัง ในคำอื่น ๆ ที่คุณได้รับ1 บิตของข้อมูล หลังจากนั้นคุณถามคำถามเดียวกันและแยกชุดของคุณอีกครั้งและอีกครั้งจนกว่าคุณจะพบวัตถุที่คุณต้องการในที่สุด คุณต้องการข้อมูลจำนวนเท่าใด ( ใช่ / ไม่ใช่คำตอบ) มันชัดเจนว่ายังไม่มีข้อความยังไม่มีข้อความl oก.2( N) บิตของข้อมูล - คล้ายกับปัญหาการค้นหาแบบไบนารีด้วยอาร์เรย์ที่เรียงลำดับ
Vapnik และ Chernovenkis ถามคำถามที่คล้ายกันในปัญหาการจดจำรูปแบบ สมมติว่าคุณมีชุดของฟังก์ชั่นเซนต์ป้อนข้อมูลให้แต่ละฟังก์ชั่นเอาท์พุทใช่หรือไม่ (ภายใต้การดูแลปัญหาการจัดหมวดหมู่ binary) และกลุ่มคนเหล่านี้ฟังก์ชั่นที่คุณกำลังมองหาฟังก์ชั่นที่เฉพาะเจาะจงที่ช่วยให้คุณได้ผลลัพธ์ที่ถูกต้องใช่ / ไม่ใช่สำหรับชุดข้อมูลที่ได้รับ\} คุณสามารถถามคำถาม: "ซึ่งฟังก์ชั่นไม่กลับไม่มีและฟังก์ชั่นที่ทำผลตอบแทนที่ใช่สำหรับให้ยังไม่มีข้อความxยังไม่มีข้อความD = { (x1,Y1) , (x2,Y2) , . . , (xล.,Yล.) }xผมจากชุดข้อมูลของคุณ เมื่อคุณรู้ว่าสิ่งที่เป็นคำตอบที่แท้จริงจากข้อมูลการฝึกอบรมที่คุณมีคุณสามารถโยนออกไปฟังก์ชั่นทั้งหมดที่ให้คำตอบไม่ถูกต้องสำหรับบางx_iคุณต้องการข้อมูลจำนวนเท่าใด หรือพูดอีกอย่าง: คุณต้องมีตัวอย่างการฝึกอบรมกี่อย่างที่จะลบฟังก์ชั่นที่ผิดเหล่านั้นออกไป . นี่เป็นข้อแตกต่างเล็กน้อยจากการสังเกตของแชนนอนในทฤษฎีข้อมูล คุณไม่ได้แบ่งชุดฟังก์ชั่นของคุณเป็นครึ่งหนึ่ง (อาจจะมีเพียงฟังก์ชันเดียวจากให้คำตอบที่ไม่ถูกต้องสำหรับบาง ) และบางทีชุดฟังก์ชั่นของคุณมีขนาดใหญ่มากและเพียงพอสำหรับคุณที่พบฟังก์ชันที่ - ปิดฟังก์ชั่นที่คุณต้องการและคุณต้องการให้แน่ใจว่าฟังก์ชั่นนี้เป็นxผมยังไม่มีข้อความxผมεε - ปิดด้วยความน่าจะเป็น ( - เฟรมเวิร์กPAC ) จำนวนบิตของข้อมูล (จำนวนตัวอย่าง) ที่คุณต้องการคือ .1 - δ( ϵ , δ)l oก.2ยังไม่มีข้อความ/ δε
สมมติว่าขณะนี้ในชุดของฟังก์ชันไม่มีฟังก์ชันที่ไม่ยอมรับข้อผิดพลาด ก่อนหน้านี้มันก็เพียงพอสำหรับคุณที่จะหาฟังก์ชั่นที่เป็น -close กับความน่า1-จำนวนตัวอย่างที่คุณจะต้องเป็น2}ยังไม่มีข้อความε1 - δl oก.2ยังไม่มีข้อความ/ δε2
โปรดทราบว่าผลลัพธ์ในทั้งสองกรณีเป็นสัดส่วนกับ - คล้ายกับปัญหาการค้นหาแบบไบนารีl oก.2ยังไม่มีข้อความ
ตอนนี้สมมติว่าคุณมีชุดที่ไม่มีที่สิ้นสุดของฟังก์ชั่นและในหมู่ฟังก์ชั่นที่คุณต้องการที่จะหาฟังก์ชั่นที่ -close กับฟังก์ชั่นที่ดีที่สุดกับความน่าจะเป็น1-สมมติว่า (เพื่อความเรียบง่ายของภาพประกอบ) ที่ฟังก์ชั่นเลียนแบบต่อเนื่อง (SVM) และคุณได้พบฟังก์ชั่นที่ - ใกล้กับฟังก์ชันที่ดีที่สุด หากคุณต้องการย้ายฟังก์ชั่นของคุณเล็กน้อยมันจะไม่เปลี่ยนผลลัพธ์ของการจัดหมวดหมู่คุณจะมีฟังก์ชั่นที่แตกต่างกันซึ่งจัดประเภทด้วยผลลัพธ์เดียวกันกับอันดับแรก คุณสามารถใช้ฟังก์ชั่นดังกล่าวทั้งหมดที่ให้ผลการจำแนกประเภทเดียวกัน (ข้อผิดพลาดการจำแนก) และนับเป็นฟังก์ชั่นเดียวเพราะพวกเขาจำแนกข้อมูลของคุณด้วยการสูญเสียที่แน่นอน (บรรทัดในภาพ)ε1 - δε
___________________ ทั้งสองบรรทัด (ฟังก์ชั่น) จะจำแนกคะแนนที่มีความสำเร็จแบบเดียวกัน ___________________
คุณต้องการตัวอย่างจำนวนเท่าใดเพื่อหาฟังก์ชันเฉพาะจากชุดชุดฟังก์ชัน (จำได้ว่าเราแบ่งหน้าที่ของเราเป็นชุดของฟังก์ชันที่แต่ละฟังก์ชันให้ผลการจำแนกประเภทเดียวกันสำหรับชุดคะแนนที่กำหนด) นี่คือสิ่งที่ขนาดบอก -ถูกแทนที่ด้วยเพราะคุณมีฟังก์ชั่นต่อเนื่องจำนวนอนันต์ที่แบ่งออกเป็นชุดของฟังก์ชันที่มีข้อผิดพลาดการจำแนกประเภทเดียวกันสำหรับจุดเฉพาะ จำนวนตัวอย่างที่คุณต้องการคือหากคุณมีฟังก์ชั่นที่จดจำได้อย่างสมบูรณ์แบบและVคl oก.2ยังไม่มีข้อความVคVค- l o g( δ)εVค- l o g( δ)ε2 หากคุณไม่มีฟังก์ชั่นที่สมบูรณ์แบบในชุดฟังก์ชั่นดั้งเดิมของคุณ
นั่นคือมิติจะช่วยให้คุณผูกไว้บน (ที่ไม่สามารถปรับปรุงให้ดีขึ้นครับ) สำหรับจำนวนของกลุ่มตัวอย่างที่คุณต้องการในการสั่งซื้อเพื่อให้บรรลุผิดพลาดเกี่ยวกับความน่าจะเป็น1-Vคε1 - δ