SVM แบบชั้นเดียวกับแบบ SVM


16

ฉันเข้าใจว่ามีการเสนอ SVM ชั้นหนึ่ง (OSVMs) โดยไม่มีข้อมูลเชิงลบในใจและพวกเขาพยายามค้นหาขอบเขตการตัดสินใจที่แยกชุดบวกและจุดยึดเชิงลบออก

งานในปี 2011 เสนอExemplar SVMs (ESVMs) ซึ่งฝึกอบรม "ลักษณนามเดี่ยวต่อหมวดหมู่" ซึ่งอ้างว่าแตกต่างจาก OSVM ใน ESVM นั้นไม่จำเป็นต้องทำการแมป exemplars ในพื้นที่คุณลักษณะทั่วไปซึ่งเคอร์เนลที่คล้ายคลึงกันสามารถ คำนวณ" ฉันไม่เข้าใจความหมายของสิ่งนี้และความแตกต่างของ ESVM จาก OSVM แล้วพวกมันต่างกันอย่างไร และการคำนวณเคอร์เนลความคล้ายคลึงกันนี้จะหลีกเลี่ยงใน ESVM อย่างไร

คำตอบ:


20

(คุณอาจต้องการดู "ตาราง" ด้านล่างก่อน)

เริ่มจากเวกเตอร์สนับสนุน "คลาสสิค" กันก่อน เรียนรู้ที่จะแยกแยะระหว่างสองหมวดหมู่ คุณรวบรวมตัวอย่างของหมวดหมู่ A หมวดหมู่บางส่วนและส่งผ่านทั้งสองไปยังอัลกอริทึมการฝึกอบรม SVM ซึ่งพบว่าบรรทัด / เครื่องบิน / ไฮเปอร์เพลนที่แยก A ออกจาก B ได้ดีที่สุดผลงานนี้ - และมักจะทำงานได้ค่อนข้างดี - เมื่อ คุณต้องการแยกแยะความแตกต่างระหว่างคลาสที่กำหนดชัดเจนและไม่เหมือนกัน: ผู้ชายกับผู้หญิง, ตัวอักษรของตัวอักษรและอื่น ๆ

อย่างไรก็ตามสมมติว่าคุณต้องการระบุ "A" แทน คุณสามารถปฏิบัติต่อสิ่งนี้เป็นปัญหาการจำแนก: ฉันจะแยกความแตกต่าง "A" จาก "ไม่ A" ได้อย่างไร มันค่อนข้างง่ายที่จะรวบรวมชุดฝึกที่ประกอบด้วยภาพของสุนัข แต่สิ่งที่ควรเข้าไปในชุดฝึกของคุณที่ไม่ใช่สุนัข เนื่องจากมีสิ่งต่าง ๆ มากมายที่ไม่ใช่สุนัขคุณอาจมีช่วงเวลาที่ยากลำบากในการสร้างชุดฝึกอบรมที่ครอบคลุมและยังเป็นตัวแทนของสิ่งต่าง ๆ ที่ไม่ใช่สุนัขทั้งหมด แต่คุณอาจลองใช้ตัวจําแนกประเภทแบบชั้นเดียวแทน ตัวแยกคลาสสองคลาสแบบดั้งเดิมค้นหาระนาบ (ไฮเปอร์) ที่แยก A ออกจาก B SVM แบบคลาสเดียวจะค้นหาบรรทัด / ระนาบ / ไฮเปอร์เพลนที่แยกจุดในคลาสทั้งหมดออกจากจุดกำเนิด ;

"ระบบ" ของ Ensemble SVM เป็นชุดสะสมของหน่วยย่อยสองระดับ "subunits" แต่ละหน่วยย่อยได้รับการฝึกอบรมโดยใช้หน่วยเดียวตัวอย่างที่เป็นบวกสำหรับชั้นหนึ่งและชุดตัวอย่างเชิงลบจำนวนมากสำหรับอีกชั้นหนึ่ง ดังนั้นแทนที่จะแยกแยะสุนัขกับตัวอย่างที่ไม่ใช่สุนัข (มาตรฐานสองชั้น SVM) หรือสุนัขเทียบกับต้นกำเนิด (SVM ชั้นหนึ่ง) แต่ละหน่วยย่อยแยกแยะระหว่างสุนัขที่เฉพาะเจาะจง (เช่น "Rex") และสุนัขที่ไม่ใช่หลายตัว ตัวอย่าง. หน่วยย่อยแต่ละหน่วยได้รับการฝึกฝนสำหรับตัวอย่างของชนชั้นบวกดังนั้นคุณจะมี SVM หนึ่งสำหรับ Rex อีกหนึ่งสำหรับ Fido และอีกอันสำหรับสุนัขเพื่อนบ้านของคุณที่เห่าตอน 6 โมงเช้าเป็นต้น ผลลัพธ์ของหน่วยย่อย SVMs เหล่านี้จะได้รับการสอบเทียบและรวมเข้าด้วยกันเพื่อตรวจสอบว่าสุนัขไม่ได้เป็นเพียงหนึ่งในตัวอย่างที่เฉพาะเจาะจงปรากฏในข้อมูลการทดสอบ ฉันเดาว่าคุณอาจนึกถึงแต่ละ subnits เหมือน SVM แบบชั้นเดียวซึ่งมีการเลื่อนพื้นที่ประสานงานเพื่อให้ตัวอย่างบวกเดียวอยู่ที่จุดกำเนิด

โดยสรุปความแตกต่างที่สำคัญคือ:

ข้อมูลการฝึกอบรม

  • SVM สองชั้น: ตัวอย่างบวกและลบ
  • SVM ชั้นเดียว: ตัวอย่างบวกเท่านั้น
  • Ensemble SVM "ระบบ": ตัวอย่างบวกและลบ แต่ละหน่วยย่อยจะได้รับการฝึกฝนโดยใช้ตัวอย่างเชิงบวกเดียวและตัวอย่างเชิงลบจำนวนมาก

จำนวนเครื่อง

  • SVM สองคลาส: หนึ่ง
  • SVM ชั้นหนึ่ง: หนึ่ง
  • Ensemble SVM "ระบบ": หลายเครื่อง (หนึ่งหน่วยย่อยต่อหนึ่งตัวอย่างที่เป็นบวก)

ตัวอย่างต่อคลาส (ต่อเครื่อง)

  • SVM สองชั้น: มาก / มาก
  • SVM ชั้นเดียว: มากมาย / หนึ่ง (แก้ไขที่จุดกำเนิด)
  • Ensemble SVM "ระบบ": มากมาย / มาก
  • Ensemble SVM "subunit": หนึ่ง / มาก

การโพสต์

  • SVM สองชั้น: ไม่จำเป็น
  • SVM ชั้นเดียว: ไม่จำเป็น
  • Ensemble SVM: จำเป็นต้องหลอมรวมเอาต์พุตของ SVM แต่ละรายการให้เป็นคำทำนายระดับชั้น

Postscript: คุณได้ถามว่าพวกเขาหมายถึงอะไรโดย "[วิธีการอื่น ๆ ] จำเป็นต้องทำการแมปแบบตัวอย่างลงในพื้นที่คุณลักษณะทั่วไปซึ่งเคอร์เนลความคล้ายคลึงกันสามารถคำนวณได้" ผมคิดว่าพวกเขาหมายความว่าแบบดั้งเดิม SVM สองชั้นดำเนินการภายใต้สมมติฐานว่าสมาชิกทุกคนในชั้นเรียนที่มีความคล้ายคลึงอย่างใดและเพื่อให้คุณต้องการที่จะหาเคอร์เนลว่าสถานที่เกรตเดนและDachsundsอยู่ใกล้ ๆ กัน แต่ห่างไกลจากทุกอย่างอื่น ในทางตรงกันข้ามระบบ SVM ทั้งมวลนั้นก้าวเท้าเลี่ยงสิ่งนี้โดยเรียกบางสิ่งบางอย่างว่าสุนัขถ้ามันเป็นสุนัขที่มีลักษณะคล้ายเดนมาร์กหรือเหมือนสุนัขพันธุ์ดัชชุนด์หรือสุนัขพันธุ์พุดเดิ้ลมากพอโดยไม่ต้องกังวลเกี่ยวกับความสัมพันธ์ระหว่างตัวอย่างเหล่านั้น


ขอบคุณสำหรับคำตอบที่ดีและครอบคลุม เพื่อให้ชัดเจนในบางสถานที่คุณหมายถึง "Ensemble" ของ Exemplar SVMs แต่ในที่อื่น ๆ เพียงแค่ "Exemplar" SVM ฉันคิดว่ายุติธรรมควรเปรียบเทียบกับ (1) OSVM เดี่ยวกับ ESVM เดี่ยวหรือ (2) ENSEMBLE ของ OSVM กับ ENSEMBLE ของ ESVM
bjou

ฉันหวังว่ามันจะไม่ปิดกระทู้เกินไปที่จะถามว่าเรื่องนี้สรุปกับหลาย ๆ คลาสได้ดีแค่ไหน? ถ้าฉันมีแมวสุนัขและนกนั่นทำให้ esvm ต้องการ "องค์ประกอบ" SVM สำหรับ fido กับแมวแต่ละตัวและหนึ่ง "องค์ประกอบ" SVM สำหรับ fido กับแต่ละนกหรือไม่ ถ้าฉันมีข้อมูล 10 คะแนนสำหรับ 3 หมวดหมู่นั่นหมายความว่าฉันมี 20 องค์ประกอบ SVM ต่อ "สุนัข" หรือชุดประกอบด้วยองค์ประกอบ 200 องค์ประกอบหรือไม่ จะเกิดอะไรขึ้นถ้าฉันมีจุดข้อมูล 300 จุดและมิติข้อมูล 20 จุดหรือจุดข้อมูล 50k และมิติ 50k หากฉันสร้างป่าสุ่มของ SVM ฉันสามารถใช้ชุดย่อยแบบสุ่มเพื่อลดผลกระทบของ "คำสาปแห่งความสลัว"
EngrStudent - Reinstate Monica

@bjou ฉันเป็นคนพูดเหลวไหลเล็กน้อยด้วยคำศัพท์ ESVM ดังนั้นฉันจึงกลับไปทำความสะอาด ฉันเดาว่าคุณอาจนึกถึง "หน่วยย่อย" ของระบบ ESVM ว่าเป็นเหมือน OSVM ยกเว้นว่าระบบพิกัดได้รับการรวมศูนย์อีกครั้งเพื่อให้ตัวอย่างเชิงบวกอยู่ที่จุดเริ่มต้น
Matt Krause

1
@EngrStudent จริงๆแล้วมันเป็นการสรุปที่ดีจริงๆ ในบทความพวกเขาใช้งาน Pascal VOC ซึ่งมีประมาณ 20 หมวดหมู่ ในการขยายตัวอย่างสัตว์ของเราคุณจะมีหน่วยย่อยสำหรับ "Fido" เทียบกับ (นกทั้งหมดแมวและปลา), หน่วยย่อยอื่นสำหรับ "Rex" เทียบกับที่ไม่ใช่สุนัขทั้งหมดและอื่น ๆ สำหรับสุนัขแต่ละตัว สำหรับนกคุณจะต้องฝึก "Tweety" กับ (แมวทั้งหมดสุนัขปลา) "พอลลี่" กับที่ไม่ใช่นกและอื่น ๆ นอกจากนี้ยังจะมีหน่วยย่อยสำหรับแมวแต่ละตัวและตัวอย่างปลาฝึกกับแมวที่ไม่ใช่แมวและไม่ใช่ปลาตามลำดับ คุณจบลงด้วย 1 SVM ต่อตัวอย่างป้ายกำกับโดยไม่คำนึงถึงจำนวนชั้นเรียน
Matt Krause

ดูเหมือนว่าลูกพี่ลูกน้องของการส่งเสริม (ในความรู้สึกของต้นไม้เพิ่มระดับการไล่ระดับสี) วงดนตรีมันเป็นข้อผิดพลาดออกน้ำหนักหรือถ่วงน้ำหนักสม่ำเสมอ?
EngrStudent - Reinstate Monica

2

กล่าวโดยย่อคือรูปแบบ ESVM เป็นชุดของ SVM ที่ผ่านการฝึกอบรมเพื่อแยกความแตกต่างขององค์ประกอบการฝึกอบรมแต่ละชุดจากที่เหลือทั้งหมดในขณะที่ OSVM เป็นกลุ่มของ SVM ที่ผ่านการฝึกอบรมเพื่อแยกแยะองค์ประกอบย่อยของการฝึกอบรมแต่ละชุด ดังนั้นหากคุณมีตัวอย่างแมว 300 ตัวและสุนัข 300 ตัวในชุดฝึกอบรม ESVM จะสร้าง600 SVMs สำหรับสัตว์เลี้ยงหนึ่งตัวในขณะที่ OSVM จะสร้างSVM สองตัว (เป็นอันดับแรกสำหรับแมวทุกตัวเป็นอันดับสองสำหรับสุนัขทุกตัว)

ด้วยวิธีนี้ ESVM ไม่จำเป็นต้องค้นหาพื้นที่ซึ่งทั้งกลุ่มคลาส แต่พื้นที่ที่องค์ประกอบเดียวนี้เป็นค่าผิดปกติซึ่งน่าจะง่ายกว่าและนำไปสู่ความแม่นยำสูง การเรียกคืนจะถูกกล่าวถึงโดยวงดนตรี

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.