แบบจำลองทางสถิติที่อยู่เบื้องหลังอัลกอริทึม SVM คืออะไร


28

ฉันได้เรียนรู้ว่าเมื่อจัดการกับข้อมูลโดยใช้แบบจำลองขั้นตอนแรกคือการสร้างแบบจำลองขั้นตอนข้อมูลเป็นแบบจำลองทางสถิติ จากนั้นขั้นตอนต่อไปคือการพัฒนาอัลกอริทึมการอนุมานที่มีประสิทธิภาพ / เร็ว / การเรียนรู้ตามแบบจำลองทางสถิตินี้ ดังนั้นฉันต้องการถามว่าแบบจำลองทางสถิติใดอยู่เบื้องหลังอัลกอริธึมเวกเตอร์สนับสนุน (SVM) หรือไม่

คำตอบ:


27

คุณมักจะสามารถเขียนแบบจำลองที่สอดคล้องกับฟังก์ชั่นการสูญเสีย (ที่นี่ฉันจะพูดคุยเกี่ยวกับการถดถอย SVM มากกว่าการจัดหมวดหมู่ SVM มันง่ายมากโดยเฉพาะ)

ตัวอย่างเช่นในโมเดลเชิงเส้นหากฟังก์ชันการสูญเสียของคุณคือจากนั้นย่อเล็กสุดที่จะสอดคล้องกับโอกาสสูงสุดสำหรับเบต้า)) (ที่นี่ฉันมีเคอร์เนลเชิงเส้น)ig(εi)=ig(yixiβ)fexp(ag(ε)) =exp(ag(yxβ))

ถ้าฉันจำได้อย่างถูกต้อง SVM- การถดถอยมีฟังก์ชั่นการสูญเสียเช่นนี้:

พล็อตของการสูญเสีย epsilon-insensitive

ที่สอดคล้องกับความหนาแน่นที่อยู่ตรงกลางพร้อมกับหางแบบเอ็กซ์โพเนนเชียล (อย่างที่เราเห็นโดยการยกกำลังลบมันหรือลบหลายเท่าของมัน)

พล็อตของความหนาแน่นที่สอดคล้องกัน

มีตระกูลพารามิเตอร์ 3 รายการดังนี้: มุมสถานที่ตั้ง (ขีด จำกัด ความไม่รู้สึกสัมพัทธ์สัมพัทธ์) รวมถึงตำแหน่งและสเกล

มันเป็นความหนาแน่นที่น่าสนใจ ถ้าผมจำถูกต้องจากการดูที่การกระจายที่เฉพาะไม่กี่สิบปีที่ผ่านมาประมาณการที่ดีสำหรับสถานที่สำหรับมันเป็นค่าเฉลี่ยของสอง quantiles แฟ่วางที่สอดคล้องกับที่มุมมี (เช่นmidhingeจะให้ประมาณการที่ดีที่จะ MLE หนึ่งโดยเฉพาะอย่างยิ่ง ทางเลือกของค่าคงที่ในการสูญเสีย SVM); ตัวประมาณที่คล้ายกันสำหรับพารามิเตอร์สเกลจะขึ้นอยู่กับความแตกต่างของพวกเขาในขณะที่พารามิเตอร์ที่สามนั้นสอดคล้องกับการทำงานว่ามุมใดเปอร์เซ็นไทล์อยู่ที่ใด (นี่อาจจะถูกเลือก

ดังนั้นอย่างน้อยสำหรับการถดถอย SVM ดูเหมือนว่าค่อนข้างตรงไปตรงมาอย่างน้อยถ้าเราเลือกที่จะรับตัวประมาณของเราโดยความเป็นไปได้สูงสุด

(ในกรณีที่คุณกำลังจะถาม ... ฉันไม่มีการอ้างอิงสำหรับการเชื่อมต่อกับ SVM นี้: ตอนนี้ฉันเพิ่งทำไปแล้วมันง่ายมากอย่างไรก็ตามผู้คนหลายสิบคนจะทำงานออกมาก่อนฉันอย่างไม่ต้องสงสัย มีมีการอ้างอิงสำหรับมัน - ฉันเพิ่งเคยเห็นใด ๆ ).


2
(ฉันตอบคำถามนี้ก่อนหน้านี้ที่อื่น แต่ฉันลบและย้ายไปที่นี่เมื่อฉันเห็นคุณถามด้วยที่นี่ความสามารถในการเขียนคณิตศาสตร์และรวมรูปภาพนั้นดีกว่ามากที่นี่ - และฟังก์ชั่นการค้นหาก็ดีกว่าด้วย สองสามเดือน)
Glen_b

2
+1 บวกกับวานิลลา SVM ยังมีแบบเกาส์ก่อนหน้าพารามิเตอร์ผ่านปกติ 2
Firebug

2
หาก OP ถามเกี่ยวกับ SVM อาจมีความสนใจในการจัดหมวดหมู่ (ซึ่งเป็นแอปพลิเคชันทั่วไปของ SVM) ในกรณีนั้นการสูญเสียคือการสูญเสียบานพับซึ่งแตกต่างกันเล็กน้อย (คุณไม่มีส่วนที่เพิ่มขึ้น) เกี่ยวกับแบบจำลองนี้ฉันได้ยินนักวิชาการกล่าวในการประชุมว่า SVM ได้รับการแนะนำให้ทำการจำแนกโดยไม่ต้องใช้กรอบความน่าจะเป็น อาจเป็นเหตุผลที่คุณไม่สามารถหาข้อมูลอ้างอิงได้ ในทางกลับกันคุณสามารถและคุณทำการลดการสูญเสียบานพับใหม่เป็นวิธีลดความเสี่ยงเชิงประจักษ์ - ซึ่งหมายถึง ...
DeltaIV

4
เพียงเพราะคุณไม่จำเป็นต้องมีกรอบความน่าจะเป็น ... ไม่ได้หมายความว่าสิ่งที่คุณทำไม่สอดคล้องกับกรอบ เราสามารถทำสี่เหลี่ยมจัตุรัสน้อยที่สุดโดยไม่ถือว่าปกติ แต่มันมีประโยชน์ที่จะเข้าใจว่ามันเป็นสิ่งที่ทำได้ดีที่ ... และเมื่อคุณไม่มีที่อยู่ใกล้มันก็อาจจะทำได้ไม่ดีนัก
Glen_b -Reinstate Monica

3
อาจจะ เป็นicml-2011.org/papers/386_icmlpaper.pdfเป็นข้อมูลอ้างอิงสำหรับสิ่งนี้หรือไม่ (ฉันอ่านแค่ตอนนี้เลย)
Lyndon White

8

ฉันคิดว่ามีคนตอบคำถามตามตัวอักษรของคุณไปแล้ว แต่ขอให้ฉันบอกความสับสนที่อาจเกิดขึ้น

คำถามของคุณค่อนข้างคล้ายกับต่อไปนี้:

ฉันมีฟังก์ชั่นนี้และฉันสงสัยว่าสมการเชิงอนุพันธ์คืออะไรf(x)=

มันอาจมีคำตอบที่ถูกต้องแน่นอน(อาจเป็นคำที่ไม่ซ้ำใครถ้าคุณกำหนดข้อ จำกัด ของระเบียบ) แต่มันเป็นคำถามที่ค่อนข้างแปลกที่จะถามเพราะมันไม่ใช่สมการเชิงอนุพันธ์ที่ก่อให้เกิดหน้าที่แรก
(ในอีกทางหนึ่งให้สมการเชิงอนุพันธ์เป็นธรรมชาติที่จะขอวิธีแก้ปัญหาเพราะปกติแล้วทำไมคุณถึงเขียนสมการ!)

นี่คือเหตุผล: ฉันคิดว่าคุณกำลังคิดแบบจำลองความน่าจะเป็น / สถิติ - โดยเฉพาะแบบจำลองแบบกำเนิดและแบบแยกแยะตามการประเมินความน่าจะเป็นข้อต่อและเงื่อนไขจากข้อมูล

SVM ไม่ใช่ มันเป็นรูปแบบที่แตกต่างอย่างสิ้นเชิง - แบบที่ข้ามไปและพยายามที่จะทำโมเดลขอบเขตการตัดสินใจขั้นสุดท้ายโดยตรงความน่าจะเป็นจะถูกสาป

เนื่องจากมันเกี่ยวกับการค้นหารูปร่างของขอบเขตการตัดสินใจสัญชาตญาณด้านหลังจึงเป็นรูปทรงเรขาคณิต (หรือบางทีเราควรจะพูดตามการปรับให้เหมาะสม) แทนความน่าจะเป็นหรือทางสถิติ

เนื่องจากความน่าจะเป็นไม่ได้มีการพิจารณาที่ใดก็ตามตลอดเวลาดังนั้นจึงค่อนข้างแปลกที่จะถามว่าแบบจำลองความน่าจะเป็นที่สอดคล้องกันอาจเป็นอย่างไรและโดยเฉพาะอย่างยิ่งเนื่องจากเป้าหมายทั้งหมดคือการหลีกเลี่ยงความกังวลเกี่ยวกับความน่าจะเป็น ดังนั้นทำไมคุณไม่เห็นคนพูดถึงพวกเขา


6
ฉันคิดว่าคุณกำลังลดมูลค่าของแบบจำลองทางสถิติที่เกี่ยวข้องกับกระบวนการของคุณ เหตุผลที่มีประโยชน์คือมันบอกคุณว่าข้อสันนิษฐานนั้นอยู่เบื้องหลังวิธีใด หากคุณรู้ว่าสิ่งเหล่านี้คุณสามารถเข้าใจสถานการณ์ที่มันจะดิ้นรนและเมื่อใดที่มันจะเจริญเติบโต นอกจากนี้คุณยังสามารถพูดคุยและขยาย svm ในลักษณะที่ดีถ้าคุณมีรูปแบบพื้นฐาน
ความน่าจะเป็นเชิง

3
@probabilityislogic: "ฉันคิดว่าคุณกำลังลดมูลค่าของแบบจำลองทางสถิติที่เกี่ยวข้องกับกระบวนการของคุณ" ... ฉันคิดว่าเรากำลังพูดถึงกัน สิ่งที่ฉันพยายามจะพูดคือไม่มีแบบจำลองทางสถิติอยู่หลังขั้นตอน ฉันกำลังไม่ได้บอกว่ามันเป็นไปไม่ได้ที่จะเกิดขึ้นกับคนที่เหมาะกับมัน posteriori แต่ฉันพยายามที่จะอธิบายว่ามันก็ไม่ได้ "หลัง" มันในทางใด แต่ "พอดี" ไปตามความเป็นจริง ฉันยังไม่ได้บอกว่าการทำสิ่งนี้ไร้ประโยชน์ ฉันเห็นด้วยกับคุณว่ามันจะจบลงด้วยมูลค่ามหาศาล โปรดระลึกถึงความแตกต่างเหล่านี้ไว้ในใจ
Mehrdad

1
@ Mehrdad: ฉันไม่ได้บอกว่ามันเป็นไปไม่ได้ที่จะเกิดขึ้นกับคนที่เหมาะกับ posterioriลำดับที่ชิ้นส่วนของสิ่งที่เราเรียกว่า svm 'machine' ถูกประกอบเข้าด้วยกัน เพื่อแก้ปัญหา) เป็นที่น่าสนใจจากประวัติศาสตร์มุมมองวิทยาศาสตร์ แต่สำหรับทุกคนเรารู้ว่าอาจมีต้นฉบับที่ไม่รู้จักในห้องสมุดบางแห่งที่มีคำอธิบายของเครื่องยนต์ svm จาก 200 ปีที่แล้วซึ่งโจมตีปัญหาจากมุม Glen_b สำรวจ บางทีความคิดของคนหลัง และหลังจากความจริงก็ไม่น่าเชื่อถือในวิทยาศาสตร์
user603

1
@ user603: มันไม่ใช่แค่ประวัติที่เป็นปัญหาที่นี่ ด้านประวัติศาสตร์เป็นเพียงครึ่งหนึ่งของมัน อีกครึ่งหนึ่งเป็นที่มาของความเป็นจริงตามปกติ มันเริ่มเป็นปัญหาเรขาคณิตและจบลงด้วยปัญหาการปรับให้เหมาะสม ไม่มีใครเริ่มต้นด้วยแบบจำลองความน่าจะเป็นในการได้มาซึ่งหมายความว่าแบบจำลองความน่าจะเป็นไม่มีความหมาย "เบื้องหลัง" ผลลัพธ์ มันก็เหมือนกับการอ้างว่ากลศาสตร์ลากรองจ์คือ "เบื้องหลัง" F = ma บางทีมันอาจนำไปสู่มันและใช่มันมีประโยชน์ แต่ไม่มันไม่ใช่และไม่เคยเป็นพื้นฐานของมัน ในความเป็นจริงเป้าหมายทั้งหมดคือการหลีกเลี่ยงความน่าจะเป็น
Mehrdad
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.