การแบ่งปันพารามิเตอร์ระหว่างคุณลักษณะและคลาสหมายความว่าอย่างไร


20

เมื่ออ่านบทความนี้จะมีบรรทัดที่ระบุว่า "ตัวแยกประเภทแบบเส้นตรงไม่ใช้พารามิเตอร์ร่วมกันระหว่างคุณลักษณะและคลาส" ความหมายของคำนี้คืออะไร? หมายความว่าลักษณนามเชิงเส้นเช่นการถดถอยโลจิสติกต้องการคุณสมบัติที่เป็นอิสระร่วมกัน?

คำตอบ:


22

ฉันจะพยายามตอบคำถามนี้ผ่านการถดถอยโลจิสติกซึ่งเป็นตัวแยกประเภทแบบเส้นตรงที่ง่ายที่สุดตัวหนึ่ง

กรณีที่ง่ายที่สุดของการถดถอยโลจิสติกคือถ้าเรามีงานการจำแนกประเภทไบนารี ( y{0,1})และมีเพียงหนึ่งคุณลักษณะอินพุต ( xR ) ในกรณีนี้ผลลัพธ์ของการถดถอยโลจิสติกจะเป็น:

y^=σ(wx+b)
ที่และมีทั้งสเกลา การส่งออกของรูปแบบสอดคล้องกับความเป็นไปได้ว่าจะเป็นระดับ1wbx1y^[0,1]x1

เราจะพยายามแบ่งวลี"ตัวแยกประเภทเชิงเส้นไม่แชร์พารามิเตอร์ระหว่างคุณลักษณะและคลาส"เป็นสองส่วน เราจะตรวจสอบกรณีของคุณสมบัติหลายอย่างและหลายคลาสแยกกันเพื่อดูว่าการถดถอยโลจิสติกใช้พารามิเตอร์ร่วมกันสำหรับงานเหล่านั้นหรือไม่:

ตัวแยกประเภทเชิงเส้นใช้พารามิเตอร์ร่วมกันระหว่างคุณลักษณะหรือไม่

ในกรณีนี้สำหรับแต่ละตัวอย่างyเป็นสเกลาร์ที่รับค่าไบนารี (เหมือนก่อน) ในขณะที่xเป็นเวกเตอร์ของความยาวN (โดยที่Nคือจำนวนของคุณลักษณะ) ที่นี่ผลลัพธ์คือการรวมกันเชิงเส้นของคุณสมบัติการป้อนข้อมูล (เช่นผลรวมถ่วงน้ำหนักของคุณสมบัติเหล่านี้บวกกับอคติ)

x w N xw w ฉันx i

y^=σ(iN(wixi)+b)orσ(wx+b)
ที่และเป็นพาหะของความยาวNผลิตภัณฑ์สร้างสเกลาร์ ดังที่คุณเห็นจากด้านบนมีน้ำหนักแยกต่างหากสำหรับแต่ละคุณลักษณะอินพุตและน้ำหนักเหล่านี้มีความเป็นอิสระโดยทุกวิถีทาง จากนี้เราสามารถสรุปได้ว่ามีไม่มีการแบ่งปันพารามิเตอร์ในคุณสมบัติxwNxw wixi

ตัวแยกประเภทเชิงเส้นใช้พารามิเตอร์ร่วมกันระหว่างคลาสหรือไม่

ในกรณีนี้เป็นสเกลาร์อย่างไรก็ตามเป็นเวกเตอร์ที่มีความยาว (โดยที่คือจำนวนคลาส) เพื่อจัดการกับปัญหานี้การถดถอยแบบลอจิสติกจะสร้างเอาต์พุตแยกต่างหากสำหรับคลาสแต่ละคลาส การส่งออกแต่ละคนเป็นสเกลาและสอดคล้องกับความน่าจะเป็นของที่อยู่ในระดับที่ jy M M y j M y j[ 0 , 1 ] x jxyMMyjMyj[0,1]xj

y^=wx+b,wherey^=y^1,y^2,...,yM

วิธีที่ง่ายที่สุดในการคิดสิ่งนี้คือการถดถอยโลจิสติกที่เป็นอิสระอย่างง่ายแต่ละตัวมีเอาต์พุต:M

y^j=σ(wjx+bj)

จากข้างต้นจะเห็นได้ชัดว่าไม่มีน้ำหนักที่จะใช้ร่วมกันระหว่างการเรียนที่แตกต่างกัน

หลายคุณสมบัติและหลายชั้น :

เมื่อรวมสองกรณีข้างต้นเข้าด้วยกันเราก็สามารถเข้าถึงกรณีทั่วไปมากที่สุดของฟีเจอร์หลากหลายและคลาสที่หลากหลาย:

Y MxNMW(N×M)

y^=σ(Wx+b)
โดยที่เป็นเวกเตอร์ที่มีขนาด ,เป็นเวกเตอร์ที่มีขนาดเท่ากับ ,เป็นเวกเตอร์ที่มีขนาดของและเป็นเมทริกซ์ที่มีขนาดหนึ่งM)y^MxNbMW(N×M)

ในกรณีใด ๆลักษณนามเชิงเส้นไม่ได้ใช้พารามิเตอร์ใด ๆ ในคุณสมบัติหรือชั้นเรียน

ในการตอบคำถามที่สองของคุณตัวแยกประเภทแบบเส้นตรงมีข้อสมมติฐานที่สำคัญว่าคุณลักษณะต้องเป็นอิสระแต่นี่ไม่ใช่สิ่งที่ผู้เขียนบทความตั้งใจจะพูด


1
คำอธิบายที่ดี :)
joydeep bhattacharjee
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.