ความแตกต่างระหว่างคุณลักษณะและป้ายกำกับคืออะไร?


103

ฉันต่อไปกวดวิชาเกี่ยวกับพื้นฐานการเรียนรู้เครื่องและมีการกล่าวถึงว่าสิ่งที่อาจจะเป็นคุณลักษณะหรือฉลาก

จากสิ่งที่ฉันรู้คุณลักษณะคือคุณสมบัติของข้อมูลที่กำลังใช้อยู่ ฉันคิดไม่ออกว่าป้ายกำกับคืออะไรฉันรู้ความหมายของคำนี้ แต่ฉันอยากรู้ว่ามันหมายถึงอะไรในบริบทของแมชชีนเลิร์นนิง


คุณลักษณะคือฟิลด์ที่ใช้เป็นอินพุตและใช้ป้ายกำกับเป็นเอาต์พุต ตัวอย่างง่ายๆให้พิจารณาวิธีการคาดคะเนว่าควรขายรถตามระยะทางรถยนต์ปี ฯลฯ ใช่ / ไม่ใช่คือฉลากในขณะที่ระยะทางและปีจะเป็นคุณสมบัติ
Andrew McNeil

คำตอบ:


206

สั้น ๆ คุณสมบัติคืออินพุต; ฉลากถูกส่งออก สิ่งนี้ใช้ได้กับทั้งการจำแนกประเภทและปัญหาการถดถอย

คุณลักษณะคือคอลัมน์หนึ่งของข้อมูลในชุดอินพุตของคุณ ตัวอย่างเช่นหากคุณกำลังพยายามคาดเดาประเภทของสัตว์เลี้ยงที่ใครบางคนจะเลือกคุณสมบัติการป้อนข้อมูลของคุณอาจรวมถึงอายุภูมิภาคบ้านรายได้ของครอบครัว ฯลฯ ป้ายกำกับเป็นตัวเลือกสุดท้ายเช่นสุนัขปลาอิกัวน่าหิน เป็นต้น

เมื่อคุณฝึกฝนโมเดลของคุณแล้วคุณจะให้ชุดข้อมูลใหม่ที่มีคุณสมบัติเหล่านั้น มันจะส่งคืน "ป้ายกำกับ" (ประเภทสัตว์เลี้ยง) ที่ทำนายไว้สำหรับบุคคลนั้น


1
ดังนั้น [อายุภูมิภาคบ้านรายได้ครอบครัว] จึงเป็น "เวกเตอร์คุณลักษณะ 3 ตัว" และใน Keras อาร์เรย์ NumPy ของคุณสำหรับเครือข่าย LSTM ของคุณจะเป็น [ตัวอย่างขั้นตอนเวลา 3]?
naisanza

3
@naisanza: นั่นเป็นความเป็นไปได้อย่างแน่นอน ฉันไม่คุ้นเคยกับ Keras แต่องค์กรระดับสูงนี้อาจเป็นจุดเริ่มต้นของการนำไปใช้งานที่ถูกต้อง
พรุน

คุณลักษณะและตัวแปรเป็นสิ่งเดียวกันหรือไม่
Debadatta

ฉันต้องการระบุว่า "ป้ายกำกับ" ขึ้นอยู่กับบริบทด้วย ตัวอย่างเช่นในการฝึกโมเดลคุณจะใช้ข้อมูล "ติดป้ายกำกับ" ในกรณีนี้ป้ายกำกับคือความจริงพื้นฐานที่เปรียบเทียบข้อมูลผลลัพธ์ของคุณ
N Atanasov

ว้าว. คำตอบที่ดีขอขอบคุณสิ่งนี้ช่วยขจัดคำถามที่ค้างคาในหัวข้อนี้
Andrew Ray

31

ลักษณะเฉพาะ:

ในคุณลักษณะ Machine Learning หมายถึงคุณสมบัติของข้อมูลการฝึกอบรมของคุณ หรือคุณสามารถพูดชื่อคอลัมน์ในชุดข้อมูลการฝึกอบรมของคุณ

สมมติว่านี่คือชุดข้อมูลการฝึกอบรมของคุณ

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

แล้วนี่Height, SexและAgeเป็นคุณสมบัติ

ฉลาก:

ผลลัพธ์ที่ได้จากแบบจำลองของคุณหลังจากการฝึกอบรมเรียกว่าฉลาก

สมมติว่าคุณเลี้ยงชุดข้อมูลดังกล่าวข้างต้นขั้นตอนวิธีการบางอย่างและสร้างแบบจำลองในการทำนายเพศเป็นเพศชายหรือหญิงในรูปแบบดังกล่าวข้างต้นให้คุณผ่านคุณสมบัติเช่นage, heightฯลฯ

ดังนั้นหลังจากคำนวณแล้วระบบจะส่งคืนเพศเป็นชายหรือหญิง ที่เรียกว่าฉลาก


6

วิธีการที่เป็นภาพมากขึ้นเพื่ออธิบายแนวคิดมีดังนี้ ลองนึกภาพว่าคุณต้องการจัดประเภทสัตว์ที่แสดงในภาพถ่าย

ประเภทของสัตว์ที่เป็นไปได้ ได้แก่ แมวหรือนก ในกรณีนี้ป้ายกำกับจะเป็นการเชื่อมโยงคลาสที่เป็นไปได้เช่นแมวหรือนกซึ่งอัลกอริทึมการเรียนรู้ของเครื่องจะทำนาย

คุณสมบัติเป็นรูปแบบ, สี, รูปแบบที่เป็นส่วนหนึ่งของภาพของคุณเช่น Furr ขนหรือระดับต่ำตีความค่ามากขึ้นพิกเซล

นก ป้ายกำกับ:นก
คุณสมบัติ:ขน

แมว

ป้ายกำกับ: Cat
Features: Furr


5

ลองดูตัวอย่างที่เราต้องการตรวจจับตัวอักษรโดยใช้ภาพถ่ายที่เขียนด้วยลายมือ เราป้อนรูปภาพตัวอย่างเหล่านี้ในโปรแกรมและโปรแกรมจะจำแนกรูปภาพเหล่านี้ตามคุณสมบัติที่ได้รับ

ตัวอย่างของคุณลักษณะในบริบทนี้คือตัวอักษร'C'สามารถคิดได้เหมือนเว้าหันหน้าไปทางขวา

ตอนนี้เกิดคำถามเกี่ยวกับวิธีการจัดเก็บคุณสมบัติเหล่านี้ เราจำเป็นต้องตั้งชื่อให้ นี่คือบทบาทของฉลากที่มีอยู่จริง มีการกำหนดป้ายกำกับให้กับคุณสมบัติดังกล่าวเพื่อแยกความแตกต่างจากคุณสมบัติอื่น

ดังนั้นเราจึงได้รับฉลากเป็นผลผลิตเมื่อให้มาพร้อมกับคุณสมบัติที่เป็น input

ป้ายกำกับไม่เกี่ยวข้องกับการเรียนรู้ที่ไม่มีผู้ดูแล


4

วิชาบังคับก่อน: สถิติพื้นฐานและการเปิดรับ ML (Linear Regression)

สามารถตอบได้เป็นประโยค -

เหมือนกัน แต่นิยามเปลี่ยนไปตามความจำเป็น

คำอธิบาย

ให้ฉันอธิบายคำชี้แจงของฉัน exercise.csvสมมติว่าคุณมีชุดข้อมูลเพื่อจุดประสงค์นี้พิจารณา แต่ละคอลัมน์ในชุดข้อมูลเรียกว่าเป็นคุณลักษณะ เพศอายุความสูงอัตราการเต้นของหัวใจ Body_temp และแคลอรี่อาจเป็นหนึ่งในคอลัมน์ต่างๆ แต่ละคอลัมน์แสดงถึงคุณลักษณะหรือคุณสมบัติที่แตกต่างกัน

exercise.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

เพื่อเสริมสร้างความเข้าใจและไขปริศนาให้เราใช้ปัญหาที่แตกต่างกันสองข้อ (กรณีการทำนาย)

CASE1: ในกรณีนี้เราอาจพิจารณาใช้ - เพศส่วนสูงและน้ำหนักเพื่อทำนายแคลอรี่ที่เผาผลาญระหว่างออกกำลังกาย ที่ทำนาย (Y) แคลอรี่ที่นี่เป็นป้าย แคลอรี่เป็นคอลัมน์ที่คุณต้องการที่จะทำนายโดยใช้คุณสมบัติต่างๆเช่น - X1: เพศ x2: ความสูงและ x3: น้ำหนัก

CASE2: ในกรณีที่สองที่นี่เราอาจต้องการทำนาย Heart_rate โดยใช้ Gender and Weight เป็นคุณสมบัติ นี่Heart_Rateเป็นป้ายที่คาดการณ์ไว้โดยใช้คุณสมบัติ - X1: เพศและ x2: น้ำหนัก

เมื่อคุณเข้าใจคำอธิบายข้างต้นแล้วคุณจะไม่สับสนกับ Label and Features อีกต่อไป


3

คุณลักษณะที่อธิบายสั้น ๆ คืออินพุตที่คุณป้อนเข้ากับระบบและเลเบลจะเป็นเอาต์พุตที่คุณคาดหวัง ตัวอย่างเช่นคุณได้เลี้ยงสุนัขหลายลักษณะเช่นความสูงสีขน ฯลฯ ดังนั้นหลังจากคำนวณแล้วมันจะส่งคืนสายพันธุ์ของสุนัขที่คุณต้องการทราบ


0

สมมติว่าคุณต้องการทำนายสภาพอากาศคุณลักษณะที่มอบให้คุณจะเป็นข้อมูลภูมิอากาศในอดีตสภาพอากาศปัจจุบันอุณหภูมิความเร็วลม ฯลฯ และป้ายกำกับจะเป็นเดือน ชุดค่าผสมข้างต้นสามารถช่วยให้คุณได้รับการคาดการณ์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.