ความหมายของคุณสมบัติแฝง?


15

ฉันกำลังพยายามที่จะเข้าใจรูปแบบเมทริกซ์การแยกตัวประกอบสำหรับระบบผู้แนะนำและฉันมักจะอ่าน 'คุณสมบัติที่แฝงอยู่' แต่นั่นหมายความว่าอย่างไร ฉันรู้ว่าคุณลักษณะใดมีความหมายต่อชุดข้อมูลการฝึกอบรม แต่ฉันไม่สามารถเข้าใจแนวคิดเกี่ยวกับคุณลักษณะแฝง บทความในหัวข้อที่ฉันพบทุกฉบับนั้นตื้นเกินไป

แก้ไข:

ถ้าอย่างน้อยคุณก็สามารถชี้ให้ฉันดูเอกสารที่อธิบายความคิดนั้นได้


นี่คือตัวอย่างง่ายๆที่อาจช่วยให้คุณquuxlabs.com/blog/2010/09/…
Akavall

คำตอบ:


9

แฝงหมายถึงไม่สามารถสังเกตได้โดยตรง การใช้คำศัพท์ร่วมกันใน PCA และการวิเคราะห์ปัจจัยคือการลดขนาดของคุณสมบัติที่สามารถสังเกตได้โดยตรงจำนวนมากให้เป็นชุดเล็กของคุณสมบัติที่สามารถสังเกตได้ทางอ้อม


ดังนั้นขนาดที่ลดลงจึงเป็นคุณสมบัติแฝง ในกรณีของ PCA, เวกเตอร์ eigen ของเมทริกซ์ความแปรปรวนร่วมนั่นคือองค์ประกอบหลักใช่ไหม?
Jack Twain

ถูกต้อง @AlexTwain
samthebest

คุณสามารถให้บทเรียน / กระดาษที่กล่าวถึงได้หรือไม่ ฉันไม่สามารถหาเอกสารการสอน / ระบบอย่างเป็นระบบได้!
Jack Twain

หน้า wiki นั้นค่อนข้างดีคุณสามารถติดตามการอ้างอิงได้ถ้าคุณต้องการen.wikipedia.org/wiki/Latent_variable
samthebest

1
@ แจ็คทั้งคู่การเปรียบเทียบ PCA ที่ถูกต้องก็คือคุณสมบัติที่แฝงอยู่นั้นเป็นค่าเฉพาะ ส่วนประกอบหลักคือน้ำหนักที่กำหนดให้กับแต่ละการสังเกตสำหรับผู้ชำนาญการเฉพาะด้าน ในรูปแบบเมทริกซ์ตัวประกอบอื่น ๆ คุณลักษณะที่แฝงนั้นมีบทบาทของไอเกน สิ่งนี้อาจฟังดูคล่องแคล่ว แต่ความผิดพลาดนั้นไม่สร้างความสับสนให้กับผู้คน
คาดเดา

3

ในบริบทของวิธีการแยกองค์ประกอบวิธีการแฝงมักจะหมายถึงลักษณะรายการตามแต่ละมิติ ให้ฉันอธิบายด้วยตัวอย่าง

RRuipuTqipuuqii

puqi


ฉันอ่านเอกสารที่มีคุณสมบัติที่แฝงอยู่ (พูดว่า "ผู้ใช้เวกเตอร์") ใช้ในการทำนายตัวแปรเป้าหมายบางอย่างลองใช้เพศเป็นตัวอย่าง มัน "ใช้งานได้" ซึ่งสามารถสร้างแบบจำลองการทำนายได้ด้วยวิธีนี้ คำถามของฉันคือความแตกต่างระหว่าง "ผู้ใช้เวกเตอร์" และพูดว่า "เวกเตอร์รายการ" โดยเฉลี่ยสำหรับรายการทั้งหมดที่ผู้ใช้มี "เยี่ยมชม" คืออะไร? IOW คุณคาดหวังรูปแบบการทำนายที่กล่าวถึงข้างต้นจะดีกว่าหรือแย่กว่าเมื่อเทียบกับอีกรุ่นหนึ่งหรือไม่? ขอบคุณ (ถ้าคุณเคยเห็นสิ่งนี้)
thecity2

@ thecity2 คุณสามารถหาค่าเฉลี่ยของผู้ใช้และนี่อาจเป็นประโยชน์จริง ๆ เมื่อคุณติดต่อกับผู้มาใหม่ซึ่งคุณไม่มีพาหะของผู้ใช้ล่วงหน้า (แม้ว่ามันจะยากที่จะเรียกใช้การปรับให้เหมาะสมสองสามซ้ำเพื่อคำนวณ) นอกจากนี้ยังมีปัญหาในการหาค่าเฉลี่ยแบบธรรมดา: ยิ่งมีผู้ใช้ไอเท็มมากเท่าไหร่ก็ยิ่งมีโอกาสที่เวกเตอร์ไอเท็มเฉลี่ยของพวกเขาใกล้เคียงกับศูนย์มากขึ้น (เนื่องจาก L2 regularizer ทั่วไปและคุณสมบัติน่ารังเกียจอื่น ๆ ในที่สุดการมีเวกเตอร์แยกต่างหากมีความยืดหยุ่นมากขึ้น: โมเดลของคุณสามารถเรียนรู้การหาค่าเฉลี่ยได้
Artem Sobolev

ที่กล่าวว่ามีความพยายามที่จะใช้ประวัติผู้ใช้เป็นตัวอย่างเวกเตอร์ของผู้ใช้ ตัวอย่างเช่นดูบทความ "สร้างผู้แนะนำดนตรีของคุณเองด้วยการสร้างแบบจำลอง Internet Radio Streams"
Artem Sobolev

0

ฉันจะบอกว่าปัจจัยเป็นตัวแทนมากกว่าองค์ประกอบหลักในการรับรู้ 'แฝง' / ซ่อนเร้นของตัวแปร ความหน่วงแฝงเป็นสาเหตุหนึ่งที่ทำให้นักวิทยาศาสตร์ด้านพฤติกรรมทำการวัดการรับรู้เช่นความรู้สึกความเศร้าในแง่ของหลาย ๆ รายการ / มาตรการและได้มาซึ่งตัวเลขสำหรับตัวแปรที่ซ่อนอยู่ซึ่งไม่สามารถวัดได้โดยตรง


0

นี่คือข้อมูลของคุณที่ให้คะแนนโดยผู้ใช้หลายคนต่อภาพยนตร์ต่าง ๆ ในขณะที่คนอื่นชี้ให้เห็นว่าแฝงหมายถึงไม่สามารถสังเกตได้โดยตรง

สำหรับภาพยนตร์คุณสมบัติแฝงของมันจะกำหนดปริมาณของแอ็คชั่น, ความรัก, เนื้อเรื่อง, นักแสดงที่มีชื่อเสียง ฯลฯ ในทำนองเดียวกันสำหรับชุดข้อมูลอื่นที่ประกอบด้วยตัวเลขที่เขียนด้วยลายมือตัวแปรแฝงอาจเป็นมุมของขอบเอียง ฯลฯ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.