ทำไมต้องกังวลกับการจัดอันดับต่ำ?


20

หากคุณมีเมทริกซ์ที่มีคอลัมน์ n แถวและ m คุณสามารถใช้ SVD หรือวิธีอื่น ๆ ในการคำนวณการประมาณค่าต่ำของเมทริกซ์ที่กำหนด

อย่างไรก็ตามการประมาณอันดับต่ำจะยังคงมี n แถวและคอลัมน์ m การประมาณอันดับต่ำจะมีประโยชน์สำหรับการเรียนรู้ของเครื่องและการประมวลผลภาษาธรรมชาติอย่างไรเนื่องจากคุณมีคุณสมบัติจำนวนเท่าเดิม


2
พวกเขามักจะมีการกระจัดกระจาย - คุณไม่จำเป็นต้องเก็บหมายเลขไว้สำหรับการจัดอันดับต่ำ ตัวอย่างเช่นการประมาณอันดับ 1 ต้องใช้หมายเลขม.nn+ม.
ความน่าจะเป็นทางการที่

คำตอบ:


16

การประมาณตำแหน่งต่ำของสามารถแยกย่อยเป็นเมทริกซ์สแควร์รูตขณะที่โดยที่การสลายตัวของไอเกนของคือซึ่งจะช่วยลดจำนวนของคุณสมบัติที่สามารถแสดงโดยอยู่บนพื้นฐานของการประมาณตำแหน่ง-R เป็น T โปรดทราบว่าตัวห้อยX^XG=ยูRλR12XยูλยูTGX^=GGTR แสดงถึงจำนวนของ eigen-vectors และ eigen-values ​​ที่ใช้ในการประมาณ ดังนั้นจึงลดจำนวนคุณสมบัติเพื่อแสดงข้อมูล ในบางตัวอย่างการประมาณระดับต่ำถือว่าเป็นพื้นฐานหรือตัวแปรแฝง (พจนานุกรม) การขยายตามข้อมูลต้นฉบับภายใต้ข้อ จำกัด พิเศษเช่น orthogonality ไม่ใช่ลบ (ไม่ใช่เมทริกซ์เมทริกซ์เชิงลบ) ฯลฯ


5

จุดประมาณระดับต่ำไม่ได้เป็นเพียงการลดขนาดเท่านั้น

แนวคิดก็คือตามความรู้ในโดเมนข้อมูล / รายการของเมทริกซ์จะทำให้เมทริกซ์อยู่ในระดับต่ำ แต่ในกรณีที่เหมาะสมที่สุดที่รายการไม่ได้รับผลกระทบจากเสียงการทุจริตค่าที่หายไปเป็นต้นเมทริกซ์ที่สังเกตมักจะมีอันดับที่สูงกว่ามาก

การประมาณอันดับต่ำจึงเป็นวิธีการกู้คืน "ต้นฉบับ" (เมทริกซ์ "อุดมคติ" ก่อนที่มันจะถูกรบกวนด้วยเสียงรบกวน ฯลฯ ) เมทริกซ์ระดับต่ำคือค้นหาเมทริกซ์ที่สอดคล้องกันมากที่สุด (ในแง่ของรายการที่สังเกต) กับเมทริกซ์ปัจจุบันและอยู่ในระดับต่ำเพื่อให้สามารถใช้เป็นการประมาณค่าเมทริกซ์ในอุดมคติ การกู้คืนเมทริกซ์นี้เราสามารถใช้มันแทนเวอร์ชันที่มีเสียงดังและหวังว่าจะได้ผลลัพธ์ที่ดีกว่า


4

อีกสองเหตุผลที่ไม่ได้กล่าวถึง:

  1. ลดอาการปวดคอด ฉันเชื่อว่าเทคนิคเหล่านี้ส่วนใหญ่จะกำจัดความไม่เป็นสีซึ่งจะเป็นประโยชน์สำหรับการประมวลผลที่ตามมา

  2. จินตนาการของเราอยู่ในอันดับต่ำดังนั้นจึงเป็นประโยชน์สำหรับการสำรวจความสัมพันธ์ระดับต่ำ



1

ตาม "เทคนิคหลายตัวแปรทางสถิติที่ทันสมัย ​​(Izenman)" การลดอันดับการถดถอยครอบคลุมวิธีการที่น่าสนใจหลายกรณีเช่นกรณีพิเศษรวมถึง PCA, การวิเคราะห์ปัจจัย, ตัวแปรตามบัญญัติและการวิเคราะห์สหสัมพันธ์, LDA และการวิเคราะห์การติดต่อ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.