การแสดงข้อมูลมิติสูง


11

ฉันมีตัวอย่างของสองคลาสซึ่งเป็นเวกเตอร์ในพื้นที่มิติสูงและฉันต้องการพล็อตพวกมันใน 2D หรือ 3D

ฉันรู้เกี่ยวกับเทคนิคการลดขนาด แต่ฉันต้องการเครื่องมือที่ง่ายและใช้งานง่าย (ใน matlab, python หรือ. exe ที่สร้างไว้ล่วงหน้า)

นอกจากนี้ฉันสงสัยว่าการเป็นตัวแทนใน 2D จะเป็น "ความหมาย" หรือไม่? (ตัวอย่างเช่นวิธีที่สองคลาสตัดกันหรือสามารถแยกได้)

คำตอบ:


8

คุณสามารถลองtSNE มันค่อนข้างตรงไปตรงมาที่จะใช้ มันทำงานร่วมกับ Octave นอกเหนือไปจาก Matlab และ Python ดูคำแนะนำเพื่อรับพล็อตแรกภายในหนึ่งนาที


10

หนึ่งในเครื่องมือที่สร้างไว้ล่วงหน้าสำหรับการแสดงข้อมูลมิติสูงggobi มันช่วยให้คุณแต้มสีเพื่อแสดงกลุ่มจากนั้นมีตัวเลือกสองสามอย่างสำหรับการลดขนาดสูงเป็น 2 มิติ เครื่องมือที่ดีอย่างยิ่งอย่างหนึ่งคือทัวร์แกรนด์ 2D ที่หมุนคลาวด์ข้อมูลในหลายมิติและแสดงภาพเคลื่อนไหวของการฉายภาพ 2 มิติของการหมุน คุณสามารถชะลอหรือหยุดการหมุนเมื่อคุณเห็นรูปแบบที่น่าสนใจ


เครื่องมือที่ดีมากซึ่งใช้ได้กับอาร์
อีฟว์


2

แนวทางแบบดั้งเดิมจะใช้ PCA ( การวิเคราะห์องค์ประกอบหลัก ) เพื่อดำเนินการลดมิติเชิงเส้น โดยพื้นฐานแล้วสิ่งนี้จะนำข้อมูลของคุณไปสู่พื้นที่ที่มีมิติต่ำกว่า (ในกรณี 2D นี้เป็นเพียงระนาบ) ในขณะที่รักษาความแปรปรวนของข้อมูลให้ได้มากที่สุด

การเรียกใช้ PCA มักเกี่ยวข้องกับการดำเนินการคำสั่งเดียวในภาษาการเขียนโปรแกรมส่วนใหญ่ดังนั้นจึงเป็นเรื่องง่ายมาก

คุณควรจำไว้ว่าเป็นไปได้ว่าข้อมูลของคุณไม่สามารถแสดงอย่างถูกต้องใน 2 หรือ 3 มิติ PCA จะให้การประมาณเชิงปริมาณแก่คุณโดยอัตโนมัติ: มันจะบอกคุณว่าเปอร์เซ็นต์ความแปรปรวนนั้นถูกบันทึกโดยการแสดงมิติที่ต่ำ วิธีนี้จะทำให้คุณรู้สึกว่าคุณสูญเสียข้อมูลไปมากเพียงใดด้วยการดูการสร้างภาพข้อมูลที่ง่ายขึ้นนี้




1

นอกจากข้อเสนอแนะของ @ juampa คุณควรลองใช้NeRV (Neighbor Retrieval Visualizer) ซึ่ง " เป็นวิธีการดึงข้อมูลตามหลักการในการลดขนาดที่ไม่เป็นเชิงเส้น " และ SNE / t-SNE สามารถมองเห็นเป็นกรณีพิเศษของ NeRV จุดหลักของ NeRV คือการลดการเรียกคืนและลดความแม่นยำระหว่างพื้นที่ดั้งเดิมและจอแสดงผล NeRV มีไว้เป็นเครื่องมือบรรทัดคำสั่งที่เขียนด้วย C ++

ภาพตัวอย่างจากเว็บไซต์ของพวกเขา: ผลลัพธ์ที่เหลือจะเน้นที่การเรียกคืน (น้อยกว่า "คิดถึง") ในขณะที่รูปที่ถูกต้องเน้นที่ความแม่นยำมากขึ้น (น้อยกว่า "เพื่อนบ้านที่เป็นเท็จ")

ป้อนคำอธิบายรูปภาพที่นี่


1

หากคุณไม่คัดค้านซอฟต์แวร์เชิงพาณิชย์คุณสามารถลองใช้ซอฟต์แวร์ VisuMap ที่ใช้อัลกอริธึมการทำแผนที่เชิงเส้นและไม่ใช่เชิงเส้นหลายสิบรายการสำหรับข้อมูลมิติสูงรวมถึงวิธีการเช่น PCA, LDA, SMACOF, tSNE, CCA, Sammon, Kohonen Map เป็นต้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.