ขนาดของ t-sne มีความหมายไหม?


18

มีความหมายใด ๆ กับขนาดของการฝังตัวที - เอ็นหรือไม่? เช่นเดียวกับ PCA เรามีความรู้สึกถึงการแปรปรวนเชิงเส้นแปรปรวนสูงสุด แต่สำหรับ t-sne นั้นมีสัญชาตญาณนอกเหนือจากพื้นที่ที่เรากำหนดไว้สำหรับการจับคู่และลดระยะทาง KL


1
ไม่แน่ใจว่าสิ่งนี้จะได้รับตามที่คุณขอจริง ๆ หรือไม่ แต่ฉันเชื่อว่าขนาดของ t-sne นั้นขึ้นอยู่กับความสามารถในการแยกของข้อมูลเท่านั้น ขนาดสามารถเปลี่ยนแปลงได้เนื่องจากชุดข้อมูลเดียวกันเนื่องจากเป็นการแปลงที่ไม่ใช่เชิงเส้น ดังนั้นมิติสามารถตีความได้จริงในบริบทของอินสแตนซ์ที่กำหนด แจ้งให้เราทราบหากฉันผิดมันเป็นคำถามที่น่าสนใจ
Hobbes

บางทีมันอาจจะน่าเบื่อแบบเก่า ?3?
Nitro

คำตอบ:


17

มิติของพื้นที่มิติต่ำนั้นไม่มีความหมาย โปรดทราบว่าฟังก์ชั่นการสูญเสีย t-SNE นั้นขึ้นอยู่กับระยะทางระหว่างจุด ( และy j ) และการแจกแจงความน่าจะเป็นมากกว่าระยะทางเหล่านั้น ( p i jและq i j ):Yผมyjpijqij

δδYผม=4ΣJ(พีผมJ-QผมJ)(Yผม-YJ)(1+||Yผม-YJ||2)-1

ดังนั้นจึงไม่มีการฉายภาพจากพื้นที่มิติสูงทั้งหมดไปยังพื้นที่มิติต่ำ t-SNE จะค้นหาการทำแผนที่จากชุดของจุดมิติสูงเฉพาะไปยังชุดเฉพาะของจุดมิติต่ำเท่านั้น เนื่องจากไม่มีฟังก์ชั่นจากช่องว่างหนึ่งไปยังอีกช่องว่างดังนั้นจึงไม่มีความหมายโดยธรรมชาติของแกน

สิ่งที่คุณสามารถจินตนาการเพื่ออธิบายสิ่งนี้:

  • การหมุนหรือการแปลพื้นที่สูงหรือมิติต่ำไม่มีผลต่อระยะห่างระหว่างจุด ดังนั้น t-SNE ไม่สนใจการหมุนหรือการแปลในช่องว่างทั้งสอง ดังนั้นจึงไม่มีการตีความแกนอย่างเด็ดขาด
  • การแจกแจงแบบ t-Student มีหางที่อ้วน สิ่งนี้ทำให้การเป็นตัวแทนมิติต่ำไม่แปรเปลี่ยนไปจากการเปลี่ยนแปลงจุดที่อยู่ห่างไกลในพื้นที่มิติสูง สิ่งนี้ยังทำให้จุดที่อยู่ห่างไกลในพื้นที่มิติสูงอาจอยู่ห่างไกลพอสมควรห่างไกลหรือไกลออกไปจริงๆในพื้นที่มิติต่ำ ในแง่นี้มันยืดส่วนบางส่วนของแกนมิติต่ำ (ในทิศทางใดก็ได้)

ที่ถูกกล่าวว่า t-SNE เป็นหลักเทคนิคการสร้างภาพและประสิทธิภาพการลดขนาดสำหรับวัตถุประสงค์อื่น ๆ ไม่ชัดเจน (อาจไม่เหมาะสำหรับการทำคลัสเตอร์การแยกคุณลักษณะหรือการเลือกคุณสมบัติ)

นอกจากนี้: กระดาษ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.