t-SNE กับ MDS


21

เคยอ่านคำถามบางอย่างเกี่ยวกับt-SNE ( t-Distributed Stochastic Neighbor Embedding ) เมื่อเร็ว ๆ นี้และยังได้เยี่ยมชมบางคำถามเกี่ยวกับMDS (การวัดหลายมิติ )

พวกเขามักจะใช้แบบอะนาล็อกดังนั้นจึงเป็นความคิดที่ดีที่ทำให้คำถามนี้เมื่อเห็นว่ามีคำถามมากมายทั้งแยกต่างหาก (หรือเปรียบเทียบกับPCA ) ที่นี่


ในระยะสั้นสิ่งที่ทำให้ t-SNE และ MDS แตกต่างกันอย่างไร เช่น. ลำดับชั้นของข้อมูลที่พวกเขาสำรวจมีข้อสมมติฐานที่แตกต่างกัน ฯลฯ

อัตราการลู่เข้า? สิ่งที่เกี่ยวกับการใช้เมล็ดทั้งสองทำตาม?

คำตอบ:


19

PCA เลือกมิติที่มีอิทธิพลโดย eigenanalysis ของจุดข้อมูล N เองขณะที่ MDS เลือกมิติที่มีอิทธิพลโดย eigenanalysis ของจุดข้อมูลของเมทริกซ์ระยะทางคู่ นี่คือผลของการเน้นความเบี่ยงเบนจากความสม่ำเสมอในการแจกแจง เมื่อพิจารณาจากระยะห่างของเมทริกซ์ซึ่งคล้ายกับตัวดึงความเค้น MDS อาจถือว่าเป็นอัลกอริธึมแบบ "บังคับทิศทาง" ความซับซ้อนในการดำเนินการซึ่งเป็นN2ที่ 3 < 4 O(dNa)3<a4

t-SNE ตรงกันข้ามใช้ฟิลด์การประมาณเพื่อดำเนินการรูปแบบที่แตกต่างกันค่อนข้างของรูปแบบบังคับทิศทางโดยทั่วไปผ่าน Barnes-Hut ซึ่งช่วยลดความซับซ้อนไล่ระดับตามเพื่อO ( d N log ( N ) )แต่คุณสมบัติบรรจบกันที่มีความเข้าใจน้อยกว่าสำหรับวิธีการประมาณนี้ซ้ำสุ่ม (ที่ดีที่สุดของความรู้ของฉัน) และสำหรับ2 d 4O(dN2)O(dNlog(N))2d4เวลาที่ใช้ในการสังเกตโดยทั่วไปนั้นยาวกว่าวิธีลดขนาดอื่น ๆ ผลลัพธ์มักจะสามารถมองเห็นได้มากกว่าการตีความทางอิเล็กทรอนิคส์ไร้เดียงสาและขึ้นอยู่กับการกระจายตัวซึ่งมักจะเข้าใจได้ง่ายกว่าผลลัพธ์ของ MDS ซึ่งมีแนวโน้มที่จะรักษาโครงสร้างระดับโลกไว้ด้วยค่าใช้จ่ายของโครงสร้างท้องถิ่น

MDS ได้ทำการลดความซับซ้อนของเคอร์เนล PCA แล้วและควรขยายได้ด้วยเมล็ดสำรองในขณะที่เคอร์เนล t-SNE ถูกอธิบายในที่ทำงานโดย Gilbrecht, Hammer, Schulz, Mokbel, Lueks et al ฉันไม่คุ้นเคยกับมันในทางปฏิบัติ แต่อาจมีผู้ตอบอีกคน

ฉันมักจะเลือกระหว่าง MDS และ t-SNE บนพื้นฐานของเป้าหมายตามบริบท แล้วแต่จำนวนใดจะอธิบายโครงสร้างที่ฉันสนใจในการเน้นโครงสร้างใดก็ตามที่มีอำนาจอธิบายมากขึ้นนั่นคืออัลกอริทึมที่ฉันใช้ สิ่งนี้ถือได้ว่าเป็นหลุมพรางเนื่องจากเป็นรูปแบบหนึ่งของการศึกษาระดับปริญญาอิสระ แต่อิสรภาพที่ใช้อย่างฉลาดไม่ใช่สิ่งเลวร้าย


น่าสนใจมาก! ฉันขอให้คุณชี้แจงเกี่ยวกับการแปลความหมายของ MDS เป็นอัลกอริธึมเลย์เอาต์แบบ "บังคับทิศทาง" ได้หรือไม่และในแง่นี้มันแตกต่างกันอย่างไรกับ t-SNE
Garini
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.