t-SNE กับ MDS

เคยอ่านคำถามบางอย่างเกี่ยวกับt-SNE ( t-Distributed Stochastic Neighbor Embedding ) เมื่อเร็ว ๆ นี้และยังได้เยี่ยมชมบางคำถามเกี่ยวกับMDS (การวัดหลายมิติ )

พวกเขามักจะใช้แบบอะนาล็อกดังนั้นจึงเป็นความคิดที่ดีที่ทำให้คำถามนี้เมื่อเห็นว่ามีคำถามมากมายทั้งแยกต่างหาก (หรือเปรียบเทียบกับPCA ) ที่นี่

ในระยะสั้นสิ่งที่ทำให้ t-SNE และ MDS แตกต่างกันอย่างไร เช่น. ลำดับชั้นของข้อมูลที่พวกเขาสำรวจมีข้อสมมติฐานที่แตกต่างกัน ฯลฯ

อัตราการลู่เข้า? สิ่งที่เกี่ยวกับการใช้เมล็ดทั้งสองทำตาม?

— Firebug
แหล่งที่มา

PCA เลือกมิติที่มีอิทธิพลโดย eigenanalysis ของจุดข้อมูล N เองขณะที่ MDS เลือกมิติที่มีอิทธิพลโดย eigenanalysis ของจุดข้อมูลของเมทริกซ์ระยะทางคู่ นี่คือผลของการเน้นความเบี่ยงเบนจากความสม่ำเสมอในการแจกแจง เมื่อพิจารณาจากระยะห่างของเมทริกซ์ซึ่งคล้ายกับตัวดึงความเค้น MDS อาจถือว่าเป็นอัลกอริธึมแบบ "บังคับทิศทาง" ความซับซ้อนในการดำเนินการซึ่งเป็น $N^2$ ที่ 4 $\mathcal O(dN^a)$ $3 < a \leq 4$

t-SNE ตรงกันข้ามใช้ฟิลด์การประมาณเพื่อดำเนินการรูปแบบที่แตกต่างกันค่อนข้างของรูปแบบบังคับทิศทางโดยทั่วไปผ่าน Barnes-Hut ซึ่งช่วยลดความซับซ้อนไล่ระดับตามเพื่อแต่คุณสมบัติบรรจบกันที่มีความเข้าใจน้อยกว่าสำหรับวิธีการประมาณนี้ซ้ำสุ่ม (ที่ดีที่สุดของความรู้ของฉัน) และสำหรับ $\mathcal O(dN^2)$ $\mathcal O(dN\cdot \log(N))$ $2 \leq d \leq 4$ เวลาที่ใช้ในการสังเกตโดยทั่วไปนั้นยาวกว่าวิธีลดขนาดอื่น ๆ ผลลัพธ์มักจะสามารถมองเห็นได้มากกว่าการตีความทางอิเล็กทรอนิคส์ไร้เดียงสาและขึ้นอยู่กับการกระจายตัวซึ่งมักจะเข้าใจได้ง่ายกว่าผลลัพธ์ของ MDS ซึ่งมีแนวโน้มที่จะรักษาโครงสร้างระดับโลกไว้ด้วยค่าใช้จ่ายของโครงสร้างท้องถิ่น

MDS ได้ทำการลดความซับซ้อนของเคอร์เนล PCA แล้วและควรขยายได้ด้วยเมล็ดสำรองในขณะที่เคอร์เนล t-SNE ถูกอธิบายในที่ทำงานโดย Gilbrecht, Hammer, Schulz, Mokbel, Lueks et al ฉันไม่คุ้นเคยกับมันในทางปฏิบัติ แต่อาจมีผู้ตอบอีกคน

ฉันมักจะเลือกระหว่าง MDS และ t-SNE บนพื้นฐานของเป้าหมายตามบริบท แล้วแต่จำนวนใดจะอธิบายโครงสร้างที่ฉันสนใจในการเน้นโครงสร้างใดก็ตามที่มีอำนาจอธิบายมากขึ้นนั่นคืออัลกอริทึมที่ฉันใช้ สิ่งนี้ถือได้ว่าเป็นหลุมพรางเนื่องจากเป็นรูปแบบหนึ่งของการศึกษาระดับปริญญาอิสระ แต่อิสรภาพที่ใช้อย่างฉลาดไม่ใช่สิ่งเลวร้าย

— aminorex
แหล่งที่มา

น่าสนใจมาก! ฉันขอให้คุณชี้แจงเกี่ยวกับการแปลความหมายของ MDS เป็นอัลกอริธึมเลย์เอาต์แบบ "บังคับทิศทาง" ได้หรือไม่และในแง่นี้มันแตกต่างกันอย่างไรกับ t-SNE

— Garini