ผมจะกล่าวถึงคำถามที่พบบ่อยจากเว็บไซต์เสื้อ SNE ที่หนึ่งสำหรับความงุนงง:
ฉันจะตั้งค่าความฉงนสนเท่ห์ใน t-SNE ได้อย่างไร?
ประสิทธิภาพของ t-SNE ค่อนข้างแข็งแกร่งภายใต้การตั้งค่าที่แตกต่างกันของความสับสน ค่าที่เหมาะสมที่สุดขึ้นอยู่กับความหนาแน่นของข้อมูลของคุณ การพูดอย่างหลวม ๆ อาจกล่าวได้ว่าชุดข้อมูลที่มีขนาดใหญ่ขึ้นและหนาแน่นขึ้นต้องมีความสับสนมากขึ้น ค่าทั่วไปสำหรับช่วงความน่างงงวยระหว่าง 5 และ 50
สำหรับ paremeters อื่น ๆ ทั้งหมดฉันจะลองอ่านสิ่งนี้:
ฉันจะประเมินคุณภาพของการสร้างภาพข้อมูลที่ t-SNE สร้างได้อย่างไร
เด่นกว่าเพียงแค่ดูพวกเขา! โปรดสังเกตว่า t-SNE ไม่ได้รักษาระยะทาง แต่น่าจะเป็นดังนั้นการวัดข้อผิดพลาดบางอย่างระหว่างระยะทางแบบยุคลิดใน high-D และ low-D นั้นไม่มีประโยชน์ อย่างไรก็ตามหากคุณใช้ข้อมูลและความสับสนเดียวกันคุณสามารถเปรียบเทียบความแตกต่างของ Kullback-Leibler ที่รายงาน t-SNE เป็นการดีที่จะเรียกใช้ t-SNE สิบครั้งและเลือกโซลูชันที่มีค่าเบี่ยงเบน KL ต่ำสุด
กล่าวอีกนัยหนึ่งก็คือ: ดูที่เนื้อเรื่องถ้าการสร้างภาพข้อมูลที่ดีไม่เปลี่ยนพารามิเตอร์ นอกจากนี้คุณยังสามารถเลือกการรันด้วยค่าเบี่ยงเบน KL ต่ำสุดสำหรับความสับสนคงที่แต่ละรายการ