ฉันได้ใช้ VAE และฉันสังเกตเห็นการใช้งานที่แตกต่างกันสองทางออนไลน์ของความแตกต่างที่ไม่ซับซ้อนของ gaussian KL แบบไม่ระบุตัวตน ความแตกต่างดั้งเดิมตามที่นี่คือ
หากเราถือว่าก่อนหน้านี้คือหน่วย gaussian เช่นและสิ่งนี้จะลดความซับซ้อนลงเหลือ
และนี่คือที่ที่ความสับสนของฉันอยู่ แม้ว่าฉันจะพบ repos github ที่คลุมเครือไม่กี่อย่างกับการใช้งานข้างต้นสิ่งที่ฉันมักจะใช้คือ:
KLL o s s= บันทึก(σ2σ1) +σ21+ (μ1-μ2)22σ22-12
μ2= 0σ2= 1KLL o s s= - บันทึก(σ1) +σ21+μ212-12
KLL o s s= -12( 2 บันทึก(σ1) -σ21-μ21+ 1 )
= -12( บันทึก(σ1) -σ1-μ21+ 1 )
ยกตัวอย่างอย่างเป็นทางการใน
Keras autoencoder กวดวิชา คำถามของฉันคืออะไรฉันหายไปไหนระหว่างสองสิ่งนี้ ความแตกต่างที่สำคัญคือการลดลงของปัจจัยที่ 2 ในคำล็อกและไม่ยกกำลังการแปรปรวน ฉันได้ใช้ความสำเร็จในการวิเคราะห์กับสิ่งที่คุ้มค่า ขอบคุณล่วงหน้าสำหรับความช่วยเหลือใด ๆ !