ใช่ GAN สามารถใช้เป็นข้อความได้ อย่างไรก็ตามมีปัญหาในการรวมกันของวิธีการทำงานของ GAN และวิธีการสร้างข้อความโดยปกติโดยเครือข่ายประสาท:
- GAN ทำงานโดยแพร่กระจายการไล่ระดับสีผ่านองค์ประกอบของตัวสร้างและตัวแยกประเภท
- ตามปกติข้อความจะถูกสร้างขึ้นโดยมีเลเยอร์ softmax สุดท้ายเหนือพื้นที่โทเค็นนั่นคือเอาต์พุตของเครือข่ายโดยปกติแล้วความน่าจะเป็นของการสร้างโทเค็นแต่ละอัน (เช่นหน่วยสุ่ม)
2 สิ่งเหล่านี้ทำงานได้ไม่ดีด้วยกันเพราะคุณไม่สามารถถ่ายทอดการไล่ระดับสีผ่านหน่วยสุ่ม มี 2 วิธีหลักในการจัดการกับสิ่งนี้: อัลกอริทึม REINFORCEและGumbel-Softmax reparameterization (หรือที่เรียกว่าการกระจายคอนกรีต ) พิจารณาว่า REINFORCE เป็นที่ทราบกันดีว่ามีความแปรปรวนสูงดังนั้นคุณจึงต้องการข้อมูลจำนวนมากเพื่อให้ได้ค่าประมาณการไล่ระดับสีที่ดี
เป็นตัวอย่างของการเสริมสร้างสำหรับ Gans ต้นฉบับเดิมที่คุณสามารถตรวจสอบบทความ SeqGAN ตัวอย่างของกัมเบล-Softmax คุณสามารถตรวจสอบบทความนี้
อีกตัวเลือกที่แตกต่างกันอย่างสิ้นเชิงคือการไม่มีหน่วยสุ่มแยกเป็นเอาท์พุทของเครื่องกำเนิดไฟฟ้า (เช่นการสร้างสัญญาณโทเค็นในพื้นที่ฝังตัว) ดังนั้นการกำจัดปัญหาเดิมของการ backpropagating ผ่านพวกเขา