หน่วย GRU เต็ม
c~t=tanh(Wc[Gr∗ct−1,xt]+bc)
Gu=σ(Wu[ct−1,xt]+bu)
Gr=σ(Wr[ct−1,xt]+br)
ct=Gu∗c~t+(1−Gu)∗ct−1
at=ct
หน่วย LSTM
c~t=tanh(Wc[at−1,xt]+bc)
Gu=σ(Wu[at−1,xt]+bu)
Gf=σ(Wf[at−1,xt]+bf)
Go=σ(Wo[at−1,xt]+bo)
ct=Gu∗c~t+Gf∗ct−1
at=Go∗tanh(ct)
ดังที่เห็นได้จากสมการ LSTM ที่มีเกตการอัพเดทแยกและลืมเกท สิ่งนี้ทำให้ LSTMs มีความซับซ้อนมากขึ้น แต่ในเวลาเดียวกันก็มีความซับซ้อนเช่นกัน ไม่มีวิธีง่ายๆในการตัดสินใจว่าจะใช้สำหรับกรณีการใช้งานเฉพาะของคุณ คุณต้องลองผิดลองถูกเพื่อทดสอบประสิทธิภาพ อย่างไรก็ตามเนื่องจาก GRU ง่ายกว่า LSTM GRUs จึงใช้เวลาในการฝึกอบรมน้อยลงและมีประสิทธิภาพมากขึ้น
เครดิต: Andrew Ng