二者目的不一样。
sigmoid用在了各种gate上,产生0~1之间的值,这个使用sigmoid最直接,相当于要么是1则记住要么是0则忘掉。tanh用在了状态和输出上,是对数据的处理,这个也可以用其他激活函数。