第53页(2 / 2)

度值都基本接近0,从求导公式可以看出有个连乘操作。而向量函数对向量求导结果为一个Jacobian矩阵,元素为每个点的导数,当矩阵中的值太大时,经过指数放大,则会产生梯度爆炸。可以设置一个梯度阈值来处理。另外梯度消失,可以用ReLU来替代tanh和sigmoid激活函数,或者用LSTM或GRU结构。

森□□授调皮的眨眨眼:回答得相当标准。你对智能编程有所研究对吗?

徐静怡点点头。

旁边忽然有一个留着长刘海的女生显然是迷妹,她再三打量徐静怡,忽然低呼:啊,难道,难道你就是直播间的超级大科学家吗?!

这名字挂在直播间不觉得,突然被人喊出来有点中二。

徐静怡:微微额首。

这里不少学生都看过那个直播,顿时引起窃窃私语,不少人对着徐静怡小声地指点,有激动的,也有不屑的。

森田教授讶异地看向助教,助教在阶梯上询问了几句后跑到森田教授那低声说。

森田教授眼前一亮,看向徐静怡,笑了笑:如何设置网络的层数rnn_yers来增强神经网络的学习能力?