logo - 刷刷题
下载APP
【单选题】

使用随机梯度下降(SGD )算法对于多层感知机(MLP )进行参数更新,前项计算的作用

A.
为了计算输出层上的损失(loss)
B.
为了验证每层参数的梯度计算正确
C.
上述训练过程不需要前项推断计算
D.
为了计算每层参数的导数
举报
参考答案:
参考解析:
.
刷刷题刷刷变学霸
举一反三

【单选题】不是随机梯度下降的特点是()

A.
批量数值选取为1
B.
学习率逐渐减小
C.
可以达到最小值
D.
在最小值附近波动

【多选题】感知机有哪些层?( )

A.
输入层
B.
输出层
C.
隐含层
D.
感知层

【多选题】323/651以下关于随机梯度下降和小批量梯度下降的描述,正确的是哪些项?

A.
随机样度下降的不稳定性可以帮助模型在收敛中跳过一些局部极值点
B.
小批量梯度下降相比于随机梯度下降更容易受到噪声数据的影响
C.
随机梯度下降的一种实现是在线学习(Online Learning),它根据每一个样例来更新葆度
D.
小批量梯度下降的思想是每次使用一小批固定尺寸(Batch Size)的样例来更新权值