关于训练和测试 #3

yyl-bot · 2019-02-15T12:03:57Z

在RNN+ATTENTION的model中为什么直接用targets来作为Decoder的Input来训练啊？用每一个时间步（程序中的di）的hidden来作为下一步的input吗？

airaria · 2019-02-17T14:21:43Z

decoder的每一步的input用的是上一步预测位置的真实标签(target)，

yyl-bot · 2019-02-18T03:21:12Z

训练的时候这样可以理解，但是为什么evaluate的时候第一步也要输入真实标签呢，测试的时候不是没有真实标签的吗？

airaria · 2019-02-18T14:58:19Z

evaluate的时候第一个输入taget[:,0]是一个表示开始的标志位呀，不是真实标签。就是说在数据预处理的时候已经在所有样本的第一位添加了一个特殊标识符，所以测试也是没问题的

yyl-bot closed this as completed Feb 18, 2019

yyl-bot reopened this Feb 18, 2019

Provide feedback