Transformer P25 BLEU指标和模型参数缓存
前面课程中,实现了逐字生成预测值的逻辑,但是缺少一个具体的分数值,来衡量模型效果。这节课,引入一个翻译任务常用的评估指标:BLEU指标,给模型效果打一个具体分数,并且在训练过程中,把分数最高的模型参数缓存下来,供后面的预测流程使用。
代码示例
1、BLEU示例
pip install sacrebleu
内容不可见,请联系管理员开通权限。
2、定义辅助函数
内容不可见,请联系管理员开通权限。
3、评估函数返回BLEU分数
内容不可见,请联系管理员开通权限。
4、保存最好的模型参数
内容不可见,请联系管理员开通权限。
5、loss值下降慢解决方案
内容不可见,请联系管理员开通权限。
好的,那现在这个训练流程就基本走通了,并且在训练过程中,缓存了效果最好的模型参数,最后,就可以用这个模型做预测。
本文链接:http://ichenhua.cn/edu/note/672
版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!