Transformer P25 BLEU指标和模型参数缓存

作者：陈华 • 发布时间：2023-09-24 • 阅读 1222

前面课程中，实现了逐字生成预测值的逻辑，但是缺少一个具体的分数值，来衡量模型效果。这节课，引入一个翻译任务常用的评估指标：BLEU指标，给模型效果打一个具体分数，并且在训练过程中，把分数最高的模型参数缓存下来，供后面的预测流程使用。

1、BLEU示例

pip install sacrebleu

内容不可见，请联系管理员开通权限。

2、定义辅助函数

内容不可见，请联系管理员开通权限。

3、评估函数返回BLEU分数

内容不可见，请联系管理员开通权限。

4、保存最好的模型参数

内容不可见，请联系管理员开通权限。

5、loss值下降慢解决方案

内容不可见，请联系管理员开通权限。

好的，那现在这个训练流程就基本走通了，并且在训练过程中，缓存了效果最好的模型参数，最后，就可以用这个模型做预测。

本课程为收费课程，购买后可查看！