Transformer P23 模型训练和验证流程
前面课程中,我们已经搞定了模型实例化和超参数的配置,接下来就进入训练和验证环节了。训练和验证流程,都是加载数据,然后输入模型进行预测,再计算损失,所以这个过程是可以复用的,我们单独定义一个函数来处理。
代码示例
1、损失函数和优化器
内容不可见,请联系管理员开通权限。
2、多轮训练
内容不可见,请联系管理员开通权限。
3、每一轮单独处理
内容不可见,请联系管理员开通权限。
4、验证流程
内容不可见,请联系管理员开通权限。
现在,模型已经可以开始训练了,但是在训练过程中,只计算了loss值,并不知道模型的效果到底怎么样。所以下节课,我们需要模拟只有英文输入,逐字生成目标值的场景。
本文链接:http://ichenhua.cn/edu/note/670
版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!