Transformer P22 模型超参数和参数总量计算
前面课程中,我们已经完成了数据处理的流程,接下来就可以开始训练模型了。当然,这个训练流程还是比较复杂的,需要拆分成几节课来完成,这节课先把超参数配置好。
代码示例
1、参数配置项
内容不可见,请联系管理员开通权限。
2、新建训练文件
内容不可见,请联系管理员开通权限。
3、模型实例化
内容不可见,请联系管理员开通权限。
4、查看模型结构和参数量
内容不可见,请联系管理员开通权限。
现在,我们就配置好了模型超参数,并且对模型进行了实例化,下节课,我们就开始加载训练数据,然后训练模型了。
本文链接:http://ichenhua.cn/edu/note/669
版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!