Transformer P16 模型封装和参数初始化
现在还剩下最后一步操作,就是把零散的模块,封装成一个完整的模型结构,模型名字就叫做 Transformer。同时,在模型实例化的时候,还需要对模型参数进行 xavier 的初始化(P4节),所以单独定义一个函数,来实例化模型。
代码示例
1、封装完整模型结构
内容不可见,请联系管理员开通权限。
2、使用 xavier 初始化模型参数
内容不可见,请联系管理员开通权限。
3、调用测试
内容不可见,请联系管理员开通权限。
好的,到目前为止,完整的 Transformer 模型结构就讲完了,但是要用这个模型去处理具体任务,还有大量的准备工作要完成,比如数据预处理、 learning_rate 衰减策略、多GPU并行训练、损失值计算、预测值的逐字生成等等。所以说大家别还要打起精神,万里长征才走完一半。
本文链接:http://ichenhua.cn/edu/note/663
版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!