Transformer P14 解码器层代码实现
上节课介绍了解码器中唯一特殊的点,就是需要用 mask 遮掩后生成的位置权重,除了这一点之外,其他的都是在编码器部分已经实现的模块,接下来,就是对照 Transformer 的结构图,组装出一个解码器层。
代码示例
1、解码器子层
需要注意的是,第二个注意力层中,query 来自上一层输出,key 和 value 来自编码层的输出,称为 memory。
内容不可见,请联系管理员开通权限。
2、解码器层
内容不可见,请联系管理员开通权限。
3、调用测试
内容不可见,请联系管理员开通权限。
好的,到现在为止,编码器和解码器就都已经实现了。接下来,就只剩下最后一块,就是生成目标值了。
本文链接:http://ichenhua.cn/edu/note/661
版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!