CasRel项目 P16 Kaggle多GPU并行训练模型演示
前面课程当中,代码已经修改完了,接下来就是同步到Kaggle上,训练好模型之后,再下载到本地测试。因为Kaggle最近改版了,跟之前演示的过程略有区别,所以这节课,再演示一遍复制的流程。
操作演示
1、切换GPU
注意要先验证手机号,开启网络,再切换GPU.
2、上传文件
如果两份数据都上传了,要注意路径的问题。
3、复制代码
注意先后顺序,要把文件之间的引用去掉。
4、修改配置
注意路径直接复制,避免出错。生成文件直接放到根目录,Kaggle不会自动生成目录。如果报内存溢出的错误,可以把 batch_size 设小点。
5、测试和预测
内容不可见,请联系管理员开通权限。
6、补充说明
有同学问,预测出关系之后,还要不要做实体识别。关系确定之后,关系两端的实体类别就是确定的,不需要再做实体识别了。跟先做实体识别,再做关系抽取的 Pipline 的套路,是有本质区别的,大家可以再理解一下。
内容不可见,请联系管理员开通权限。
关系抽取,其实是传统 NLP 中比较难的任务,这个项目能搞定的话,NLP 的基础就算比较好了。再往后,就可以去了解知识图谱和大模型相关的项目。
本文链接:http://ichenhua.cn/edu/note/727
版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!