从本节开始,我将带大家完成一个深度学习项目:用图卷积神经网络(GCN),实现一个「火车票文字信息提取」的项目,由于火车票上每个节点文字不是等长的,所以还需要添加一个前置的 LSTM 来提取句子特征。

课前说明

1、这是一个收费课程,如果是在公开平台上可能只是试看,完整版可以到腾讯课堂,或者网易云课堂上订阅。

2、关于免费和收费课的区别,免费课讲解知识点和小项目(比赛),收费课是可以落地商用的,至少是可以写到简历里的项目。

3、本课程定位是项目课,目的是完成功能,LSTM 和 GCN 的理论基础需要前置自学。

完整版:http://ichenhua.cn/t/gcn

功能演示

1、在模型已经训练好的前提下,将需要识别的图片上传到项目中;

2、依次进行OCR识别,图结构生成,模型预测,信息提取流程。

模型结构图示

参考论文和代码

https://arxiv.org/abs/1609.02907

https://github.com/tkipf/pygcn

三方依赖库

1、PaddleOCR,用于识别火车票文字和位置信息

pip install paddlepaddle==2.2
pip install paddleocr==2.6

2、networkx,用于构建图结构

pip install networkx

3、Pytorch,用于构建神经网络

pip install torch==1.12

本文链接:http://ichenhua.cn/edu/note/464

版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!