KBQA项目 P5 正则表达式实现用户问题实体抽取
前面课程中,已经把数据导入到图数据库中了,接下来,就是针对具体问题,去做查询了。在查询之前,得先搞清楚用户想问什么,所以,得先把用户问题里面的,关键信息提取出来。
抽取数据格式
例1:霸王别姬的主演有哪些?
内容不可见,请联系管理员开通权限。
例2:霸王别姬的片长是多少?
内容不可见,请联系管理员开通权限。
例3:霸王别姬和张国荣是什么关系?
内容不可见,请联系管理员开通权限。
代码示例
1、创建问答处理类
内容不可见,请联系管理员开通权限。
2、词槽抽取方法
内容不可见,请联系管理员开通权限。
3、正则匹配提取实体
内容不可见,请联系管理员开通权限。
现在,用正则的方式,搞定了实体的抽取,虽然这个方法看上去有点死板,但比用模型做的准确率高,用模型抽取的方法,在后面的项目中,再给大家介绍。下节课,还需要完成关系和属性的抽取。
本文链接:http://ichenhua.cn/edu/note/598
版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!