上节课,给大家演示了项目的效果,总体来说还是不错的,接下来,就正式进入课程内容了。这节课主要给大家介绍的内容,是预设的意图类别和课程安排。

意图类别

所谓的意图类别,就是用户可以问的问题的类别,也可以理解为是产品需求。这些类别的定义,是结合用户需求,和我们能搜集到的数据,综合评估之后的结果,这一步一般都是由产品经理来完成。

疾病定义:过敏性鼻炎是一种什么病?
疾病病因:过敏性鼻炎一般是什么原因引起的?
疾病症状:感冒的常见症状有哪些?
症状查疾病:最近经常感觉头疼,可能得了什么病?
治疗方法:感冒了吃什么药好得快?
挂号科室:感冒了去医院挂什么科室的号?
预防:怎么预防过敏性鼻炎?
禁忌:高血压病人有什么忌口?
检查方案:怀疑得了流感,去医院需要做哪些检查?
治愈率:高血脂能治好吗?
并发症:高血压会引发哪些其他疾病?
适用症:阿莫西林能治那些病?

如果说大家想增加类别,首先要看图谱数据能不能满足,然后再去构造模型训练语料,重新训练模型即可。

课程内容

1、实体识别:复用《医疗命名实体识别项目》课程代码,会详细讲替换数据集的方法。

2、ChatGPT:开源数据集不能满足定制需求,魔法对抗魔法,自己生成意图识别数据集。

3、意图识别:复用《TextCNN新闻文本分类项目》课程代码,替换成自己生成的数据集。

4、Neo4j:复用《电影知识问答项目》Neo4j基础课程,补充Neo4j安装和数据批量导入方法。

5、模板解析:集成意图解析、实体识别、模板填充、数据查询功能。

6、前后端封装:复用《电影知识问答项目》前端基础课程,补充代码集成方法。

7、关系抽取:没用上,但可能是面试、答辩绕不开的话题,参考《CasRel关系抽取》课程。

专题课程

http://www.ichenhua.cn/edu/topic/nlp

这个课程的发布,反馈肯定会有好有坏。好的是集大成,把前面的零碎知识都串到了一起,知道前面的枯燥的任务有什么用了;不好的就是这个课程不够独立,引用了太多其他项目的内容。

从专业的角度回答这个问题,就是一句话:做人工智能,得一直往前走。前面还有太多值得我们学习和探索的知识,所以我没有时间,去重复前面讲过的内容,请大家原谅。

本文链接:http://ichenhua.cn/edu/note/630

版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!