TF-IDF项目 P6 封装TfidfModel模型处理类
经过前面的一系列铺垫,接下来就要开始做模型的封装了,其实封装的过程很简单,只需要把前面的面向过程的代码,封装成一个类即可。另外,语料库在进行TF-IDF计算之前,需要先进行jieba分词,这个上节课也定义好了一个分词函数,接下来的封装过程就很简单了。
代码示例
1、定义TF-IDF类
内容不可见,请联系管理员开通权限。
2、tqdm进度条
因为语料比较多,所以计算过程很慢,可以使用tqdm库加载一个进度条,了解处理进度。
内容不可见,请联系管理员开通权限。
3、调用测试
内容不可见,请联系管理员开通权限。
这节课的代码看上去很多,但有了前面的基础,封装的过程其实是很简单的。到目前为止,我们依然是在使用少量、简单的文本做测试,没有加载真正的语料库,所以下节课,就把真正的语料库加载进来。
本文链接:http://ichenhua.cn/edu/note/556
版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!