经过前面的一系列铺垫,接下来就要开始做模型的封装了,其实封装的过程很简单,只需要把前面的面向过程的代码,封装成一个类即可。另外,语料库在进行TF-IDF计算之前,需要先进行jieba分词,这个上节课也定义好了一个分词函数,接下来的封装过程就很简单了。

代码示例

1、定义TF-IDF类

内容不可见,请联系管理员开通权限。

2、tqdm进度条

因为语料比较多,所以计算过程很慢,可以使用tqdm库加载一个进度条,了解处理进度。

内容不可见,请联系管理员开通权限。

3、调用测试

内容不可见,请联系管理员开通权限。

这节课的代码看上去很多,但有了前面的基础,封装的过程其实是很简单的。到目前为止,我们依然是在使用少量、简单的文本做测试,没有加载真正的语料库,所以下节课,就把真正的语料库加载进来。

本文链接:http://ichenhua.cn/edu/note/556

版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!