第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

BeautifulSoup查看结构

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

把html转换成字符串,提取字符串中的内容

第二章:关键词与文章相似度

中文分词介绍

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

jieba分词

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

自定义词典与词性

第二章:关键词与文章相似度

当创新办和云计算识别不出来时,外加字典

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

当不知道往字典中加入新词设置多大频率时,可以参考suggest,tag是词性的意思

第二章:关键词与文章相似度

删除词

第二章:关键词与文章相似度

第二章:关键词与文章相似度

关键词的提取方法

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

jieba提取关键词

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

自定义idf文件的预测

第二章:关键词与文章相似度

第二章:关键词与文章相似度

jieba中使用textrank提取关键词

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

文本VSM的表示方法

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

EXCEPT是要删除的词,POS_include是要保留的词性

第二章:关键词与文章相似度

第二章:关键词与文章相似度

借助“ ”.join把unicode转换为字符串

第二章:关键词与文章相似度

排除频率为1的词(7000变为3000)

第二章:关键词与文章相似度

输出前20个频率最高的词

第二章:关键词与文章相似度

将词转换为id值

第二章:关键词与文章相似度

文本相似性计算

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

字典保存与加载

第二章:关键词与文章相似度

第二章:关键词与文章相似度

加载上面保存的语料

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

第二章:关键词与文章相似度

计算出相似的文本

第二章:关键词与文章相似度