源码之家

  • 首页
  • 文章
  • 问答
  • 下载
您的位置: 首页  >  文章  >  中文词频统计

中文词频统计

分类: 文章 • 2025-04-12 17:03:22
import jieba

file=open('text','r',encoding = 'utf-8')

wordList=list(jieba.cut(file.read()))
wordDict={}
for word in wordList:
    if(len(word)==1):
        continue
    wordDict[word]= wordList.count(word)

wordListSort=sorted(wordDict.items(),key=lambda d: d[1],reverse=True)

for i in range(20):
    if i>= len(wordListSort):
        break
    print(wordListSort[i])

  中文词频统计

相关推荐

  • 机器学习----统计学习方法-3(手写稿算法总结)
  • mindjet mindmanager2021 中文版下载注册**安装教程
  • 统计学习方法c++实现之二 k近邻算法
  • 李航统计学习-adaboost算法
  • ApiPost适合国人使用的(中文版Postman)
  • 修复关于DxO Nik Collection 2.0.8在Photoshop 2020不能显示中文问题
  • Nik Collection 2 by DxO for Mac 2019 中文破姐版下载 – 强大的图片滤镜插件合集
  • 牛逼,超轻量级中文 OCR,你值得拥有
  • 统计自然语言处理书籍阅读心得四
  • 统计自然语言处理书籍阅读心得三
  • 信息检索与利用(第三版)第五章 信息法与综合性信息检索
  • 天津一商场还原80、90年代家庭过年场景
    网站免责声明 网站地图 最新文章 用户隐私 版权申明
本站所有数据收集于网络,如果侵犯到您的权益,请联系网站进行下架处理。   

Copyright © 2018-2021   Powered By 源码之家    备案号:   粤ICP备20058927号