热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Python:使用nltk统计词频并绘制统计图

测试环境:macpython3.6.5安装pipinstallnltk代码示例#-*-coding:utf-8-*-fromnltkimportFreqDist

测试环境:
mac
python3.6.5

安装

pip install nltk

代码示例

# -*- coding: utf-8 -*-from nltk import FreqDist
from matplotlib import rcParams# matplotlib 设置中文字体
rcParams["font.family"] = "STHeiti"
rcParams["font.size"] = 8words = ["你好", "你好", "我好", "我还有"]freq = FreqDist(words)
print(freq.most_common(1)) # [('你好', 2)]
print(freq.freq("你好")) # 频率 0.5
print(freq["你好"]) # 次数 2freq.tabulate() # 频率分布表freq.plot() # 频率分布图

在这里插入图片描述


推荐阅读
author-avatar
留心6_136
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有