python词云图_python制作词云图

作者：hongxiaochen8846_792 | 来源：互联网 | 2023-05-29 14:14

接python爬取京东评论，在这篇文章的基础上进行词频分析。首先我们把之前爬取的10页评论保存到文本文件，importjiebaimportwordc

接python爬取京东评论&＃xff0c;在这篇文章的基础上进行词频分析。

首先我们把之前爬取的10页评论保存到文本文件&＃xff0c;

import jieba import wordcloud for page in range(0,10&＃43;1):header &＃61; {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36"}url &＃61; &＃39;https://club.jd.com/comment/productPageComments.action?callback&＃61;fetchJSON_comment98&productId&＃61;5225346&score&＃61;0&sortType&＃61;5&page&＃61;{}&pageSize&＃61;10&isShadowSku&＃61;0&rid&＃61;0&fold&＃61;1&＃39;.format(page)response &＃61; requests.get(url, headers&＃61;header)data &＃61; response.textjd &＃61; json.loads(data.lstrip(&＃39;fetchJSON_comment98vv12345(&＃39;).rstrip(&＃39;);&＃39;))data_list &＃61; jd[&＃39;comments&＃39;]for data in data_list:content &＃61; data[&＃39;content&＃39;]# print(content)with open(&＃39;ci.txt&＃39;,&＃39;a&＃43;&＃39;) as f:f.write(content &＃43; &＃39;n&＃39;)

接下来&＃xff0c;我们将对爬取下来的文本进行读取&＃xff0c;因为我们对于评论还需要做一些清理&＃xff0c;将一些介词或者感叹词删掉&＃xff0c;在这里先准备一个stopword的文本文件&＃xff0c;可在里面添加你认为不重要的词汇。

with open(&＃39;ci.txt&＃39;) as f,open("stopword.txt") as f2:stopwords &＃61; f2.read()content &＃61; f.read()wordlist &＃61; jieba.cut(content)words &＃61; []for word in wordlist:if len(word)>1 and word not in stopwords:words.append(word)wc &＃61; wordcloud.WordCloud(width&＃61;1000, font_path&＃61;&＃39;simfang.ttf&＃39;,height&＃61;800)#设定词云画的大小字体&＃xff0c;一定要设定字体&＃xff0c;否则中文显示不出来wc.generate(&＃39; &＃39;.join(words))wc.to_file(r&＃39;C:UsersAdministratorDesktoppython项目爬虫京东评论siyun.png&＃39;)

根据这张图&＃xff0c;我们发现这款电脑还是很受大家欢迎的&＃xff0c;主要包括运行速度&＃xff0c;系统、屏幕、散热等。感觉也是很简单就能制作一些词云分析。

当然&＃xff0c;我们还可以将背景图换掉。

from PIL import Image import numpy as np img &＃61; Image.open(r&＃39;C:UsersAdministratorDesktop图片京东129.jpg&＃39;) resized &＃61; np.array(img)wc_1 &＃61; wordcloud.WordCloud(background_color&＃61;&＃39;white&＃39;,width&＃61;1000,height&＃61;800,mask&＃61;resized,font_path&＃61;&＃39;simfang.ttf&＃39; ) wc_1.generate_from_text(&＃39; &＃39;.join(words)) wc_1.to_file(r&＃39;C:UsersAdministratorDesktoppython项目爬虫京东评论siyun1.png&＃39;)

好了&＃xff0c;简单的词云图就产生啦&＃xff0c;大家可以试一试&＃xff0c;非常简单。

推荐阅读

list
Python瓦片图下载、合并、绘图、标记的代码示例

本文提供了Python瓦片图下载、合并、绘图、标记的代码示例，包括下载代码、多线程下载、图像处理等功能。通过参考geoserver，使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法，供读者参考使用。 ... [详细]

蜡笔小新 2023-12-13 12:14:55
split
Scrapy 爬取图片

1.创建Scrapy项目scrapystartprojectCrawlMeiziTuscrapygenspiderMeiziTuSpiderhttps:movie.douban.c ... [详细]

蜡笔小新 2023-10-14 15:02:27
list
javascript – 概述在Firefox上无法正常工作

我试图提出一些自定义大纲,以达到一些Web可访问性建议.但我不能用Firefox制作.这就是它在Chrome上的外观：而那个图标实际上是一个锚点.在Firefox上,它只概述了整个 ... [详细]

蜡笔小新 2023-12-14 10:20:38
io
使用 Ubuntu 中的 Python 获取浏览器历史记录

使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]

蜡笔小新 2023-12-14 08:57:59
io
使用正则表达式爬取36Kr网站首页新闻的操作步骤和代码示例

本文介绍了使用正则表达式来爬取36Kr网站首页所有新闻的操作步骤和代码示例。通过访问网站、查找关键词、编写代码等步骤，可以获取到网站首页的新闻数据。代码示例使用Python编写，并使用正则表达式来提取所需的数据。详细的操作步骤和代码示例可以参考本文内容。 ... [详细]

蜡笔小新 2023-12-12 19:16:21
install
网页播放视频的三种实现方式

本文介绍了网页播放视频的三种实现方式，分别是使用html5的video标签、使用flash来播放以及使用object标签。其中，推荐使用html5的video标签来简单播放视频，但有些老的浏览器不支持html5。另外，还可以使用flash来播放视频，需要使用object标签。 ... [详细]

蜡笔小新 2023-12-10 13:24:30
io
idaas是什么意思,云盾idaas平台

寻求更强大的身份和访问管理（IAM）平台的企业正在转向云，并接受身份即服务（IDaaS）的灵活性。要为IAM选择正确的场外解决方案，业务管理人员和IT专业人员必须在实施之前评估安全 ... [详细]

蜡笔小新 2023-10-17 17:23:44
io
详解 Python 的二元算术运算，为什么说减法只是语法糖？[Python常见问题]

原题|UnravellingbinaryarithmeticoperationsinPython作者|BrettCannon译者|豌豆花下猫（“Python猫 ... [详细]

蜡笔小新 2023-10-17 15:28:24
io
FIN7后门工具伪装成白帽工具进行传播

fin7,后门,工具,伪装,成,白, ... [详细]

蜡笔小新 2023-10-17 15:15:23
io
Python爬虫_HTTP标准

文章目录简介HTTP请求过程HTTP状态码含义HTTP头部信息Cookie状态管理HTTP请求方式简介HTTP协议（超文本传输协议）是用于从WWW服务 ... [详细]

蜡笔小新 2023-10-15 14:59:43
io
微信小程序打开红包的css_【微信小程序】——wxss引用外部CSS文件及iconfont

小程序引入外部文件的方式是：import**.wxss;因为业务需要，正在开发的小程序中需要使用iconfont，很容易想到了H5的引 ... [详细]

蜡笔小新 2023-10-13 13:30:45
io
发现一个好看的手机壁纸网站，撸代码的手已经饥渴难耐了

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。最近有同学的爬虫代码出了bug，给问我怎么改于 ... [详细]

蜡笔小新 2023-10-13 11:57:49
install
开发笔记:软件测试知识点之数据库压力测试方法小结

篇首语：本文由编程笔记#小编为大家整理，主要介绍了软件测试知识点之数据库压力测试方法小结相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-10 20:29:19
io
CSS背景位置y | backgroundpositiony

css,背景,位置,y,background, ... [详细]

蜡笔小新 2023-10-16 16:28:38
install
爬虫05 /scrapy框架

目录爬虫06scrapy框架1.scrapy概述安装2.基本使用3.全栈数据的爬取4.五大核心组件对象5.适当提升scrapy爬取数据的效率6.请求传参爬虫06scrapy框架1. ... [详细]

蜡笔小新 2023-10-13 22:01:54

hongxiaochen8846_792

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章