热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python爬取评论_Python爬取腾讯视频评论

原标题:Python爬取腾讯视频评论需要获取的数据:某部电影的评论数据,实现自动加载。首先可以发现腾讯视频中某个视频的评论࿰

原标题:Python爬取腾讯视频评论

需要获取的数据:某部电影的评论数据,实现自动加载。

首先可以发现腾讯视频中某个视频的评论,在下面的图片中,如果点击”查看更多评论”,网页地址并无变化,与上面提到的糗事百科中的页码变化不同。而且通过查看源代码,只能看到部分评论。即评论信息是动态加载的,那么该如何爬取多页的评论数据信息?

1df781f7b5524ff29cf41bd3909cc8e1.png

第一步,分析腾讯视频评论网址变化规律。点击”查看更多评论”,同时打开Fiddler,第一条信息的TextView中,TextView中可以看到对应的content内容是unicode编码,刚好对应的是某条评论的内容。

解码出来可以看到对应评论内容。

6065add91f7748cb889d9ec051a1364b.png

将第一条信息的网址复制出来进行分析,观察其中的规律。下图是两个紧连着的不同评论的url地址,如下图,可以发现只有cursor字段发生变化,只要得到cursor,那么评论的地址就可以轻松获得。如何找到cursor值?

3b4b1331ab84473c96fec2c3d218caa6.png

第二步,查找网址中变化的cursor字段值。从上面的第一条评论信息里寻找,发现恰好在last字段值与后一条评论的cursor值相同。即表示cursor的值是迭代方式生成的,每条评论的cursor信息在其上一条评论的数据包中寻找即可。

c4b05a9de6f8456cae5580c07654734b.png

第三步,完整代码

a.腾讯视频评论爬虫:获取”深度解读”评论内容(单页评论爬虫)

317cd5c2ccfc4caaa1609666754670b7.png

.b.腾讯视频评论爬虫:获取”深度解读”评论内容(自动切换下一页评论的爬虫)、

责任编辑:



推荐阅读
author-avatar
要去治病啊8_r
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有