热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

使用python获取群聊信息并分析群聊成员

在之前用python的itchat玩了一波微信好友以后,最近突然想继续玩一下微信群聊。说做就做,就以公司的微信群来一波操作吧。代码主要实现的功能主要是,获取微信群聊,获取群聊中的用

在之前用python的itchat玩了一波微信好友以后,最近突然想继续玩一下微信群聊。说做就做,就以公司的微信群来一波操作吧。

代码主要实现的功能主要是,获取微信群聊,获取群聊中的用户信息,以及根据这些信息制作的柱状图,饼图和词云。

代码在最后。先来看一波结果,首先是单位微信群的性别统计图(忽视我的视觉审美):

《使用python获取群聊信息并分析群聊成员》

这未知是个什么鬼啊。。。好吧,因为性别代号1为男,2为女,最后发现还有0存在,所以就弄成未知了,希望这些同事知道了不要打我。。。。

然后是分别对男同事和女同事的个性签名制作了词云,女同事的画风是这样的:

《使用python获取群聊信息并分析群聊成员》

看起来很注重健康,也很喜欢旅行,想要的是理想,接下来是男同志的了:

《使用python获取群聊信息并分析群聊成员》

卧槽,这画风啥意思啊!!!!!怎么到了我们男同胞就变成了自己!努力!人生!还要后天下之乐而乐。。。好沉重的话题,大家的觉悟都很高,不过貌似也对哈。

下面上场的就是一个很俗但是还蛮好看的微信昵称词云图了:

《使用python获取群聊信息并分析群聊成员》

虽然图其实很炫酷,但是也不能泄露同事的隐私噻,所以呢我就把图修了半天,无奈PS技能没加点,只好手动打了码。只留下这个酷酷的与你无关

最后的这个图是位置统计图:

《使用python获取群聊信息并分析群聊成员》

公司竟然有这么多的北京大佬,牛皮牛皮。

代码就贴这儿了,如果大家有什么新需求,可以一起做啊。

#!/usr/bin/python
# coding: utf-8
import itchat
import os
import pandas as pd
import matplotlib.pyplot as plot
from wordcloud import WordCloud
from pyecharts import Bar, Page
import jieba
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
# 获取所有的群聊列表
def getRoomList():
roomslist = itchat.get_chatrooms()
return roomslist
#获取指定群聊的信息
def getRoomMsg(roomName):
itchat.dump_login_status()
myroom = itchat.search_chatrooms(name=roomName)
return myroom
#统计省份信息
def getProvinceCount(cityCount,countName):
indexs = []
counts = []
for index in cityCount.index:
indexs.append(index)
counts.append(cityCount[index])
page = Page()
labels = [indexs]
sizes = [counts]
attr = indexs
v1 = counts
bar = Bar(countName)
bar.add("地区分布", attr, v1, is_stack=True, is_label_show=True, is_datazoom_show=True,
is_random=True)
page.add(bar)
bar.show_config()
bar.render()
#制作性别统计图
def getSexCount(sexs,countName):
labels = [u'男', u'女', u'未知']
sizes = [sexs['男'], sexs['女'], sexs['未知']]
print sizes
colors = ['red', 'yellow', 'blue', 'green']
explode = (0, 0, 0)
patches, l_text, p_text = plot.pie(sizes, explode=explode, labels=labels, colors=colors,
labeldistance=1.1, autopct='%2.0f%%', shadow=False,
startangle=90, pctdistance=0.6)
for t in l_text:
t.set_size = 30
for t in p_text:
t.set_size = 20
plot.axis('equal')
plot.legend(loc='upper left', bbox_to_anchor=(-0.1, 1))
plot.rcParams['font.sans-serif'] = ['Microsoft YaHei']
plot.rcParams['axes.unicode_minus'] = False
plot.title(countName)
plot.grid()
plot.show()
#制作词云
def makeWorldCount(userName):
users = []
for user in userName:
users.append(user)
users = ','.join(users)
print users
fOnt= os.path.join(os.path.dirname(__file__), "DroidSansFallbackFull.ttf")
wordcloud = WordCloud(font_path=font,bilinear')
plot.axis("off")
plot.show()
#获取性别统计
def getSex(df_friends):
sex = df_friends['Sex'].replace({1: '男', 2: '女', 0: '未知'})
sexCount = sex.value_counts()
return sexCount
#男性个性签名统计
def analyMale(df_friends):
signature = df_friends[df_friends.Sex == 1]['Signature']
signature = signature.unique()
signature = "".join(signature)
wordlist_after_jieba = jieba.cut(signature, cut_all=True)
wl_space_split = " ".join(wordlist_after_jieba)
fOnt= os.path.join(os.path.dirname(__file__), "DroidSansFallbackFull.ttf")
wordcloud = WordCloud(font_path=font,max_words = 200, max_font_size=50,margin=2).generate(wl_space_split)
plot.figure()
plot.imshow(wordcloud, interpolation='bilinear')
plot.axis("off")
plot.show()
#女性个性签名统计
def analyFemale(df_friends):
signature = df_friends[df_friends.Sex == 2]['Signature']
signature = signature.unique()
signature = "".join(signature)
wordlist_after_jieba = jieba.cut(signature, cut_all=True)
wl_space_split = " ".join(wordlist_after_jieba)
fOnt= os.path.join(os.path.dirname(__file__), "DroidSansFallbackFull.ttf")
wordcloud = WordCloud(font_path=font,max_words = 200, max_font_size=50,margin=2).generate(wl_space_split)
plot.figure()
plot.imshow(wordcloud, interpolation='bilinear')
plot.axis("off")
plot.show()
def main():
itchat.auto_login(hotReload=True) #自动登陆
roomMsg = getRoomMsg(u'') #获取指定群聊的信息
gsq = itchat.update_chatroom(roomMsg[0]['UserName'], detailedMember=True)
df_friends = pd.DataFrame(gsq['MemberList']) #取出其中的用户信息并转为dataframe
# sexs = getSex(df_friends) #获取性别统计
# getSexCount(sexs,"公司性别统计图") #制作性别统计图,第一个参数为性别统计的结果,第二个参数为该图的名称
# city = df_friends['Province'] #取出省份信息
# City_count = city.value_counts()[:15]
# City_count = City_count[City_count.index != '']
# getProvinceCount(City_count,"位置统计图") #制作位置统计图,第一个参数为位置统计的结果,第二个参数为该图的名称
# makeWorldCount(df_friends['NickName']) #制作词云,传入用户昵称
# makeWorldCount(signature)
analyMale(df_friends)
if __name__=='__main__':
main()

 


推荐阅读
  • Java容器中的compareto方法排序原理解析
    本文从源码解析Java容器中的compareto方法的排序原理,讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点,回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录,展示了整个讲解过程。 ... [详细]
  • 本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期,包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时,还介绍了一段使用正则表达式的代码,可以支持中文日期和一些特殊的时间识别,例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
  • Spring源码解密之默认标签的解析方式分析
    本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断,区分默认命名空间和自定义命名空间,并采用不同的解析方式。其中,bean标签的解析最为复杂和重要。 ... [详细]
  • eclipse学习(第三章:ssh中的Hibernate)——11.Hibernate的缓存(2级缓存,get和load)
    本文介绍了eclipse学习中的第三章内容,主要讲解了ssh中的Hibernate的缓存,包括2级缓存和get方法、load方法的区别。文章还涉及了项目实践和相关知识点的讲解。 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • 开发笔记:实验7的文件读写操作
    本文介绍了使用C++的ofstream和ifstream类进行文件读写操作的方法,包括创建文件、写入文件和读取文件的过程。同时还介绍了如何判断文件是否成功打开和关闭文件的方法。通过本文的学习,读者可以了解如何在C++中进行文件读写操作。 ... [详细]
  • OpenMap教程4 – 图层概述
    本文介绍了OpenMap教程4中关于地图图层的内容,包括将ShapeLayer添加到MapBean中的方法,OpenMap支持的图层类型以及使用BufferedLayer创建图像的MapBean。此外,还介绍了Layer背景标志的作用和OMGraphicHandlerLayer的基础层类。 ... [详细]
  • Java太阳系小游戏分析和源码详解
    本文介绍了一个基于Java的太阳系小游戏的分析和源码详解。通过对面向对象的知识的学习和实践,作者实现了太阳系各行星绕太阳转的效果。文章详细介绍了游戏的设计思路和源码结构,包括工具类、常量、图片加载、面板等。通过这个小游戏的制作,读者可以巩固和应用所学的知识,如类的继承、方法的重载与重写、多态和封装等。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • 本文介绍了一个Java猜拳小游戏的代码,通过使用Scanner类获取用户输入的拳的数字,并随机生成计算机的拳,然后判断胜负。该游戏可以选择剪刀、石头、布三种拳,通过比较两者的拳来决定胜负。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 本文介绍了Swing组件的用法,重点讲解了图标接口的定义和创建方法。图标接口用来将图标与各种组件相关联,可以是简单的绘画或使用磁盘上的GIF格式图像。文章详细介绍了图标接口的属性和绘制方法,并给出了一个菱形图标的实现示例。该示例可以配置图标的尺寸、颜色和填充状态。 ... [详细]
  • Python使用Pillow包生成验证码图片的方法
    本文介绍了使用Python中的Pillow包生成验证码图片的方法。通过随机生成数字和符号,并添加干扰象素,生成一幅验证码图片。需要配置好Python环境,并安装Pillow库。代码实现包括导入Pillow包和随机模块,定义随机生成字母、数字和字体颜色的函数。 ... [详细]
author-avatar
晦涩的爱情嵌
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有