热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

腾讯QQ会保存从开始至今所有用户聊天记录吗?

今天在我的程序猿Q群里无意间讨论了这个问题,扎一想,这不太可能吧。理由是****使用腾讯QQ的人非常之多,几乎人手一个吧。在线聊天,斗图,视频,每秒得多少数据啊。这数据量太大了,因

今天在我的程序猿Q群里无意间讨论了这个问题,扎一想,这不太可能吧。理由是

****使用腾讯QQ的人非常之多,几乎人手一个吧。在线聊天,斗图,视频,每秒得多少数据啊。这数据量太大了,因此不可能的。****

因为本人也是IT人士,还有目前有一些大数据方面的积累,开始判断是有可能的。下面咱们让数据说话,以下一些数据来自于互联网,精准与否暂不在本次讨论范围内。以下分析我尽量让非专业人士看懂,但你必须有加减乘除的能力。

腾讯号称拥有9亿注册用户,我就当做真的了!腾讯自1998年11月11日创立,我们为了计算方便取整吧,且认为腾讯距今已经创立20年了。且假设这9亿用户从创建至今一直没有人数变化,且每天活跃,注册用户等于活跃用户,一切为了计算简单。每个人每天聊天5千字,一年365天不停歇。这个相当厉害了,韩寒说过一天写500字一年后都可以出20万字的小说了。那么我们就可以算出来,所有用户这20年里,聊天字数。

公式: 9亿用户x 一天5千字 x 365天 x 20年 = 总聊天字数
9亿x5000x365x20 = 328500000亿个字

好了,我说明一点,在计算机中,文字存储占用空间是非常小的。但是图片和视频的数据量一般很大,我们暂时不考虑图片和视频这些,只考虑聊天文字记录。那么在计算机中我们常常听到的内存卡64G的,这个G就是GB 。下面有个数据

1G的硬盘空间 大约存储汉字字数为 5亿个

这里没有考虑文件压缩算法,咱们为了方便计算。对了,我要说明一点腾讯开通会员,才可以手机,电脑同步聊天记录,所以证明聊天记录在服务端存储着呢。但是会员也不是能无限制的看20年前的聊天记录,目前支持的是能看到1个月内的囧 。所以这些数据不是以文件存储在离线硬盘上的。 这些估计是存储在在线硬盘里的囧(好想用专业术语比如Hadoop,NOSQL,集群)
我们假设聊天记录出现之后,会在当天合适的时间,比如凌晨三点变成文本存储在离线硬盘里,每天都这个操作,操作了20年。那么现在的硬盘空间至少多少呢。上面2个数据就算出来了。

328500000亿字 ÷ 5亿字/GB = 65700000GB

我们再普及一下硬盘存储的单位换算

1024GB = 1TB
1024TB = 1PB
1024PB = 1EB

因此可以用PB或者EB来表示需要的空间大小是

65700000 / 1024 = 64160TB
64160 / 1024 = 63PB
63 / 1024 = 0.06EB

目前据我所知,使用PB做为存储是主流,当然想谷歌,脸书,腾讯,百度,阿里,估计用上EB级别的存储。
好了,我们接着算,一共是63PB,就可以存储20年9亿活跃用户的聊天文字记录了。
那么存储设备多少钱呢,我们知道一般1TB硬盘400人民币。但是服务器的存储硬盘盒我们平常使用的不一样呢,会贵一些,所以1PB的存储设备市场价是50万美元,按人民币当天汇率 6.8算。

63 x 50 = 3150 万美元
3150 x 6.8 = 21420万人民币 ~ 2.2亿人民币

所以单算存储设备的钱,不加上电费,人工成本,场地费,维护费,税等等 最终结论是

存储腾讯QQ从1998年到现在9亿人每天5千字的文字聊天记录需要63PB硬盘存储空间,越等于2.2亿人民币。
对于腾讯这个市值26425亿港元(约3389亿美元)的庞然大物来讲,这些设备钱只是九牛一毛了。所以今后再有人问你,腾讯会保存所有聊天记录吗? 会,一定会,必须会。


推荐阅读
  • 本文将详细介绍如何在ThinkPHP6框架中实现多数据库的部署,包括读写分离的策略,以及如何通过负载均衡和MySQL同步技术优化数据库性能。 ... [详细]
  • 深入解析BookKeeper的设计与应用场景
    本文介绍了由Yahoo在2009年开发并于2011年开源的BookKeeper技术。BookKeeper是一种高效且可靠的日志流存储解决方案,广泛应用于需要高性能和强数据持久性的场景。 ... [详细]
  • 本文探讨了Hive作业中Map任务数量的确定方式,主要涉及HiveInputFormat和CombineHiveInputFormat两种InputFormat的分片计算逻辑。通过调整相关参数,可以有效控制Map任务的数量,进而优化Hive作业的性能。 ... [详细]
  • 请看|间隔时间_Postgresql 主从复制 ... [详细]
  • Eclipse 中 JSP 开发环境配置指南
    本文详细介绍了如何在 Eclipse 集成开发环境中配置 JSP 运行环境,包括必要的软件下载、Tomcat 服务器的配置以及常见问题的解决方法。 ... [详细]
  • 应对.avast后缀勒索病毒:全面指南
    本文详细介绍了.avast后缀勒索病毒的特性、感染途径、恢复方法及预防措施,旨在帮助用户有效应对这一威胁。 ... [详细]
  • 解决vCenter vSphere HA初始化失败的问题
    本文探讨了在集群中遇到的所有vSphere HA主机状态显示‘无法正确安装或配置vSphere HA代理’错误的情况,并详细介绍了排查与解决步骤,包括检查HA初始化错误及安装HA代理的常见故障排除方法。 ... [详细]
  • 本文探讨了大型服务端开发过程中常见的几个误区,包括异步任务处理不当、日志同步模式使用、网络操作未设置超时、缓存命中率及响应时间未统计、单一缓存模式、分布式缓存加锁不当以及团队管理上的误区,旨在帮助开发者避免这些常见错误。 ... [详细]
  • 本文深入探讨了JavaScript中实现继承的四种常见方法,包括原型链继承、构造函数继承、组合继承和寄生组合继承。对于正在学习或从事Web前端开发的技术人员来说,理解这些继承模式对于提高代码质量和维护性至关重要。 ... [详细]
  • 本文探讨了如何通过WebBrowser控件在用户点击输入框时自动显示图片验证码。该过程可能涉及JavaScript事件的触发与响应。 ... [详细]
  • 树莓派摄像头配置与应用指南
    本文详细介绍了如何在树莓派上配置和使用摄像头,包括启用摄像头接口、简单的图片和视频捕捉方法以及如何通过网络实时传输视频流。 ... [详细]
  • 理解文档对象模型(DOM)
    本文介绍了文档对象模型(DOM)的基本概念,包括其作为HTML文档的节点树结构,以及如何通过JavaScript操作DOM来实现网页的动态交互。 ... [详细]
  • 深入解析Android中的SQLite数据库使用
    本文详细介绍了如何在Android应用中使用SQLite数据库进行数据存储。通过自定义类继承SQLiteOpenHelper,实现数据库的创建与版本管理,并提供了具体的学生信息管理示例代码。 ... [详细]
  • 本文详细介绍如何在IntelliJ IDEA 14中打包Android应用APK文件,并提供查询SHA1值的具体步骤。 ... [详细]
  • 本文介绍如何在Android应用中通过调用系统图库来选择并获取图片,以供进一步处理或展示。 ... [详细]
author-avatar
李国龙度_476
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有