热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

腾讯QQ会保存从开始至今所有用户聊天记录吗?

今天在我的程序猿Q群里无意间讨论了这个问题,扎一想,这不太可能吧。理由是****使用腾讯QQ的人非常之多,几乎人手一个吧。在线聊天,斗图,视频,每秒得多少数据啊。这数据量太大了,因

今天在我的程序猿Q群里无意间讨论了这个问题,扎一想,这不太可能吧。理由是

****使用腾讯QQ的人非常之多,几乎人手一个吧。在线聊天,斗图,视频,每秒得多少数据啊。这数据量太大了,因此不可能的。****

因为本人也是IT人士,还有目前有一些大数据方面的积累,开始判断是有可能的。下面咱们让数据说话,以下一些数据来自于互联网,精准与否暂不在本次讨论范围内。以下分析我尽量让非专业人士看懂,但你必须有加减乘除的能力。

腾讯号称拥有9亿注册用户,我就当做真的了!腾讯自1998年11月11日创立,我们为了计算方便取整吧,且认为腾讯距今已经创立20年了。且假设这9亿用户从创建至今一直没有人数变化,且每天活跃,注册用户等于活跃用户,一切为了计算简单。每个人每天聊天5千字,一年365天不停歇。这个相当厉害了,韩寒说过一天写500字一年后都可以出20万字的小说了。那么我们就可以算出来,所有用户这20年里,聊天字数。

公式: 9亿用户x 一天5千字 x 365天 x 20年 = 总聊天字数
9亿x5000x365x20 = 328500000亿个字

好了,我说明一点,在计算机中,文字存储占用空间是非常小的。但是图片和视频的数据量一般很大,我们暂时不考虑图片和视频这些,只考虑聊天文字记录。那么在计算机中我们常常听到的内存卡64G的,这个G就是GB 。下面有个数据

1G的硬盘空间 大约存储汉字字数为 5亿个

这里没有考虑文件压缩算法,咱们为了方便计算。对了,我要说明一点腾讯开通会员,才可以手机,电脑同步聊天记录,所以证明聊天记录在服务端存储着呢。但是会员也不是能无限制的看20年前的聊天记录,目前支持的是能看到1个月内的囧 。所以这些数据不是以文件存储在离线硬盘上的。 这些估计是存储在在线硬盘里的囧(好想用专业术语比如Hadoop,NOSQL,集群)
我们假设聊天记录出现之后,会在当天合适的时间,比如凌晨三点变成文本存储在离线硬盘里,每天都这个操作,操作了20年。那么现在的硬盘空间至少多少呢。上面2个数据就算出来了。

328500000亿字 ÷ 5亿字/GB = 65700000GB

我们再普及一下硬盘存储的单位换算

1024GB = 1TB
1024TB = 1PB
1024PB = 1EB

因此可以用PB或者EB来表示需要的空间大小是

65700000 / 1024 = 64160TB
64160 / 1024 = 63PB
63 / 1024 = 0.06EB

目前据我所知,使用PB做为存储是主流,当然想谷歌,脸书,腾讯,百度,阿里,估计用上EB级别的存储。
好了,我们接着算,一共是63PB,就可以存储20年9亿活跃用户的聊天文字记录了。
那么存储设备多少钱呢,我们知道一般1TB硬盘400人民币。但是服务器的存储硬盘盒我们平常使用的不一样呢,会贵一些,所以1PB的存储设备市场价是50万美元,按人民币当天汇率 6.8算。

63 x 50 = 3150 万美元
3150 x 6.8 = 21420万人民币 ~ 2.2亿人民币

所以单算存储设备的钱,不加上电费,人工成本,场地费,维护费,税等等 最终结论是

存储腾讯QQ从1998年到现在9亿人每天5千字的文字聊天记录需要63PB硬盘存储空间,越等于2.2亿人民币。
对于腾讯这个市值26425亿港元(约3389亿美元)的庞然大物来讲,这些设备钱只是九牛一毛了。所以今后再有人问你,腾讯会保存所有聊天记录吗? 会,一定会,必须会。


推荐阅读
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • Python自动化处理:从Word文档提取内容并生成带水印的PDF
    本文介绍如何利用Python实现从特定网站下载Word文档,去除水印并添加自定义水印,最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]
  • 360SRC安全应急响应:从漏洞提交到修复的全过程
    本文详细介绍了360SRC平台处理一起关键安全事件的过程,涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例,展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]
  • 2023年京东Android面试真题解析与经验分享
    本文由一位拥有6年Android开发经验的工程师撰写,详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]
  • 深入解析Android自定义View面试题
    本文探讨了Android Launcher开发中自定义View的重要性,并通过一道经典的面试题,帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识,还提供了实际操作建议。 ... [详细]
  • 本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射,详细解释了两者的创建、加载及删除操作,并提供了查看表详细信息的方法。通过对比这两种表类型,帮助读者理解如何更好地管理和保护数据。 ... [详细]
  • 深入理解Cookie与Session会话管理
    本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息,以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制,解释其原理及应用场景。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 本文深入探讨了Linux系统中网卡绑定(bonding)的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡,实现网络冗余、带宽聚合和负载均衡,在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]
  • 本文介绍如何使用 Python 提取和替换 .docx 文件中的图片。.docx 文件本质上是压缩文件,通过解压可以访问其中的图片资源。此外,我们还将探讨使用第三方库 docx 的方法来简化这一过程。 ... [详细]
  • 网络运维工程师负责确保企业IT基础设施的稳定运行,保障业务连续性和数据安全。他们需要具备多种技能,包括搭建和维护网络环境、监控系统性能、处理突发事件等。本文将探讨网络运维工程师的职业前景及其平均薪酬水平。 ... [详细]
  • 从零开始构建完整手机站:Vue CLI 3 实战指南(第一部分)
    本系列教程将引导您使用 Vue CLI 3 构建一个功能齐全的移动应用。我们将深入探讨项目中涉及的每一个知识点,并确保这些内容与实际工作中的需求紧密结合。 ... [详细]
  • Linux 系统启动故障排除指南:MBR 和 GRUB 问题
    本文详细介绍了 Linux 系统启动过程中常见的 MBR 扇区和 GRUB 引导程序故障及其解决方案,涵盖从备份、模拟故障到恢复的具体步骤。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
author-avatar
李国龙度_476
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有