全球10大终极数据库-mysql教程

作者：wqp2012 | 来源：互联网 | 2017-05-12 15:45

导读：看了上篇的回复评论，有朋友说自家电脑上的影片都是TB级的。一般来说，明智的管理员是不大可能把视频和图片之类的文件保存在数据库中的。5.Sprint斯普林特Sprint是全球最大的通信公司之一，向5300万客户提供服务。在和Nextel合并之前，提供本地和

导读：看了上篇的回复评论，有朋友说自家电脑上的影片都是TB级的。一般来说，明智的管理员是不大可能把视频和图片之类的文件保存在数据库中的。 5. Sprint 斯普林特 Sprint是全球最大的通信公司之一，向5300万客户提供服务。在和Nextel合并之前，提供本地和

　　导读：看了上篇的回复评论，有朋友说自家电脑上的影片都是TB级的。一般来说，明智的管理员是不大可能把视频和图片之类的文件保存在数据库中的。

　　5. Sprint 斯普林特

　　Sprint是全球最大的通信公司之一，向5300万客户提供服务。在和Nextel合并之前，提供本地和长途通信服务。（Sprint Nextel公司现已是全美第3大通信公司，仅次于Verizon和AT&T。）

　　像Sprint这样的大型通信公司，均有庞大的数据库，以追踪客户呼叫请求。Sprint的数据库每天要处理多达3.65亿次呼叫记录。其数据库已扩展到2.85万亿行。在顶峰期间，每秒有7万次呼叫详细记录新增到数据库中。

　　 Sprint数据库概括：

1.数据库有2.85万亿行；
2.每日平均处理3.65亿个呼叫详细记录；
3.顶峰期间，每秒插入7万次呼叫详细记录。

　　 4. Google

　　尽管目前外界没有太多关于Google的数据库真实大小的信息（Google一直能严守信息，这让诺克斯堡军事基地情何以堪。），但我们已知道Google所收集信息的数量和种类。

　　编者注：文中提到的诺克斯堡军事基地，是美国国库黄金储备地之一（还有一个是西点，至于纽约联邦储备银行的地下金库，主要是存放外国的黄金。）。该基地许多地方可以随便开车进入，惟独金库用铁丝网拦住，外人不得入内。故原文作者这样说。

　　 Google平均每天处理9100万次查询（Google的处理海量请求的能力是基于其庞大且强大的数据中心），这将近占整个互联网每日查询总量的50%。Google把用户的每一次搜索保存在数据库中。所以，Google平均一年要保存33万亿条查询记录。根据Google数据的结构类型，一年的查询总量将折合成数百TB。

　　除了查询记录，Google还收集用户的个人信息。（怎么收集？）Google把用户的查询请求和用户电脑上COOKIE保留的信息整合到一起，创建虚拟的个人信息。

　　尤为重要的是，除了搜索，Google帝国的疆土还在不断扩大，现有疆土已有数字媒体（Google视频和YouTube）、广告（GoogleAds）和邮箱等。归根结底，Google的疆土越大，其数据库处理的信息量就越大。就互联网范围内的数据库而言，Google是No 1。

　　 Google数据库概括：

1.平均每天9100万查询请求；
2.查询数量占所有互联网查询量的50%；
3.不计其数的用户虚拟资料。

　　 3. AT&T 美国电话电报公司

　　和Sprint一样，美国的老牌通信公司AT&T的数据库也能进入排名。从结构上来说，AT&T的最大数据库是百里挑一的，因为它有2个重要“头衔”，总量最大的独立数据库（312TB）和行数第二大的独立数据库（1.9万亿行，这个数据库是处理呼叫记录的）。

　　1.9万亿条呼叫记录，包括了主叫和被叫号码、呼叫时间和通话时长以及其他各种账单目录信息。AT&T的工作做得非常细致，他们业保存了10年前的呼叫信息。要知道，10年前可没有保存数百TB级数据的技术。（或者说技术还不成熟。）

　　 AT&T数据库概括：

1.信息量为323TB；
2. 1.9万亿的通话记录。

　　 2.美国国家能源研究科学计算中心（简称NERSC）

　　第二大的数据库应属加州奥克兰的NERSC。NERSC由“劳伦斯伯克利能源实验室”和“美国能源部”共同运作。它数据库保存的信息包括了原子能研究、高能物理实验和早期宇宙模拟等数据。如果想看宇宙过去的模样，启动NERSC的超级计算机就可以观看“大爆炸”时期的宇宙形态。

　　编者注：NERSC有超级计算机群，其中最大的名为“富兰克林”。2009年11月，全球超超级计算机Top500排行榜中，“富兰克林”位列15。

　　 NERSC数据库由2000多名计算机科学家操作和维护，其数据量高达2.8PB。（注：1 PB = 1024 TB；1 TB = 1024 GB；）

　　 NERSC数据库概括：

1.信息量高达2.8PB；
2.由2000多名计算机科学家共同运作；

　　 1.世界气候数据中心（WDCC）

　　如果你有一台价值3500万欧元的超级计算机，你会把它用来做什么？炒股？搭建自己的“因特网”？WDCC就有一台这样的机器，又逢全球变暖，正好用它来做气候研究。WDCC由马克思·普朗克气象研究院和德国气候计算机中心共同运作，其数据库是全球最大的。

　　WDCC有220TB的网络数据，包括气候研究、预测气候变化和110TB（24500张DVD）的气候模拟数据。尤为重要的是，它还有保存在磁带上的6PB的其他信息。你会问，这6PB的数据有多大呢？这个数据是全美所有学术研究图书馆内容总和的3倍。

　　 WDCC数据库概括：

1. 220TB的网络数据：
2. 6PB的其他数据。

　　 编者后话

　　对于这份原文作者整理的这份列表，相信有朋友会有疑惑，这能称上是“全球10大终极数据库”么？我也有此疑问，但我对Google、AT&T、NERSC和WDCC可以进入排名没有疑问。我想，既然美国的第三通信公司Sprint能进入，那国内的同行企业的数据库为什么没能上榜呢？按道理来说，有着庞大人口/用户基数的，应该能入围的。或许有这种可能：虽然美国通信企业的用户数量没法和国内的同行比，但他们保存的通话记录比国内更长，故数据库更庞大。

　　其实本文恰当的标题应该是“全美10大终极数据库”。并且原文作者还把Facebook漏掉了。Facebook这么庞大的活跃用户群（用户总量已超过5亿），看下面3个数据：（数据来源参考）

1.每月处理超过250亿条的信息内容（包括用户状态更新，评论等）；
2. Facebook图片总量已有200亿张（其实共有800百张，因为每张图片按4种分辨率保存）；
3.每个月有超过30亿的图片上传到Facebook。

　　主要看第一条数据（图片不会保存在数据库中的），每月有250亿条，Facebook已运作这么多年了，数据库中应该存有5000亿条信息（保守数字），假设平均每条信息10B，则共约为50TB。

　　总而言之，如果要算数据库总量大小，Facebook能进入这个列表。如果你还有其他观点，不妨在评论中和大家一起分享。

　　本文来源：伯乐在线- 职场博客
http://www.jobbole.com/entry.php/245

　　参考来源：Wikipedia 和 Topstrange

推荐阅读

io
大数据时代的机器学习：人工特征工程与线性模型的局限

本文探讨了在大数据背景下，人工特征工程与线性模型的应用及其局限性。随着数据量的激增和技术的进步，传统的特征工程方法面临挑战，文章提出了未来发展的可能方向。 ... [详细]

蜡笔小新 2024-12-07 11:58:58
input
图像分类算法的优化策略与实践

本文探讨了《Bag of Tricks for Image Classification with Convolutional Neural Networks》论文中的多项技术，旨在通过具体实例和实验验证，提高卷积神经网络在图像分类任务中的性能。文章详细介绍了从模型训练加速、网络结构调整到训练参数优化等多个方面的改进方法。 ... [详细]

蜡笔小新 2024-12-09 16:01:40
io
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
io
Installing the MongoDB PHP Driver on XAMPP for macOS

This guide provides a comprehensive step-by-step approach to successfully installing the MongoDB PHP driver on XAMPP for macOS, ensuring a smooth and efficient setup process. ... [详细]

蜡笔小新 2024-12-27 19:58:25
perl
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
io
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
go
如何在PHPcms网站中添加广告

本文详细介绍了在PHPcms网站后台添加广告的方法，涵盖多种常见的广告形式，如百度广告和Google广告，并提供了相关设置的步骤。同时，文章还探讨了优化网站流量的SEO策略。 ... [详细]

蜡笔小新 2024-12-27 17:13:07
perl
开源软件：新时代的商业机遇与挑战

在哈佛大学商学院举行的Cyberposium大会上，专家们深入探讨了开源软件的崛起及其对企业市场的影响。会议指出，开源软件不仅为企业提供了新的增长机会，还促进了软件质量的提升和创新。 ... [详细]

蜡笔小新 2024-12-27 14:49:56
input
JavaScript前端开发中常用的四种继承方法详解

本文深入探讨了JavaScript中实现继承的四种常见方法，包括原型链继承、构造函数继承、组合继承和寄生组合继承。对于正在学习或从事Web前端开发的技术人员来说，理解这些继承模式对于提高代码质量和维护性至关重要。 ... [详细]

蜡笔小新 2024-12-18 11:08:28
rsa
2017年人工智能领域的十大里程碑事件回顾

随着2018年的临近，我们一同回顾过去一年中人工智能领域的重要进展。这一年，无论是政策层面的支持，还是技术上的突破，都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]

蜡笔小新 2024-12-16 17:59:16
io
jQuery Mobile 安全漏洞可能导致XSS攻击

近期，谷歌公司的一名安全工程师Eduardo Vela在jQuery Mobile框架中发现了一项可能引发跨站脚本攻击（XSS）的安全漏洞。此漏洞使得使用jQuery Mobile的所有网站面临潜在的安全威胁。 ... [详细]

蜡笔小新 2024-12-15 12:43:59
go
a16z 推出加密研究实验室

a16z 宣布成立全新的加密研究实验室，旨在推动加密技术和 Web3 领域的科学发展。 ... [详细]

蜡笔小新 2024-12-11 10:17:03
java
探索Python编程的价值与应用

本文探讨了学习Python的重要性和广泛的应用场景，从个人技能提升到职业发展的多个方面进行了详细解析。 ... [详细]

蜡笔小新 2024-12-09 12:45:30
io
ABT 钱包正式全球发布，引领数字身份自主新时代

2023年5月20日凌晨5:20（北京时间），由区块链技术和去中心化应用平台ArcBlock（区块基石）研发的ABT钱包移动应用程序，在苹果App Store和Google Play同步上线，标志着用户在数字世界中首次能够完全掌控自己的身份。 ... [详细]

蜡笔小新 2024-12-08 16:58:51
io
图像标签与以图搜图技术的应用与实践

本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用，涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]

蜡笔小新 2024-12-07 14:28:06

wqp2012

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章