热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

对于大数据的发展,主要划分为哪几大阶段?

1.部署阶段2011—2013年,互联网公司开始实验大数据技术,推出了若干的Hadoop(一个开发和处理大规模数据的软优平台࿰

1.部署阶段

2011—2013年,互联网公司开始实验大数据技术,推出了若干的Hadoop(一个开发和处理大规模数据的软优平台)试点计划或者尝试了一些试点方案,由此出现了诸如“数据科学家”和“首席数据官”等此前并不存在的职位。他们做了很多努力,但是依然没有出现足够多的、可以展示的成果。此时,更多的公司对大数据技术持观望态度,它们寄希望于某个大型供应商可以提供一个一站式解决方案,比如IBM公司,但这种情况并没有出现。

2.生态体系正在成熟

当一部分大数据企业完成了融资,企业规模得到了扩大时,更重要的是它们从早期的失败中获得了宝贵的经验,已经可以提供成熟、经受过考验的产品。其中的佼佼者已经成功上市,比如2015年上市的Hortonworks公司;没上市的也已经获得上亿美元融资,在资金方面看起来不会显得那么单薄,比如Cloudera公司。

随着大数据领域的创业持续进行,公司的数量与日俱增,行业基本趋势也慢慢发生了变化,大数据业务的中心从基础设施(开发者和工程师)转移到了数据分析(数据科学家和分析师),甚至在应用方面已经初露端倪。

3.大数据基础设施持续创新

尽管大数据的重心已经转移,但是基础设施领域的创新仍然富有活力。2015年,ApacheSpark大热,这个利用了内存处理的开源框架受到了IBM、Cloudera等企业的拥护。ApacheSpark的出现解决了一些导致Hadoop采用放缓的关键问题:ApacheSpark数据分析更快,更容易编程,并且跟机器学习能够很好地搭配。

在数据库领域内,出现了很多新兴玩家,也出现了很多令人兴奋的技术进步,比如图形数据库的成熟、专门数据库的出现,再比如统计时序数据库InfluxDB。此外,数据仓库也在不断演变。

4.大数据分析与人工智能结合

大数据分析越来越关注利用人工智能来帮助分析大规模的数据。其实,有很大一部分人工智能在某种程度上来说是大数据的产物,深度学习概念在10年前提出,而其背后的算法在几十年前就诞生了,但它真正发挥出最大的潜能还是在应用到大数据之后。人工智能与大数据之间的关系非常紧密,它们似乎就是天生的一对搭档。

5.大数据应用的加速发展

在大数据核心基础设施的日啊战一一得到解决之后,大数据应用必将以飞快的速度构建起来。在企业内部,已经有足够多的工具来帮助跨多个核心职能的企业用户,比如销售和营销的大数据应用通过处理大规模的内外部数据就可以分析出哪些客户会购买、续约或者流失,并且这些分析结果都将实时得出。

这些大数据应用依托在最新的大数据技术基础上开发,客户无须部署底层大数据技术,即可利用大数据;而底层的技术已经是打包的,这是未来的一个趋势。另外,人工智能在应用层也将得到广泛应用,比如在安全领域用来对付黑客。

然而,随着大数据的深度发展,这个词可能会变得越来越冷。不是因为它过时或者不重要了,而是因为它将成为未来科技的血液,在我们看不到的地方发挥作用。对于技术层面的东西,这或许就是最好的命运归宿。

人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
数据时代,值得了解的十大数据发展趋势
http://www.duozhishidai.com/article-13959-1.html
发展大数据产业,需要明确四大重点方向
http://www.duozhishidai.com/article-2222-1.html
什么是大数据,中国大数据发展到了什么程度!
http://www.duozhishidai.com/article-935-1.html


多智时代-人工智能大数据学习入门网站|人工智能、大数据、物联网云计算的学习交流网站

多智时代-人工智能大数据学习入门网站|人工智能、大数据、云计算、物联网的学习服务的好平台

推荐阅读
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 本文详细介绍了Python编程语言的学习路径,涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划,帮助初学者快速掌握Python的核心技能。 ... [详细]
  • 国内BI工具迎战国际巨头Tableau,稳步崛起
    尽管商业智能(BI)工具在中国的普及程度尚不及国际市场,但近年来,随着本土企业的持续创新和市场推广,国内主流BI工具正逐渐崭露头角。面对国际品牌如Tableau的强大竞争,国内BI工具通过不断优化产品和技术,赢得了越来越多用户的认可。 ... [详细]
  • 本文详细分析了JSP(JavaServer Pages)技术的主要优点和缺点,帮助开发者更好地理解其适用场景及潜在挑战。JSP作为一种服务器端技术,广泛应用于Web开发中。 ... [详细]
  • 高效解决应用崩溃问题!友盟新版错误分析工具全面升级
    友盟推出的最新版错误分析工具,专为移动开发者设计,提供强大的Crash收集与分析功能。该工具能够实时监控App运行状态,快速发现并修复错误,显著提升应用的稳定性和用户体验。 ... [详细]
  • FinOps 与 Serverless 的结合:破解云成本难题
    本文探讨了如何通过 FinOps 实践优化 Serverless 应用的成本管理,提出了首个 Serverless 函数总成本估计模型,并分享了多种有效的成本优化策略。 ... [详细]
  • 简化报表生成:EasyReport工具的全面解析
    本文详细介绍了EasyReport,一个易于使用的开源Web报表工具。该工具支持Hadoop、HBase及多种关系型数据库,能够将SQL查询结果转换为HTML表格,并提供Excel导出、图表显示和表头冻结等功能。 ... [详细]
  • 深入解析Hadoop的核心组件与工作原理
    本文详细介绍了Hadoop的三大核心组件:分布式文件系统HDFS、资源管理器YARN和分布式计算框架MapReduce。通过分析这些组件的工作机制,帮助读者更好地理解Hadoop的架构及其在大数据处理中的应用。 ... [详细]
  • 深入解析Spark核心架构与部署策略
    本文详细探讨了Spark的核心架构,包括其运行机制、任务调度和内存管理等方面,以及四种主要的部署模式:Standalone、Apache Mesos、Hadoop YARN和Kubernetes。通过本文,读者可以深入了解Spark的工作原理及其在不同环境下的部署方式。 ... [详细]
  • 优化使用Apache + Memcached-Session-Manager + Tomcat集群方案
    本文探讨了使用Apache、Memcached-Session-Manager和Tomcat集群构建高性能Web应用过程中遇到的问题及解决方案。通过重新设计物理架构,解决了单虚拟机环境无法真实模拟分布式环境的问题,并详细记录了性能测试结果。 ... [详细]
  • 在Ubuntu 16.04中使用Anaconda安装TensorFlow
    本文详细介绍了如何在Ubuntu 16.04系统上通过Anaconda环境管理工具安装TensorFlow。首先,需要下载并安装Anaconda,然后配置环境变量以确保系统能够识别Anaconda命令。接着,创建一个特定的Python环境用于安装TensorFlow,并通过指定的镜像源加速安装过程。最后,通过一个简单的线性回归示例验证TensorFlow的安装是否成功。 ... [详细]
  • 本文介绍了Elasticsearch (ES),这是一个基于Java开发的开源全文搜索引擎。ES通过JSON接口提供服务,支持分布式集群管理和索引功能,特别适合大规模数据的快速搜索与分析。 ... [详细]
  • 全面解读Apache Flink的核心架构与优势
    Apache Flink作为大数据处理领域的新兴力量,凭借其独特的流处理能力和高效的批处理性能,迅速获得了广泛的关注。本文旨在深入探讨Flink的关键技术特点及其应用场景,为大数据处理提供新的视角。 ... [详细]
  • 拖拉切割直线 ... [详细]
  • 时序数据是指按时间顺序排列的数据集。通过时间轴上的数据点连接,可以构建多维度报表,揭示数据的趋势、规律及异常情况。 ... [详细]
author-avatar
374439252亮
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有