关于数据分析软件市场，这八大苗头才是真正的大势所趋！

作者：神秘的穿越火线99_628 | 来源：互联网 | 2023-09-13 12:21

关于,数据,分析,软件,市场,这,八,大,苗头,才是

紧张精彩的2015年已经结束了，现在是时候回过头来看一看数据分析软件市场的潮流。已经有几个趋势继续变得壮大（比如开源，云托管，基于Hadoop的SQL解决方案），同时AWS上的Redshift开始成为数据仓库中的一支重要力量。

SQL解决方案继续在Hadoop的生态系统里大行其道

除了Spark，大部分Hadoop的生态系统里的新闻都来自Presto, Impala and Drill。关于MapReduce继任者的斗争还在持续，而在列表中的所有候选者的一个主要的共同点就是他们都提供SQL界面。这个趋势从2010年Hive开始逐渐取代Pig就一直如此。

因为太多的Hadoop生态系统提供的价值围绕在分析和商业智能上，而过去数十年整个分析世界已经运行在SQL的基础之上，并且围绕它建立了很多无法替代的公司竞争力，所以在经过了很多关于NoSQL和Hadoop的憧憬以后，大家发现还是要回过头来面对这个事实。

Druid看起来要火

在主流的大规模基于内存的OLAP数据库中，LinkedIn的Pinot和Metamarkets的Druid是两个主流选择。 Druid似乎从Yahoo得到了不少关注，而且不少最前沿的高科技公司也开始越来越多地使用它来驱动实时商业智能（BI）。

十月份，Druid一些主要贡献者宣布了Imply.io，一家为Druid提供商业支持及打造出围绕Druid的生态系统的公司。总体而言，很多聪明人开始用Druid来做内存数据库，以便对海量数据集进行交互式分析。

开源机器学习库Galore

十一月，谷歌开源Tensor Flow ，一个利用数据流图谱进行计算的广义库。它被大量用于机器学习，特别是深度神经网络。它还在加盟了十一月微软发布的Theano，Torch，DMLT。

虽然上面提到的这些库不是可以把人工智能添加到任何产品的简单插件，但是以他们为基石任何有足够多的数据的人都可以来训练他们的系统来制造最先进的算法。当大家都开始在基石上建造，产品的整体复杂性，无论是分析相关还是其他方面，都会不断提高。

IBM在Spark上发力

6月，IBM 宣布把3500研发人员放在Spark相关项目上。 Spark是在许多方面是Hadoop的生态系统里的MapReduce的继承人。它为开发人员提供了四大法宝（低级别数据处理语言，机器学习库，图形算法和SQL-on-Hadoop数据库）来进行数据的混合及匹配。

虽然仍然在用户实践的最初阶段，Spark已经得到了背后庞大的开发者的支持。十月份，IBM宣布了基于Bluemix的Spark-as-a-service ，并且把其数据工程产品移植到Spark上。这件事情对以开发Apache Spark为主业的Databricks 公司的影响十分值得关注。

商业智能开源软件开始兴起的一年

从历史上看，开源软件的创新基本上在软件堆栈的较底层。随着时间的推移，以及对开源软件企业可行的商业模式的的发展，越来越多的面向最终用户的软件正在以开源的方式进行开放。

去年，两个古董的开源BI公司之一的JasperSoft被Tibco以$ 1.85亿美元收购。另一个公司，Pentaho，则在前年2月就被日立数据系统公司以超过$ 5亿美元收购。

同时，在2015年还涌现出了多家轻量级的开源项目。AirPal和Re:Dash把重点放在使用户能够快速，轻松地在Redshift上进行SQL查询（详见下文），而Metabase还提供了一个非常易于安装的工具，允许非技术用户对多种数据库进行数据查询和分享数据报表。

专有事件分析公司继续涌现

虽然Google Analytics仍然是大家默认的首选，仍然有很多人致力于开发以收集并分析在网站和移动应用上的用户行为为中心的，集所有功能于一身的分析系统。

与此同时，作为Google Analytics的主要竞争对手，Mixpanel（截止去年已募集$ 6.5亿美金），于去年7月跟随Heap公司的脚步，发布了Codeless Analytics。它主要是通过添加SDK到您的移动应用里，自动对移动应用进行数据埋点，并同时获得对用户行为事件的分析，而无需手动对特定事件进行埋点。十一月，该公司发布了Predict，它可以让你使用轻量级的机器学习来预测用户是否会执行一个动作（如转换付费）。

与此同时 - Heap已经因为它在移动和网络事件的数据分析上的简单易用性而获得了一定的知名度; Amplitude在八月融资$ 9百万美元；而以增快数据分析速度为核心业务的Interana也在一月份A系列融资$ 2000万美元。

同时，廉价和简单地运行一个数据仓库的方案的出现（如AWS的Redshift）也对传统的使用专有事件分析软件的理念带来了冲击。

正在兴起的建立于云端的分析架构

在2015年，一个用于处理商业智能的新的标准正在越来越多的创业公司（以及愿意保持创业心态的中型公司）中形成：上世纪90年代的统一数据仓库的概念正在回归。允许这样做的关键因素是AWS Redshit作为分析数据仓库的广泛采用。

因为Redshitshift相对于老一辈的数据库（如Aster，Vertica, Teradata等）比较容易维护，它很快成为科技创业公司里数据仓库的首选。

有两组初创企业乘着这股浪潮：那些帮助把你的数据转移到Redshift上的和那些让你对在Redshift上的数据进行分析的。

第一组包括一些公司讲业务完全围绕在将数据加载到Redshift（如Alooma，Etleap，Textur）。此外， Segment去年正式宣布了将数据送到Redshift上的能力。同时，RJMetrics，一个电子商务分析的供应商，推出了他们的系统里关于数据摄取的部分帮助您将数据送到Redshift。

总而言之，许多公司都把自己的赌注押在AWS上，绝大部分在去年秋天QuickSight发布前。随着AWS的数据管道等摄入服务不断完善，他们的业务模式是否仍然存在还有待观察。鉴于AWS的移动分析SDK和数据摄入管道的存在，可能留给这些公司的生存空间会逐渐消失。

鉴于QuickSight的预览版目前只能提供很基本的功能，一些BI软件供应商在2015年从在Redshift上投入巨资的客户上获得了很多业务。 Looker, Mode Analytics, Periscope and Metabase是在Redshift被用来做分析数据的产品里比较突出的。然而，这个领域会怎样发展很大程度上要看AWS来年会带来怎样的新产品。

总而言之，2016年正在成为一个非常值得纪念的一年，尤其在融资放缓的影响更加明显的情况下。

伟大的回火（公司估值压缩）

虽然在事件形成的过程中很难感觉到，但回过头来看，股票市场里股价对营收比的压缩对私募市场的影响很明显，特别是当Fidelity公开将它手中一大批其后期投资降低估值的时候。

在做分析软件的公司中，Cloudera的估值变化不大，而Dataminr的估值下降了35％。在一般情况下，分析创业公司的获取资本的成本，无论是早期或晚期，都变高了很多。虽然大量的风投公司扔在获得新的资金，并有足够的钱去投资，总的感觉是，对初创企业的估值已经缓慢开始下调。

今年会有一些动荡，无论是在募资上，还有更重要的是，在很多分析公司的客户群的相关预算上。由于大多数公司的客户终身价值对客户流失的敏感度，2016年看起来会是一个需要系好安全带准备迎接大风浪的时间。

本文转自d1net（转载）

推荐阅读

python
如何高效启动大数据应用之旅？

在前一篇文章中，我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目，涵盖关键步骤和最佳实践，帮助读者快速踏上大数据之旅。 ... [详细]

蜡笔小新 2024-11-04 18:30:38
web
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
python
六个关键步骤掌握Python数据分析，探索六款小众但强大的数据处理库

Python 数据分析领域不仅拥有高质量的开发环境，还提供了众多功能强大的第三方库。本文将介绍六个关键步骤，帮助读者掌握 Python 数据分析的核心技能，并深入探讨六款虽不广为人知但却极具潜力的数据处理库，如 Pandas 的替代品和新兴的可视化工具，助力数据科学家和分析师提升工作效率。 ... [详细]

蜡笔小新 2024-10-29 11:26:54
web
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
instance
深入解析 Lifecycle 的实现原理

本文将详细介绍 Android Jetpack 中 Lifecycle 组件的实现原理，帮助开发者更好地理解和使用 Lifecycle，避免常见的内存泄漏问题。 ... [详细]

蜡笔小新 2024-11-12 14:05:19
instance
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
include
2018年湘潭大学程序设计竞赛在牛客网的时间数据分析报告

本报告对2018年湘潭大学程序设计竞赛在牛客网上的时间数据进行了详细分析。通过统计参赛者在各个时间段的活跃情况，揭示了比赛期间的编程频率和时间分布特点。此外，报告还探讨了选手在准备过程中面临的挑战，如保持编程手感、学习逆向工程和PWN技术，以及熟悉Linux环境等。这些发现为未来的竞赛组织和培训提供了 valuable 的参考。 ... [详细]

蜡笔小新 2024-11-11 16:10:24
int
Cocos2d-x学习笔记：基础概念解析与内存管理机制深入探讨

在《Cocos2d-x学习笔记：基础概念解析与内存管理机制深入探讨》中，详细介绍了Cocos2d-x的基础概念，并深入分析了其内存管理机制。特别是针对Boost库引入的智能指针管理方法进行了详细的讲解，例如在处理鱼的运动过程中，可以通过编写自定义函数来动态计算角度变化，利用CallFunc回调机制实现高效的游戏逻辑控制。此外，文章还探讨了如何通过智能指针优化资源管理和避免内存泄漏，为开发者提供了实用的编程技巧和最佳实践。 ... [详细]

蜡笔小新 2024-11-11 14:49:31
chat
OpenAI首席执行官Sam Altman展望：人工智能的未来发展方向与挑战

OpenAI首席执行官Sam Altman展望：人工智能的未来发展方向与挑战 ... [详细]

蜡笔小新 2024-11-11 09:47:50
main
如何撰写适应变化的高效代码：策略与实践

编写高质量且适应变化的代码是每位程序员的追求。优质代码的关键在于其可维护性和可扩展性。本文将从面向对象编程的角度出发，探讨实现这一目标的具体策略与实践方法，帮助开发者提升代码效率和灵活性。 ... [详细]

蜡笔小新 2024-11-09 10:20:32
int
理工科男女不容错过的神奇资源网站

十一长假即将结束，你的假期学习计划进展如何？无论你是在家中、思念家乡，还是身处异国他乡，理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档，能够帮助你在假期中高效学习和提升专业技能。 ... [详细]

蜡笔小新 2024-11-01 11:51:44
merge
如何在Hive中合理配置Map和Reduce任务数量以优化不同场景下的性能表现

在Hive中合理配置Map和Reduce任务的数量对于优化不同场景下的性能至关重要。本文探讨了如何控制Hive任务中的Map数量，分析了当输入数据超过128MB时是否会自动拆分，以及Map数量是否越多越好的问题。通过实际案例和实验数据，本文提供了具体的配置建议，帮助用户在不同场景下实现最佳性能。 ... [详细]

蜡笔小新 2024-10-31 14:33:41
web
全栈工程师在当今技术领域的角色与价值探析

当前，众多初创企业对全栈工程师的需求日益增长，但市场中却存在大量所谓的“伪全栈工程师”，尤其是那些仅掌握了Node.js技能的前端开发人员。本文旨在深入探讨全栈工程师在现代技术生态中的真实角色与价值，澄清对这一角色的误解，并强调真正的全栈工程师应具备全面的技术栈和综合解决问题的能力。 ... [详细]

蜡笔小新 2024-10-31 10:28:12
web
Spring Boot与Redis的高效集成方案

本文探讨了Spring Boot与Redis的高效集成方法，详细介绍了如何在Spring Boot项目中配置和使用Redis，以提升应用性能和数据处理能力。同时，文章还涉及了Go语言社区的相关资源，为Golang开发者提供了宝贵的技术交流平台。 ... [详细]

蜡笔小新 2024-10-26 10:46:12
web
java – 在Firestore中构造此类数据的正确方法是什么？

我从GoogleFirebase服务中看过视频并阅读了Cloudfirestore的文档,但我无法想象实时数据库.我想到了这个Web应用程序,我希望从不同类别的产品中存储我的提供程 ... [详细]

蜡笔小新 2024-10-16 19:45:44

神秘的穿越火线99_628

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章