热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

卢东明:Hadoop不能适用所有大数据场

卢,东,明,hadoop,不能,适用
文章讲的是 卢东明:Hadoop不能适用所有大数据场“大数据”自诞生之日起,业界对它的概念、技术和应用就存在一定争议。究竟什么是大数据?有哪些大数据技术?大数据的未来是怎样的?每个人都有自己的理解。在2013大数据产品评选活动举办之际,笔者采访了此次担任评委的几位专家学者,看看专家眼中的“大数据”是什么样的?

近日,在一次微访谈活动中,SAP亚太区数据库解决方案技术总监卢东明回答了笔者的提问,分享了对大数据的几点看法,笔者整理如下:

卢东明:Hadoop不能适用所有大数据场景
▲SAP亚太区数据库解决方案技术总监卢东明

小数据是结构化的

几天和@赵国栋TMT 一起聊大数据,我说现在最难的问题就是“定义”什么是大数据。我认为大数据目前处于发展的早期,很多观点都不错,但是我不认为能够、也不喜欢用简单的几个标签来定义“什么是“大数据” 。“大数据”中最有活力的词是“大”,但是“大”是个相对的词,各个时期,各个阶段,各个角度所谈的大是不一样的,数据量也只是大数据中的一个指标,有点行业,例如互联网,电信,很容易收集到TB级,甚至百TB级的数据,但是并不等于有些深度挖掘的公司在百GB级不可能发掘出价值。大数据的时代了解何为“小数据”也许更可以帮助大家理解到底什么是“大数据”。我认为,“小数据”是结构化的、现有的IT技术能力上已经有效、充分地掌握,并且在人们生活、工作中持续地发挥着作用的信息都可以归为小数据的范畴,而所有超出现有能力的信息类型、信息技术都属于大数据。这样定义外延的方法也许比试图给一个充分而且必要的定义要容易理解一些。

不要盲目跟风Hadoop

Hadoop是大数据技术的一个优秀代表,但是同时,它只是优秀代表中的一个,有很多技术在帮助企业拓展数据的获取、存储、使用、分析能力,在这个问题上,千万不要人云亦云,千万不要跟风。 大数据的技术有很多,数据流分析技术CEP,机器学习技术Mahout,数据分析的软件R语言,列式数据库的技术Sybase IQ,SAP HANA等都是值得投入精力学习掌握的技术点。但是在这些技术点的学习中,需要多了解应用场景。Hadoop的应用在互联网公司很多,但是互联网业务数据完整性一致性要求都不是特别高,谷歌的搜索并不是真正实时的内容,也不要求严格一致,这些技术可以应付,如果生搬硬套,把Hadoop拿来支持电信、金融这样的强结构化数据的应用就不对。

对大数据未来的三点担忧

关于大数据的期待我就不多说了,大家都期望着无处不大数据,无处不分析,无处不方便。说说担忧吧:一是,大数据的发展如果没有相应的法律跟上的话,人们的隐私会受到前所未有的攻击;二是,政府的又一轮投资是必然的,但是担心政府又被忽悠了;三是,大数据分析的人才储备不足。


作者:小野

来源:IT168

原文链接:卢东明:Hadoop不能适用所有大数据场


推荐阅读
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 如何高效启动大数据应用之旅?
    在前一篇文章中,我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目,涵盖关键步骤和最佳实践,帮助读者快速踏上大数据之旅。 ... [详细]
  • Excel 数据分析基础
    Excel 是数据分析中最基本且强大的工具之一,具备多种实用功能和操作方法。本文将简要介绍 Excel 的不同版本及其兼容性问题,并探讨在处理大数据时的替代方案。 ... [详细]
  • EST:西湖大学鞠峰组污水厂病原菌与土著反硝化细菌是多重抗生素耐药基因的活跃表达者...
    点击蓝字关注我们编译:祝新宇校稿:鞠峰、袁凌论文ID原名:PathogenicandIndigenousDenitrifyingBacte ... [详细]
  • 数字资产量化交易通过大数据分析,以客观的方式制定交易决策,有效减少人为的主观判断和情绪影响。本文介绍了几种常见的数字资产量化交易策略,包括搬砖套利和趋势交易,并探讨了量化交易软件的开发前景。 ... [详细]
  • Spark与HBase结合处理大规模流量数据结构设计
    本文将详细介绍如何利用Spark和HBase进行大规模流量数据的分析与处理,包括数据结构的设计和优化方法。 ... [详细]
  • 触发器的稳态数量分析及其应用价值
    本文对数据库中的SQL触发器进行了稳态数量的详细分析,探讨了其在实际应用中的重要价值。通过研究触发器在不同场景下的表现,揭示了其在数据完整性和业务逻辑自动化方面的关键作用。此外,还介绍了如何在Ubuntu 22.04环境下配置和使用触发器,以及在Tomcat和SQLite等平台上的具体实现方法。 ... [详细]
  • 随着“大数据”价值的日益凸显,从互联网、电商到金融和政府机构等各个领域都在积极应对海量数据的处理需求。如何以较低成本快速高效地构建大数据处理平台,已成为推动大数据应用创新的重要因素。为了帮助用户以最简便的方式实现这一目标,本文将详细介绍如何利用Hadoop和Spark技术搭建稳定可靠的大数据处理环境。 ... [详细]
  • SSAS入门指南:基础知识与核心概念解析
    ### SSAS入门指南:基础知识与核心概念解析Analysis Services 是一种专为决策支持和商业智能(BI)解决方案设计的数据引擎。该引擎能够为报告和客户端应用提供高效的分析数据,并支持在多维数据模型中构建高性能的分析应用。通过其强大的数据处理能力和灵活的数据建模功能,Analysis Services 成为了现代 BI 系统的重要组成部分。 ... [详细]
  • 2012年9月12日优酷土豆校园招聘笔试题目解析与备考指南
    2012年9月12日,优酷土豆校园招聘笔试题目解析与备考指南。在选择题部分,有一道题目涉及中国人的血型分布情况,具体为A型30%、B型20%、O型40%、AB型10%。若需确保在随机选取的样本中,至少有一人为B型血的概率不低于90%,则需要选取的最少人数是多少?该问题不仅考察了概率统计的基本知识,还要求考生具备一定的逻辑推理能力。 ... [详细]
  • 基于Java的客户关系管理(CRM)系统优化与应用
    本研究探讨了基于Java技术的客户关系管理(CRM)系统的优化与应用。首先介绍了CRM系统的概念及其分类,并详细阐述了企业项目开发的流程。随后,对CRM系统的模块进行了划分,包括系统功能模块图和各模块的具体功能描述,为系统的高效运行提供了理论和技术支持。 ... [详细]
  • PHP开发人员薪资水平分析:工程师平均工资概况
    PHP开发人员薪资水平分析:工程师平均工资概况 ... [详细]
  • 2016-2017学年《网络安全实战》第三次作业
    2016-2017学年《网络安全实战》第三次作业总结了教材中关于网络信息收集技术的内容。本章主要探讨了网络踩点、网络扫描和网络查点三个关键步骤。其中,网络踩点旨在通过公开渠道收集目标信息,为后续的安全测试奠定基础,而不涉及实际的入侵行为。 ... [详细]
  • DAO(Data Access Object)模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法,它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ... [详细]
author-avatar
人走茶凉
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有