热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

1为Hive打好基础:Hadoop

文章目录Hadoop浪费时间”到“它很了不起,将解决当前所有问题”董事、经理甚至首席信息官让团队实现这种新生的大数据事物且找到一个要用它来解决的问题谈到大数据,非技术反应通常是:“


文章目录



  • Hadoop浪费时间”到“它很了不起,将解决当前所有问题”
  • 董事、经理甚至首席信息官让团队实现这种新生的大数据事物
    • 且找到一个要用它来解决的问题
  • 谈到大数据,非技术反应通常是:
    • “噢,你是说像NSA那样吗?”
  • 大数据带来重大责任,但如果对大数据的使用及其好处缺乏认识,将滋生不必要的恐惧


  • Hadoop能让你存储和处理大量数据
  • Hive是一款工具,允许你用SQL来实现熟悉的数据访问操作
  • 这本书关于Hive的,
    • 它告诉你Hive在访问大型数据存储时是多么重要
  • 记这一点有助于理解我们为何撰本书。
  • 我们已有像T-SQL和PL/SQL这样的工具,
    • 以及其他能够检索数据的分析工具,
    • 为什么还要Hive?
  • 可用的数据是不断变化的且变化得很快
    • 迫使我们扩展自己的工具集,
    • 不能局限于过去30年的工具
  • 后面章节看到,我们确实需要改变,但是也要利用那些早已获得的成就和技能


  • Hadoop与“大数据”术语几乎同义
  • “大数据”正在慢慢地走向其他术语(决策支持系统和电子商务)的
  • 将“大数据”作为一种解决方案来谈论时,通常是从市场营销来看问题,
    • 不是从一种工具或者能力的视角。
  • 与一位高层管理人员会面时,他坚决要求我们不要在讨论中用“大数据”这个术语
  • 我同意了,因为这个术语会冲淡谈话的主题,使我们更关注于通用术语而没有触及技术的变革本质
  • 但是话又说回来,数据确实在变大,而我们不得不从某个地方开始讨论这个话题


  • Hadoop最初
    • 一种用于解决特定问题的技术
  • 演化快
  • 已变成一种核心技术,正改变企业看待其数据的方式
    • 如何使用数据
  • 如何深入理解所有数据
    • 以解决特定业务需求并获得竞争优势
  • 用于处理数据的现有模型和方法论正不断受到挑战。
  • Hadoop从小众解决方案变为每个企业都能从中获取价值的解决方案
  • 现在的日常技术都是基于专门的需求创造出来的,例如军事需求
  • 为什么会这样?
  • 创新至少3个要素:
    • 迫在眉睫需求,可以识别的问题,还有钱
  • 军队为自己使用而发明的产品和零售商店里的产品往往不太一样。
  • 后者经改良、推广和精心打暦,以供日常用
  • 随着了解Hadoop,要注意与此相同的过程:那些独特且紧紧聚焦于某一需求的发明将不断演进,以满足更广泛的企业需求

推荐阅读
author-avatar
dyh81216462
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有