热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

商业智能_大数据商业智能的十大戒律

篇首语:本文由编程笔记#小编为大家整理,主要介绍了大数据商业智能的十大戒律相关的知识,希望对你有一定的参考价值。

篇首语:本文由编程笔记#小编为大家整理,主要介绍了大数据商业智能的十大戒律相关的知识,希望对你有一定的参考价值。


 

如今,各路企业和组织都不再使用上一代架构来存储大数据。既然如此,为什么还要使用上一代商业智能(BI)工具来进行大数据分析呢?在为企业选择 BI 工具时,应该遵守以下“十诫”。


第一诫:不要转移大数据

转移大数据代价高昂:毕竟,大数据很“大”,如果打包转移,负担太重。

不要将数据提取出来,做成数据集市和数据立方,因为“提取”就意味着转移,会在维护、网络性能附加处理器方面造成纷乱庞杂的问题,出现两个逻辑上相同的备份。

让 BI 深入更底层运行数据就是大数据萌发的最初动力。


第二诫:不要偷盗!或者说不要违反企业安全政策

安全并非可有可无。如今数据泄露事件频繁发生,这表明实现安全并非易事,因此要选择能够利用现有安全模型的 BI 工具。依靠 Ranger、Sentry、Knox 等综合性安全系统,大数据可以使实现数据安全变得更加容易,现在就连 Mongo 数据库都有了令人惊叹的安全架构。

所有那些模型都允许你插入权限、将用户信息一路传播到应用层、实施可视化的授权和提供与该授权相关的数据志。记住了,安全即服务。


第三诫:不要按照用户数和数据量付费

大数据的一个主要好处在于,如果做好了,它就能实现极高的性价比。把5 PB 数据存储到 Oracle 可能会让你倾家荡产,但存储到大数据系统则不会。尽管如此,在付钱购买之前,应该警惕某些价格陷阱。有些 BI 应用按照数据量或者索引数据量向用户收费。千万当心!

数据量和大数据使用量出现指数式增长是再平常不过的事情,我们的客户曾目睹其访问量在短短几个月时间里从数百亿次猛增到数千亿次,用户数扩大50倍。这是大数据系统的另一个好处:渐进式可扩展性。不要被低价所迷惑,去购买一种会对企业增长征收“高税”的 BI 工具。


第四诫:要大胆借鉴别人的可视图

分享静态图表?这些我们已经做过了,无论是 PDF 文档、PNG 图片还是电邮附件里,到处都在传播静态图表。但对于大数据和 BI,静态图表还远远不够:你拥有的一切无非都是些漂亮的图片罢了。你应该让任何人都能够随心所欲地与你的数据进行交互。应该把可视化看作是驾驭数据的交互式路线图。为什么要闭门造车呢?

将交互式可视化手段公之于众只是第一步。看看 Github 的模式就知道,与其说“这是我的最终发布产品”,不如说“这是一幅可视图,复制下来,分解它,我就是从中得到那些见解,看看它还能用于其他哪些领域”。这会让其他人从你的见解中学到有用的东西。


第五诫:要分析天然形态的数据

大数据是“非结构化”的,这样的说法我们已经听过太多太多。其实不然。财务和传感器会产生大量的键值对。JSON (可能是当下最流行的数据格式)可以是半结构化、多结构化等等,Mongo 数据库对这种数据格式下了重注。JSON 具有好处理和可规模化的优点,但如果把它转换成表格,表达力就会丢失。很多大数据仍然被制成表格,通常拥有数千栏。你不得不为所有的值寻找关系:“在那种情况下……从这里选择这个”。

扁平化会毁掉原始结构中所表达的重要关系。远离那些对你说“请把数据转换成表格,因为我们一直都这么干”的 BI 解决方案。


第六诫:不要无限期地等待结果

在2016年,我们预计数据处理速度将会变得快起来。一个典型方法是联机分析处理(OLAP)立方,本质上就是把数据转移到预计算缓存,从而加快处理速度。问题在于,你必须提取和转移数据(请看第一诫),以便建造数据立方,然后才能加快速度。

现在,这种方法能够在一定的数据规模下良好运转,但如果临时表格过于庞大,你的笔记本电脑在试图将表格本地化的时候就会崩溃。当你提取新数据重建缓存时,新数据的分析就会中途停下来。此外还要注意样本问题,你可能会得到一个看起来不错、效果很好的可视图,但最后却发现全不对路,而问题就出在缺少大局观。要选择那些能便捷地不断调整数据的 BI 工具。


第七诫:不要制作报告,而要打造应用

在很长一段时间里,“获得数据”意味着获得报告。在大数据时代,BI 用户希望从多个来源获得异步数据,这样他们就不需要刷新任何东西,就好像浏览器和移动设备上运行的其他各种东西。用户希望和可视元素进行交互,得到他们正在寻找的答案,而不是对你已经提供给他们的结果进行交叉过滤。

Rails 等框架使打造 Web 应用变得更加简单。为什么不对 BI 应用做同样的事情呢?没理由不对这些应用、应用程序接口(API)、模板、可重用性等等采取类似的做法。现在是时候通过现代 Web 应用开发的透镜来看待 BI。随着科技的进步,企业应用已经很容易就能获得和创建了,比如用活字格企业Web应用生成器,这种非常简单的类似 Excel 的工具。


第八诫:要利用智能工具

在提供基于数据的可视图方面,BI 工具已经证明了自己的能力。现在则轮到在模型和缓存的自动维护上下功夫,这样一来,终端用户就不必操这个心了。在庞大的数据规模下,自动维护几乎是不可或缺的,我们可以从用户和数据与可视图的交互中获得大量信息,现代工具应该使用这些信息来对数据网络效应加以利用。

另外,要选择那些内置全面搜索能力的工具,因为我曾见过有些客户拥有成千上万的可视图。你需要一种迅速查找的方法,在网络的长年熏陶之下,我们已经习惯了搜索,而不是翻找菜单。


第九诫:要超越基本范畴

如今的大数据系统因为预测分析能力而著称。相关性、预测和其他功能使企业用户比以往任何时候都能更便捷地进行高级分析。不需要编程经验就能处理大数据的可视化技术让分析师如有神助,超越了基本分析的范畴。

为了实现其真正的潜力,大数据不应该依赖于每个人都变成预言程序员。人类非常善于处理可视化信息,我们必须更加努力地将可视化信息呈现在人们眼前。


第十诫:不要只是站在数据湖边,等着数据科学家来干活儿

不管你是把大数据当成数据湖还是企业数据中心,Hadoop 已经改变了数据的处理速度和存储成本,我们每天都在创造更多的数据。但在真正利用大数据为企业用户服务方面,常常存在一种“只写系统”现象——创造数据的人很多,但利用数据的人却很少。

其实,用 Hadoop 里的数据可以为企业用户解答非常多的问题。BI 讲究的是打造数据可视化应用,为日常决策提供支持。企业里的每个人都希望做出数据驱动的决策。把大数据能够解答的所有问题局限于需要数据科学家来处理的问题,这是奇耻大辱。

 

文章来源:互联网



推荐阅读
  • MySQL索引详解与优化
    本文深入探讨了MySQL中的索引机制,包括索引的基本概念、优势与劣势、分类及其实现原理,并详细介绍了索引的使用场景和优化技巧。通过具体示例,帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]
  • 国内BI工具迎战国际巨头Tableau,稳步崛起
    尽管商业智能(BI)工具在中国的普及程度尚不及国际市场,但近年来,随着本土企业的持续创新和市场推广,国内主流BI工具正逐渐崭露头角。面对国际品牌如Tableau的强大竞争,国内BI工具通过不断优化产品和技术,赢得了越来越多用户的认可。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 数据库内核开发入门 | 搭建研发环境的初步指南
    本课程将带你从零开始,逐步掌握数据库内核开发的基础知识和实践技能,重点介绍如何搭建OceanBase的开发环境。 ... [详细]
  • 本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤,帮助开发者快速掌握这一实用技巧。 ... [详细]
  • 本文详细介绍了Akka中的BackoffSupervisor机制,探讨其在处理持久化失败和Actor重启时的应用。通过具体示例,展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 本文详细介绍了Python编程语言的学习路径,涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划,帮助初学者快速掌握Python的核心技能。 ... [详细]
  • 本文介绍如何使用 Python 的 xlrd 库读取 Excel 文件,并将其数据处理后存储到数据库中。通过实际案例,详细讲解了文件路径、合并单元格处理等常见问题。 ... [详细]
  • PHP 编程疑难解析与知识点汇总
    本文详细解答了 PHP 编程中的常见问题,并提供了丰富的代码示例和解决方案,帮助开发者更好地理解和应用 PHP 知识。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 创邻科技成功举办Graph+X生态合作伙伴大会,30余家行业领军企业共聚杭州
    9月22日,创邻科技在杭州举办“Graph+X”生态合作伙伴大会,汇聚了超过30家行业头部企业的50多位企业家和技术领袖,共同探讨图技术的前沿应用与发展前景。 ... [详细]
  • 智能投顾机器人:创业者如何应对新挑战?
    随着智能投顾技术在二级市场的兴起,针对一级市场的智能投顾也逐渐崭露头角。近日,一款名为阿尔妮塔的人工智能创投机器人正式发布,它将如何改变投资人的工作方式和创业者的融资策略? ... [详细]
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • R语言基础入门指南
    本文介绍R语言的基本概念,包括其作为区分大小写的解释型语言的特点、主要的数据结构类型如向量、矩阵、数据框及列表等,并探讨了R语言中对象的灵活性与函数的应用。此外,文章还提供了关于如何使用R进行基本操作的示例,以及解决常见编程问题的方法。 ... [详细]
author-avatar
手机用户2502862581
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有