热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

读《大数据时代下半场-数据治理、驱动与变现》--1

书没有一次读完,所以关于本书的读后感也是分章节写的。以下纯属个人不成熟看法。(引言-第二章)大数据时代,首先应理解:“我们自己现在便是一个数据产品”的含义。可以从两方面阐述这句话,一者:我们是

书没有一次读完,所以关于本书的读后感也是分章节写的。以下纯属个人不成熟看法。

(引言-第二章)

大数据时代,首先应理解:“我们自己现在便是一个数据产品”的含义。可以从两方面阐述这句话,一者:我们是数据的生产者,与自身息息相关的衣食住行等在这个时代都被数据化了;二者,我们也是数据最后的消费者,数据最终的落脚点都是消费者,一切都是围绕着这个转。

那什么是大数据了?高德纳公司定义为“大数据是搞容量、搞速度、高多样性的信息资产,它要求信息处理的形式有着高性价比且创新,以增强洞察力和决策的准确性”,其三个核心是:高容量、高速度、高多样性。

  1. 高容量:数据集合的规模从GB、TB到PB甚至是ZB(1021
  2. 高速度:分为两个层面,一是:数据的处理速度,因为大数据和内存没有直接关系,给即时的处理数据提供可能;二是:数据产生快,现在社交网络,移动终端和移动计算等无时无刻的不在产生数据;
  3. 高多样性:主要是数据结构的多项性,目前因社交网络,语言视频等,非结构化的数据占据主要地位。

现在大数据的一个基本循环是:企业、数据使用者、数据生产者。我们生产数据,企业加工数据、企业和我们使用数据,三者是一个圆环。企业通过观察数据对我们的影响,然后适当的调整产品,再观察数据,再调整,从而达到企业的商业目的。其中,这些相互作用的数据包括:交流、阅读、出行、健康、吃住以及交流的双方等信息。

这里面就包含着大数据下的企业战略目标,理想的是,大数据的创新和措施应符合企业的目标。为达到这点,企业应首先对数据足够的重视,应有合理的分析模式,企业在市场中应该扮演一名分析型的竞争者。企业对数据的分析,不是静态的,应该是动态与发展性的,为此,参与者的创造力与自由空间尤为重要。

  1. 创造力:企业文化的氛围应该让参与敢于接受新的行为和思维模式,敢于对现有的组织架构提出质疑,同时也要需要优秀的数据人才加入到企业中。
  2. 自由空间:企业应该有中期或者长期的成果导向,短时间的没有成果应该在计划内,给员工压力的同时,也要给一定的施展空间。以平常性去对待大数据人才。

企业在利用大数据获取信息控制权的同时,应该注意建议对现实复杂性的不合理排除。换句话说,不能为了某个目的而有选择性的提取信息,这样失败的可能性会大增。

在大数据时代,缺乏一定的法律基础,存在信息滥用的情况。其实这里,我们要首先确定一点:谁拥有数据的所有权?是数据的生产者?数据的收集者,公司?还是数据的存储者?还有一点是,数据的所有者具有什么的权利,是否可以买卖?若是买卖之后,新的所有者对数据的公开与否是否要尊重生产者的意见等等一系列的问题。但有一点毫无疑问的是:“数字的隐私”保护,此点应该是人的权利。数据应被可靠和正派性的被利用。目前,有许多APP,打击就需要获得试用者的地理位置、通讯信息等,拒绝就无法打开,个人认为是一种霸权行为。还有购物等的精准推送,这些都应该是在获得用户自愿的,而不是半强迫性的,此外,用户信息是否被初始收集人,转让给其他公司从事营利性等等,都非企业长久之计。当然如今,数据的隐私性首先还是在于个体。

大数据是自下而上的推动,人们的行为会影响到数据的产生,形式等,我们需要从宏观上去理解大数据。

大数据下的群体智能:从群体智能中获益,参与者应该都能获取解决问题所有信息;都有动力去为这个整体寻找问题最佳的解决方案;参与者之间不能相互影响。但信息的不对称,人心百态,所有信息与相互对立矛盾,这个也是利用群体智能企业应该面对的。

Ref:

王元卓, 靳小龙, 程学旗. 网络大数据:现状与展望[J]. 计算机学报, 2013, 36(6):1125-1138.


推荐阅读
  • Netflix利用Druid实现高效实时数据分析
    本文探讨了全球领先的在线娱乐公司Netflix如何通过采用Apache Druid,实现了高效的数据采集、处理和实时分析,从而显著提升了用户体验和业务决策的准确性。文章详细介绍了Netflix在系统架构、数据摄取、管理和查询方面的实践,并展示了Druid在大规模数据处理中的卓越性能。 ... [详细]
  • 深入理解Lucene搜索机制
    本文旨在帮助读者全面掌握Lucene搜索的编写步骤、核心API及其应用。通过详细解析Lucene的基本查询和查询解析器的使用方法,结合架构图和代码示例,带领读者深入了解Lucene搜索的工作流程。 ... [详细]
  • 本月初,我们为大家推荐了一系列精选书单,助力大家提升技术水平。月底,我们将介绍几位行业大牛,帮助大家找到人生导师。InfoQ一直致力于为用户提供有价值的资源和支持。 ... [详细]
  • Java EE开发技术课程学习平台设计与实现
    本文详细介绍了一款基于Java EE开发技术的在线学习平台,涵盖系统设计、流程分析、功能模块及源码分享等内容,提供从需求分析到部署的全面指导。 ... [详细]
  • 智能医疗,即通过先进的物联网技术和信息平台,实现患者、医护人员和医疗机构之间的高效互动。它不仅提升了医疗服务的便捷性和质量,还推动了整个医疗行业的现代化进程。 ... [详细]
  • 本文回顾了2017年的转型和2018年的收获,分享了几家知名互联网公司提供的工作机会及面试体验。 ... [详细]
  • 从码农到创业者:我的职业转型之路
    在观察了众多同行的职业发展后,我决定分享自己的故事。本文探讨了为什么大多数程序员难以成为架构师,并阐述了我从一家外企离职后投身创业的心路历程。 ... [详细]
  • ThinkPHP 数据库配置详解
    本文详细介绍了如何在 ThinkPHP 框架中正确配置数据库连接参数,包括数据库类型、服务器地址、数据库名称等关键配置项。 ... [详细]
  • PostgreSQL 最新动态 —— 2022年4月6日
    了解 PostgreSQL 社区的最新进展和技术分享 ... [详细]
  • 深入解析AUTOSAR方法论:汽车电子系统开发的理论基础(第三部分)
    本文详细探讨了AUTOSAR方法论在汽车电子软件系统开发中的应用,涵盖了从系统配置到生成可执行代码的各个关键步骤。通过介绍各阶段的任务和工具支持,帮助读者全面理解AUTOSAR的设计流程。 ... [详细]
  • 并发编程 12—— 任务取消与关闭 之 shutdownNow 的局限性
    Java并发编程实践目录并发编程01——ThreadLocal并发编程02——ConcurrentHashMap并发编程03——阻塞队列和生产者-消费者模式并发编程04——闭锁Co ... [详细]
  • vivo Y5s配备了联发科Helio P65八核处理器,这款处理器采用12纳米工艺制造,具备两颗高性能Cortex-A75核心和六颗高效能Cortex-A55核心。此外,它还集成了先进的图像处理单元和语音唤醒功能,为用户提供卓越的性能体验。 ... [详细]
  • 优化SQL Server批量数据插入存储过程的实现
    本文介绍了一种改进的SQL Server存储过程,用于生成批量插入语句。该方法不仅提高了性能,还支持单行和多行模式,适用于SQL Server 2005及以上版本。 ... [详细]
  • 对于许多初学者而言,遇到总线错误(bus error)或段错误(segmentation fault/core dump)是极其令人困扰的。本文详细探讨了这两种错误的成因、表现形式及解决方法,并提供了实用的调试技巧。 ... [详细]
  • 本文深入探讨了MySQL中常见的面试问题,包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析,帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]
author-avatar
呦呦嘉宾
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有