热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

苹果刚刚收购了暗数据分析公司LATTICE

雷锋网(公众号:雷锋网)AI科技评论按,苹果近日收购了一家数据挖掘和机器学习公司LATTICEDATA,雷锋网已经日前已经对相关情况进行报道,详情请看这篇文章。不过暗数据有哪些价值

苹果刚刚收购了暗数据分析公司LATTICE DATA,葫芦里卖的什么药?

雷锋网(公众号:雷锋网)AI科技评论按,苹果近日收购了一家数据挖掘和机器学习公司LATTICE DATA,雷锋网已经日前已经对相关情况进行报道,详情请看这篇文章

不过暗数据有哪些价值、LATTICE的技术有何特别之处、苹果此举又是出于怎样打算,很多小伙伴应该还不是很清楚,请看下文分析。

暗数据是什么?

LATTICE公司的技术要处理的对象是“暗数据”。业内把它称作“暗数据”(dark data),是因为这些数据很难直接使用。它们可能是杂乱的、多种格式共存的、进行了记录但是没有派上用场的、进行分析整合总结之前的、或者根本没有明确目的性。

总体情况而言,目前各家企业和组织收集的所有数据中,能够直接进行结构化分析或者大数据分析的数据比例其实很小。根据IDC的调查数据,90%的非结构化数据都从未被分析过。多数情况下企业觉得许多类型的数据都有直接价值或者潜在价值,所以花费资金人力进行了长期收集,比如收集用户使用自家产品的信息、统计内部软件开发进度、统计网站访问信息等等;典型的暗数据还比如,公司中存储的客户资料、服务器的日志文件、离职员工的信息、问卷调查的原始数据、按周期的财务状况表、历史邮件资料、公开的账户信息、工作产生的记事本备忘录PPT、工作报表文档的早期版本等等。

除了直觉上觉得“收集了数据就肯定有价值”之外,我们对暗数据的价值是否有理性的系统化认识呢?现在对它价值的认识主要有两种观点,一种观点基于正面价值,认为不对这些数据进行分析,就没法发现其中有些重要但尚未被人注意过的机会;另一种观点基于负面价值,如果这些未经分析的数据处理不当,可能会有法律和安全方面的许多问题。

正面价值的角度,企业有很大的机会可以通过暗数据获得发展业务的机会,比如:服务器的日志文件中可以读出网站访问者的行为;客户通话录音可以揭示客户的态度和感情;移动设备带来的位置数据可以提供访问模式。如果一家企业不对这些暗数据进行分析,那简直就是把机会白白丢掉了。不过同样地,企业也需要有更好的流程、协调和技术才能够正确地运用暗数据。

负面价值的角度,企业很可能记录了法律不允许记录的数据,一旦揭露出来会有很大麻烦;收集的企业内部信息可能泄露商业机密;如果丢失了用户数据,将会降低公司信誉;如果手握类似的用户数据,A公司没有进行分析,但是竞争对手B进行了分析,那么B就很有可能在接下来的竞争中取得优势。

处理暗数据为什么难

确定了暗数据的价值以后,就可以考虑规划行动了。但已经行动的企业很少。这是为什么呢?

主要原因有这三个:

1,收集数据时候优先级太单一。比如一个信用卡的市场团队只关心客户的信息和信誉度,那么它会记录客户在网上申请页面上填写的信息,但是不关心客户是如何来到这个申请页面的、客户对页面易用性的感受又如何。那么当客户整个申请流程的数据都记录下来后,能够有人愿意分析利用的只是其中很小的一部分。

2,技术和工具的限制。如果同一家企业和组织的数据收集是用不同的技术和工具进行的,那就有可能出现由于技术限制导致这些技术和工具之间没法互动的情况。这样一来数据就没办法全部联系在一起,展现出完整的状况。这件事情尤其容易发生在那些有多个IT系统和数据格式的公司身上。比如,想把呼叫中心的语音录音和网站上的浏览点击数据整合在一起就很难。数据分析项目还处在比较早期阶段的公司就会有这样的问题。

3,数据难以结构化。不同设备的访问历史、社交网络上的文章和下面的评论、历史邮件资料等资料,虽然整理到便于查询的格式需要花一点功夫,但好歹还是普通文本;有不少情况下数据是在DOC、XLS、PPT、PDF文档和各种图片里面的,那这样的数据要如何提取、如何结构化呢,别忘了表格里的数据要保持着表格的结构才能产生意义,而图片信息的提取单独拿出来都是一件大事。

LATTICE公司技术如何

LATTICE公司的前身DeepDive是斯坦福大学的一项研究项目,计算机科学教授克里斯·雷(Chris Re)和密歇根大学计算机科学教授迈克尔·卡法雷拉(Michael Cafarella)共同带领团队进行研发,不仅成果客观,还获得过许多企业和机构的支持。

他们和核心竞争力是数据分析处理技术,采用深度学习的方案并大大提高了可用性,可以进行训练、推理和预测,最大的亮点是能够从非结构化的数据(如一般的工作文档和图片)整理出结构化数据(如SQL数据库),并且可以把这些数据合并到现有数据库以拓展整个分析结果的深度广度。他们的技术有很多吸引人的特点:

  • 入门成本低,使用者只需要考虑数据特征而不考虑算法

  • 科学领域内,信息提取准确度比人类更高

  • 可以适应数据的噪音和不准确性

  • 可以从多种数据格式提取信息,包括网页、PDF、图像、表格等等

  • 使用者可以非常简单地给与反馈和设定规则以提到特定领域内预测的准确度

  • 早期模型无需训练就可以开始工作

  • 高性能可拓展

LATTICE公司能帮到苹果吗

苹果的多条硬件产品线、多种软件生态服务、7亿用户群,都能够源源不断地产生用户行为数据。设备、服务、app的购买使用记录可以用来做用户画像,系统应用的使用统计数据可以分析用户习惯,每个地区市场的消费统计还可以用来分析消费趋势、出营销方案等等,而这还仅仅是基础的、很容易想到的用途。如果大家还记得之前爆出过iOS设备存储用户几个月内的GPS定位记录,其实已经表明,除了我们容易想到的使用记录和购买记录之外,还有不少数据也被记录了,这些数据不仅更隐私,泄露以后对用户还会有很大的威胁。

根据苹果有能力收集的数据和LATTICE所能提供的技术,雷锋网AI科技评论推测苹果可能有如下打算:

一,苹果记录的用户数据已经非常之多,首先需要考量数据存储的安全性和可靠性,避免丢失和泄露,最好还能同时提升可用性;

二,通过深入分析用户使用习惯数据,建立用户模型,了解和预测用户需求,继续优化用户体验,作为后乔布斯时代“满足用户需求,创造新的增长点”策略的行动之一;

三,现在的人工智能研究严重依赖数据,可以把用户产生的海量数据用于训练自己的人工智能

四,苹果对全球员工和全球供应商的信息管理也可以借此机会进行升级,继续提高信息管理水平

不过鉴于苹果的保密文化,外人可能最终也无从得知他们到底做了什么。不过这起码也给其它科技企业提了醒:别让自己花了人力财力收集的数据躺在服务器里睡大觉了。

AI科技评论招业界记者啦!

在这里,你可以密切关注海外会议的大牛演讲;可以采访国内巨头实验室的技术专家;对人工智能的动态了如指掌;更能深入剖析AI前沿的技术与未来!

如果你:

*对人工智能有一定的兴趣或了解

 * 求知欲强,具备强大的学习能力

 * 有AI业界报道或者媒体经验优先

简历投递:

lizongren@leiphone.com

相关文章:

苹果花2亿美元收购了一家人工智能企业,要把数据变废为宝


苹果刚刚收购了暗数据分析公司LATTICE DATA,葫芦里卖的什么药?


推荐阅读
  • Netflix利用Druid实现高效实时数据分析
    本文探讨了全球领先的在线娱乐公司Netflix如何通过采用Apache Druid,实现了高效的数据采集、处理和实时分析,从而显著提升了用户体验和业务决策的准确性。文章详细介绍了Netflix在系统架构、数据摄取、管理和查询方面的实践,并展示了Druid在大规模数据处理中的卓越性能。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • MySQL缓存机制深度解析
    本文详细探讨了MySQL的缓存机制,包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术,读者可以更好地优化数据库性能。 ... [详细]
  • 本文探讨了领域驱动设计(DDD)的核心概念、应用场景及其实现方式,详细介绍了其在企业级软件开发中的优势和挑战。通过对比事务脚本与领域模型,展示了DDD如何提升系统的可维护性和扩展性。 ... [详细]
  • 通过Web界面管理Linux日志的解决方案
    本指南介绍了一种利用rsyslog、MariaDB和LogAnalyzer搭建集中式日志管理平台的方法,使用户可以通过Web界面查看和分析Linux系统的日志记录。此方案不仅适用于服务器环境,还提供了详细的步骤来确保系统的稳定性和安全性。 ... [详细]
  • 福克斯新闻数据库配置失误导致1300万条敏感记录泄露
    由于数据库配置错误,福克斯新闻暴露了一个58GB的未受保护数据库,其中包含约1300万条网络内容管理记录。任何互联网用户都可以访问这些数据,引发了严重的安全风险。 ... [详细]
  • Ulysses Mac v29:革新文本编辑与写作体验
    探索Ulysses Mac v29,这款先进的纯文本编辑器为Mac用户带来了全新的写作和编辑环境。它不仅具备简洁直观的界面,还融合了Markdown等标记语言的最佳特性,支持多种格式导出,并提供强大的组织和同步功能。 ... [详细]
  • 智能投顾机器人:创业者如何应对新挑战?
    随着智能投顾技术在二级市场的兴起,针对一级市场的智能投顾也逐渐崭露头角。近日,一款名为阿尔妮塔的人工智能创投机器人正式发布,它将如何改变投资人的工作方式和创业者的融资策略? ... [详细]
  • 高效解决应用崩溃问题!友盟新版错误分析工具全面升级
    友盟推出的最新版错误分析工具,专为移动开发者设计,提供强大的Crash收集与分析功能。该工具能够实时监控App运行状态,快速发现并修复错误,显著提升应用的稳定性和用户体验。 ... [详细]
  • 该平台旨在为大型企业提供一个高效、灵活且可扩展的分布式微服务架构解决方案。它采用模块化、微服务化和热部署的设计理念,结合当前最先进且无商业限制的主流开源技术,如Spring Cloud、Spring Boot2、MyBatis、OAuth2和Element UI,实现前后端分离的系统管理平台。 ... [详细]
  • andr ... [详细]
  • 提升Tumblr爬虫效率与功能
    本文介绍了对之前开发的Tumblr爬虫脚本进行升级,整合了两个脚本的功能,实现了自动分页爬取博客内容,并支持配置文件以下载多个博客的不同格式文件。此外,还优化了图片下载逻辑。 ... [详细]
  • 科研单位信息系统中的DevOps实践与优化
    本文探讨了某科研单位通过引入云原生平台实现DevOps开发和运维一体化,显著提升了项目交付效率和产品质量。详细介绍了如何在实际项目中应用DevOps理念,解决了传统开发模式下的诸多痛点。 ... [详细]
  • 本文介绍了如何在Xcode中通过自定义文件模板来添加个性化的注释,以提高代码的可读性和维护性。具体步骤包括打开Xcode的应用包,定位到文件模板目录,并对相关文件进行编辑。 ... [详细]
  • 本文将带您了解Cocos家族的不同版本和分支,特别是Cocos Creator的发展历程及其核心特性,帮助初学者快速入门。 ... [详细]
author-avatar
Simon_Diego
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有