热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

大数据这么火,用途到底在哪?

在电影《永无止境》中,落魄的作家库伯利用药物将智商提高,做到可以将世界上已存的海量数据进行挖掘、分析,10天内在股市就赚了200万美元。这

在电影《永无止境》中,落魄的作家库伯利用药物将智商提高,做到可以将世界上已存的海量数据进行挖掘、分析,10天内在股市就赚了200万美元。这部电影最大的意义在于告诉人们数据挖掘的潜在价值,毕竟对于曾经只是收集、统计数据的公司来说,如何利用有些鸡肋的数据变现将是一门新的学问。

虽然大数据的概念这两年已经被吹捧的有些过于膨胀,但这项技术被人们感知的地方却很少。我们在与身边非科技圈朋友的交流中发现,多半儿人甚至不知道「大数据这货到底是干嘛的」。

CTO方育柯是在2006年加入数之联科技的,CEO周涛在2009年博士毕业后加入了团队。公司最早只是电子科技大学中由三个人组成的数据挖掘实验室,一直为中兴、华为提供相应的服务。2010年大数据火起来之后,团队认为“与其为大公司提供模块化的算法服务,不如专门成立一家公司做这方面的业务”。所以两年之后,这家公司正式成立。

大数据

作为一家做大数据分析的公司,方育柯首先回答了雷锋网记者关于大数据能做什么的疑问。针对客户的需求,数之联公司目前主推四项服务:

大数据顶层规划服务,很多企业其实并不清楚大数据该怎么落地,顶层规划服务可以深入到不同的公司,实现数据协同到业务协同

云端数据挖掘平台,可以降低数据分析师做数据挖掘的门槛,快速在云端实现数据建模。据他们了解,这是国内第一家分布式数据挖掘平台(国外有IBM的PSS等)

电商数据服务平台,帮助传统企业实现互联网+的模式,分析销售数据并进行反馈。目前与义乌购(小商品电商平台)有合作

图像搜索,在ToC市场,他们推出了拍图购,用户浏览网页时看到喜欢的衣服可以用拍图购直接进行搜索。而在ToB市场,数之联也在与电商平台合作,可以做到用户分析预测、客户流失情况统计、精准化营销等

传统企业预估销售额和收集产品改进意见时,采用的方式往往是做成百上千份调查问卷。这种方式既耗费时间, 又无法保证精准性。方育柯认为,大数据的作用就在于从数据角度帮助企业进行决策。

将大数据应用到普通消费者的生活中的现象将会越来越多,但很显然,人们能够直观体验到的却很少。在交流中记者发现,虽然有在ToC市场进行探索,但企业级服务才是目前他们的核心。

提到数据挖掘分析,就不能不说数据的来源。方育柯在交流中向记者介绍,公司收集的数据60-70%来自于互联网的公开协议,包括电商产品的图片和信息,微博、知乎等社交平台。另外则是来源于行业客户的合作提供。他向我们强调,公司从来不会从第三方获得敏感信息。

不论是数据的收集还是分析,对很多人来讲,首先能想到的就是百度、阿里这样的巨头公司。方育柯告诉记者,阿里云这一类产品帮助的是中小企业快速搭建云平台,解决方案是通用型的。数之联要做的则是通过深度整合大数据,将企业的业务流程进行分析、优化。“针对不同企业的特点,利用数据分析搭建平台,本质上来讲我们并不是同一个类型。”

在一些细分市场,比如企业征信,已经有邓白氏这类大型国际公司存在,优势就在于拥有很多企业的经营数据。方育柯向记者介绍,邓白氏在数据的收集和分析方式都比较传统,并且对于国内市场来说,外企总会有水土不服的现象。数之联由于与政府和企业合作的原因,对于国内市场的了解是外企所不具备的。这也是他们不惧怕邓白氏一类外企竞争的原因。

应用数据能如何改变日常生活?方育柯向记者举了个例子,给小区送快递时会放在门口的箱格里,利用数据分析收件人何时回家,改进存放时间可以提高箱格的使用效率。还可以针对收件人的身高等等因素调整到适合的位置。

技术实现或许没有困难,但雷锋网关心的是技术能否尽快落地,对于国内来说,要克服的显然还有很多问题。

人人都在说大数据,在于方育柯的交流中可以发现,现阶段的大数据主要围绕企业提供服务。

后记

数之联在去年拿了第一笔500万的融资,今年正在洽谈第二轮融资,预计估值将会翻一倍。作为母公司,人数已经达到80多人,整个集团的员工数达到了400多人。即使如此,方育柯还是告诉雷锋网记者,公司目前还是缺少相应的人才。

在采访结束之前,我们问方育柯:“既然大数据的概念已经被吹捧得很严重了,是否在推广上并不费力?合作谈的轻松么?”方育柯表示:“在概念盛行之下,行业内最缺的应该是标杆性的产品和应用。”他解释说:“很多企业认为大数据是万能的,可以短时间内完成数据平台搭建,并且可以让销量增长很多倍。这让我们很头疼,最先做的反而是引导客户降低预期,真正得去认识大数据。”


本文作者:白玉龙

来源:51CTO



推荐阅读
  • 时序数据是指按时间顺序排列的数据集。通过时间轴上的数据点连接,可以构建多维度报表,揭示数据的趋势、规律及异常情况。 ... [详细]
  • 本文旨在介绍一系列提升工作效率的浏览器插件和实用小工具,帮助用户在日常工作中更加便捷高效。内容由原作者授权发布。 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • 业务团队与独立团队在数据分析领域的效能对比:谁更胜一筹?
    业务团队与独立团队在数据分析领域的效能对比:谁更胜一筹? ... [详细]
  • 如何高效启动大数据应用之旅?
    在前一篇文章中,我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目,涵盖关键步骤和最佳实践,帮助读者快速踏上大数据之旅。 ... [详细]
  • PHP开发人员薪资水平分析:工程师平均工资概况
    PHP开发人员薪资水平分析:工程师平均工资概况 ... [详细]
  • 在前一篇文章《Hadoop》系列之“踽踽独行”(二)中,我们详细探讨了云计算的核心概念。本章将重点转向物联网技术,全面解析其基本原理、应用场景及未来发展前景。通过深入分析物联网的架构和技术栈,我们将揭示其在智能城市、工业自动化和智能家居等领域的广泛应用潜力。此外,还将讨论物联网面临的挑战,如数据安全和隐私保护等问题,并展望其在未来技术融合中的重要角色。 ... [详细]
  • 近期,为编制《2018中国人工智能应用与生态研究报告》,中国软件网对国内人工智能产业的应用现状、平台建设和生态系统进行了深入调研。本报告详细分析了当前人工智能企业的发展阶段,并对其未来前景进行了全面评估。研究发现,人工智能技术在多个领域取得了显著进展,但同时也面临诸多挑战,如数据安全、技术成熟度和人才短缺等。报告还探讨了政策支持、行业合作和技术突破对推动人工智能产业发展的关键作用。 ... [详细]
  • 快速排序是基于分治策略的一种排序算法,其平均时间复杂度为O(n log n),在大多数情况下表现优于其他排序算法。本文将详细介绍快速排序的工作原理,并提供一个Java语言的具体实现。 ... [详细]
  • 30岁时,中国五大IT巨擘在做什么?
    本文回顾了中国IT行业的五位领军人物——马云、雷军、李彦宏、马化腾和刘强东,在他们30岁时的职业状态和发展轨迹。这些行业领袖的早期经历,不仅展现了他们的个人魅力,也反映了中国互联网发展的历史进程。 ... [详细]
  • 全面解读Apache Flink的核心架构与优势
    Apache Flink作为大数据处理领域的新兴力量,凭借其独特的流处理能力和高效的批处理性能,迅速获得了广泛的关注。本文旨在深入探讨Flink的关键技术特点及其应用场景,为大数据处理提供新的视角。 ... [详细]
  • 初探Hadoop:第一章概览
    本文深入探讨了《Hadoop》第一章的内容,重点介绍了Hadoop的基本概念及其如何解决大数据处理中的关键挑战。 ... [详细]
  • 对于初学者而言,搭建一个高效稳定的 Python 开发环境是入门的关键一步。本文将详细介绍如何利用 Anaconda 和 Jupyter Notebook 来构建一个既易于管理又功能强大的开发环境。 ... [详细]
  • 近期尝试从www.hub.sciverse.com网站通过编程手段获取数据时遇到问题,起初尝试使用WebBrowser控件进行数据抓取,但发现使用GET方法翻页时,返回的HTML代码始终相同。进一步探究后了解到,该网站的数据是通过Ajax异步加载的,可通过HTTP查看详细的JSON响应。 ... [详细]
author-avatar
手机用户2502907453
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有