热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

目前创办一家数据挖掘的公司难点在哪里?

比如技术,市场客户。
比如技术,市场/客户。

回复内容:

2013年5月10日,在淘宝十周年晚会-马云退休演讲中,马云说:这是一个变化的时代。还有人没搞清楚PC,移动互联网来了;还没搞清楚移动互联网,大数据来了。而变化的时代是年轻人的时代。

马云说的这句话很关键,他不仅提到了大数据,而且更是用一句话阐述了互联网从PC时代,进化到移动互联网时代,然后从移动互联网时代进阶到了大数据时代。有几个关键点很重要:

PC时代,全球催生了大量的互联网上市企业,包括谷歌、亚马逊、新浪、搜狐、新东方等等;

移动互联网时代,中国创业热潮风生水起,不仅有大量的移动互联网(包括手游)企业赴美上市,更是诞生了无数个创业奇迹;如:陌陌科技公司、中国手游娱乐集团有限公司均在纳斯达克上市;飞鱼科技、云游控股(Forgame)和蓝港互动均在香港上市;而掌趣科技和北纬通信在深圳证券交易所成功挂牌上市。移动互联网不仅为我们的生活带来了便利,更是把创业热潮推向了历史最高峰。

现在问题来了,大数据时代,创业热潮是不是应该比移动互联网时代更加热闹呢?大数据时代如何创业?大数据创业的门槛又有哪些呢?

先回答第一个问题:大数据时代,创业热潮是不是应该比移动互联网时代更加热闹呢?

据我了解,不是。走在中关村创业大街上,你能收到的100份融资BP里,可能有99份都是APP和O2O项目,但99家里90%以上会重视大数据。

那么大数据时代如何创业呢?请先了解一下大数据的创业门槛。

门槛一:数据

大数据大数据,没有数据怎么玩?那么数据从哪里来呢?

像百度、腾讯和阿里巴巴这样的BAT企业,本身就积累了大量的数据,所以他们玩起大数据来,多半是“闷声发大财”。当然了,也可以举几个BAT企业玩大数据的例子,比如说百度旗下的“百度迁徙”、“百度精算”、“百度舆情”、“百度大数据预测引擎”等等,都是百度的大数据产品应用;阿里巴巴的话,“阿里云”、“支付宝-花呗”、“支付宝-借呗”“芝麻信用”、“蚂蚁金服”等等,都应用了大数据技术。而腾讯方面,“腾讯广点通”、“腾讯云分析”和微信等也都应用了大数据技术。

尔等屌丝没有数据,如何玩呢?

首先,你可以通过第三方购买数据,比如说,数据堂就有很多数据出售和分享;
其次,你可以用爬虫爬回一些数据来存储;
再者,通过给企业、开发者、站长等等授权使用大数据工具来积累数据。这方面的新创企业包括Talkingdata、友盟和DataEye等。
最后,使用免费的政府、企业、和机构开放数据。比如说高德数据的API接口和微博商业数据API接口等等。

总体来说,解决好数据源是大数据创业的必要门槛。关键看你创业的项目是什么。

门槛二:硬件

在北京,我曾经参观过一家大数据初创企业,当时他们还没有拿到融资。我去他们的办公区发现一幕特别心酸的事情。他们的员工挤在一间很小的屋子里办公,而两件较大的屋子都用来安放大数据存储服务器。

大数据的存储量是很惊人的,这对机房和硬件设备也提出了新的挑战。这一点和移动互联网不太一样,你做一个APP,用电脑搞开发,服务器用云服务器就行,按需购买。但是大数据不行,你没法把自家的数据存储在别人的云服务器上,一方面是安全因素,另外一方面也有产权因素。硬件也是大数据创业的门槛之一,但不是最大的门槛。

顺便补充一句,我曾经参观过的那家大数据新创企业,目前已完成百万美元的A轮融资,现在他们家的办公区特别宽敞,恭喜星图数据。

门槛三:人才

我认为大数据创业的最大门槛在于人才。和做APP不一样,大数据创业你一个人乃至几个人都是没法玩转的。初创企业你就往10-15人这样的团队先招人吧,这样的团队要包括Hadoop工程师、算法工程师,数据建模工程师、架构师、NoSQL工程师、BI工程师等等,全都是技术要求较高、薪资要求也很高的人才。大数据人才有多贵?在美国,在R、NoSQL和MapReduce方面需求的专业人才薪水达到了每年约11万5千美元,在中国也便宜不到哪里去,没有年薪30万,你很难招到一个大数据人才。

据中国商业联合会数据分析专业委员会统计,未来中国基础性数据分析人才缺口将达到1400万,而在BAT企业招聘的职位里,60%以上都在招大数据人才。也就是说,技术很牛的大数据人才,他的选择面很宽,要么早就进入BAT企业,要么也是在不错的企业拿着高薪,你要挖这样的人才,除了钱,股票、期权、福利等等,都是必须付出的代价。

2015年-2016年是大数据人才最为匮乏的两年,原因很简单,各大刚刚开通了大数据科目的院校,学生还没毕业;而招聘市场上的大数据人才需求量远远已经供不应求。除了BAT企业,通信企业、电力企业、金融银行行业、医疗行业、工业、游戏行业等等,哪个行业不是都在招大数据人才?创业公司要在这么严峻的人才环境中找到适合自己的大数据技术人才,门槛可不止是钱。

门槛四:技术

说了人才,就要说技术了。大数据技术不是你懂C++或者R语言就够了的,大数据有一整套自己的技术体系,包括统计、编程、JAVA、数据库、Hadoop、Spark、NoSQL、机器学习、自然语言处理、算法、数据可视化等等技术。光是Hadoop需要用到的技术和编程语言就有很多项。而且市面上的大数据工具每家用的还不一样,用开源软件(如Hadoop、Spark)或者用SAP(SAP HANA)需要的技术也不一样。技术要求较高,而拥有大数据综合技术的人才又较少,这也成为了制约大数据创业的最大问题。

门槛五:钱

其实我不想写钱,但是又必须写钱。大数据行业创业不缺资本,只要你创业项目的商业模式没问题,并且技术能力强,且团队靠谱,无论在中国还是在美国,融个A轮还是没有问题的,资本关注度很热。但是你在拿到融资之前,自己启动的资金就需要一大笔。人才、硬件和技术成本都较高。这么理解吧,如果说,几个好朋友凑50万花3个月可以做一个APP项目,那么要在大数据行业创业的话,请先准备600-800万再来玩。

门槛六:商业模式

中国互联网上最赚钱的行业是什么?我认为是电子商务和网络游戏。电子商务和网络游戏也是互联网变现最快的行业。而大数据,它的变现能力不如网络游戏和电子商务那般简单直接。在我拜访过的很多企业中,他们手里有钱、有数据、有人才也有技术,但是他们不知道自己手里的数据可以拿来做什么。也就是说,大数据目前没有最明朗最直接的商业模式。

大数据只有和业务场景结合,才能产生价值。

大数据就像石油原油一样,你知道它在哪里,你可以开采它,但是开采出来你还需要冶炼,并且经过减压蒸馏、加氢精制、溶剂精制、溶剂脱蜡等炼制过程,成为成品油后运送到各个加油站,让汽车加满油后产生了动力才实现最终价值。大数据也一样,需要一整套复杂的过程才能实现商业价值。

那么你可能会问了,大数据交易算不算是商业模式呢?

我个人觉得,要看交易的是什么东西?原始的非结构化的数据,后面数据清洗需要太多的工序,数据存储也是很大的成本,这样的交易代价太高。我相信无论是企业用户也好,还是个人用户也好,大家更倾向于购买“拿来就能用”的大数据数据源。

你说京东和腾讯完成首笔大数据交易,我觉得就是一个笑话,京东和腾讯的大数据不早就整合在一起了么?我用微信直接就能在京东购物,数据是互通的,何必交易?

所以说,大数据创业最难的还是在于商业模式的思考,如果你没有找到一条让大数据变现的渠道,那么千万不要忙着拉团队创业。大数据行业创业,光有idea是不够的,跑通整个商业模式才是关键。

回答最初的问题来,大数据如何创业呢?我认为是:

一、找到一个大数据商业突破口;搞清楚你要用大数据解决什么问题,你的用户是谁?商业逻辑是什么?
二、找到一笔启动资金;
三、最好自己就懂一些大数据相关技术。
四、找到几个可以与你同甘共苦的伙伴。
五、找到你的数据来源,最好是独家的数据来源。

事实上,其实我认为目前不要着急去做大数据项目,做大数据处理工具是个不错的方向,可以先从做BI(商业智能)、CRM、ERP系统开始,等你有了客户,有了数据之后,回转头来做大数据项目,会更加水到渠成。


参考36dsj.com/archives/2865

你是这方面的人才或者创业者的话可以联系联系。 还是如何落地的问题,数据挖掘的范围太广,说起来太虚。还是先回答这几个问题再说:
你能够解决什么样的客户怎么样的痛点?
你的数据挖掘技术有什么优势或门槛?
你的挖掘效果如何有效验证?

这主要还是一个技术和产品驱动的活,先解决技术和产品的问题,再谈怎么铺BD吧。 找到你的用户,把他们的需求发掘出来。对数据的使用,绝大数公司都不是自觉的。 1、数据挖掘结果是否能赢得信任?特别在结果是错误的时候。
2、需求是否是刚性的?客户能给你多少钱?
3、业务占90%,IT占10%,用人门槛很高。 有一部分来自数据本身获取 很多人都提到了帮助客户的问题,其实还可以延展一下,那就是:客户为什么需要你的数据挖掘?

这个问题必须由你告诉客户,你的公司也是才因此有竞争力。需知你的客户如果已经知道他们要达到的目的是什么,那你的公司是公司吗?不是,你只不过是几个数据民工的包工头罢了。


所以我认为在现在的条件下开一家数据挖掘公司最重要的是对目标公司的清晰认识,这需要你具备管理学、组织学等相关知识和非常丰富的经验。 说的有些夸张了。数据挖掘的产业链覆盖多个范畴,小团队只要专注在某个领域自然会有所斩获,前提是小团队确实有人才 你问出这问题,就基本告别这行业了,咱创办个容易的吧! 数据挖掘公司我觉得最关键的是:你能为社会或者客户带来什么好处。。能提高效率呢、还是能发现新的利润增长点?
既然是挖掘,那首先你得有可挖的数据源,这个源你如何获得?如果获得了数据源,那经过对数据的清洗,关键还是在数据分析上了。
你的分析思路和分析报告,对客户的利益要害作用有多大,还需要进一步观察。。
共勉吧
推荐阅读
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 什么是大数据lambda架构
    一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出,根据维基百科的定义,Lambda架构的设计是为了在处理大规模数 ... [详细]
  • Hadoop——Hive简介和环境配置
    一、Hive的简介和配置1.简介Hive是构建在Hadoop之上的数据操作平台lHive是一个SQL解析引擎,它将SQL转译成MapReduce作业,并 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 分享css中提升优先级属性!important的用法总结
    web前端|css教程css!importantweb前端-css教程本文分享css中提升优先级属性!important的用法总结微信门店展示源码,vscode如何管理站点,ubu ... [详细]
  • 应用场景当遇到数据分类,聚类,预测等场景问题,普通的SQL方法无法解决,需要借助算法这件武器,比如聚类算法,分类算法,预测算法等等,但是手动去研究一个算法比较吃力,有没有那种工具, ... [详细]
  • 物联网、工业互联网大数据的特点-随着数据通讯成本的急剧下降,以及各种传感技术和智能设备的出现,从手环、共享出行、智能电表、环境监测设备到电梯、数控机床、挖掘机、工业生产线等都在源 ... [详细]
  • Kylin 单节点安装
    软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]
  • 前言折腾了一段时间hadoop的部署管理,写下此系列博客记录一下。为了避免各位做部署这种重复性的劳动,我已经把部署的步骤写成脚本,各位只需要按着本文把脚本执行完,整个环境基本就部署 ... [详细]
  • Azkaban(三)Azkaban的使用
    界面介绍首页有四个菜单projects:最重要的部分,创建一个工程,所有flows将在工程中运行。scheduling:显示定时任务executing:显示当前运行的任务histo ... [详细]
  • Java开发实战讲解!字节跳动三场技术面+HR面
    二、回顾整理阿里面试题基本就这样了,还有一些零星的问题想不起来了,答案也整理出来了。自我介绍JVM如何加载一个类的过程,双亲委派模型中有 ... [详细]
  • Hadoop之Yarn
    目录1Hadoop1.x和Hadoop2.x架构区别2Yarn概述3Yarn基本架构4Yarn工作机制5作业提交全过程6资源调度器7任务的推测执行1Hadoop1.x和Hadoo ... [详细]
  • 当计算任务越来越多,作业提交越来越多,企业普通的做法是,在原有的系统架构上,不停地往上堆积硬件或者加服务器。的确,hadoop设计上的优秀和可扩展性可以方便的 ... [详细]
  • Hadoop源码解析1Hadoop工程包架构解析
    1 Hadoop中各工程包依赖简述   Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。   GoogleCluster:ht ... [详细]
  • MySQL:互联网公司常用 分库分表
    本文目录一、数据库瓶颈IO瓶颈CPU瓶颈二、分库分表水平分库水平分表垂直分库垂直分表三、分库分表工具四、分库分表步骤五、分库分表问题非partit ... [详细]
author-avatar
mobiledu2502912637
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有