热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

大数据发展方向

最近面试了一家做大数据的公司,这也是自从打算从事计算机行业以来的第一家准备加入的公司。公司主要做大数据的分析,具体名字就不说了。闲着没事,就简单了解下大数据,发现现在对于大数据还没有一个统一的

最近面试了一家做大数据的公司,这也是自从打算从事计算机行业以来的第一家准备加入的公司。

公司主要做大数据的分析,具体名字就不说了。

闲着没事,就简单了解下大数据,发现现在对于大数据还没有一个统一的定义,看来新生的事物确实要多磨。

不过,在了解的过程中,发现了一个问题:大数据通常需要通过网络爬虫来获得数据,然会才会汇总分析,这些数据来源全是互联网,完全没有付出任何代价,就能获得大量的数据。

问题来了:在获得这些数据时,数据的创造者们,同意了吗?

关于个人隐私的问题这几年越演越烈,几乎所有的大型互联网公司都或多或少的接到过涉及个人隐私的起诉。还有版权问题的立法,连本国都出台了处理这类问题的法律法规,更何况发达国家。这两个问题对于现在的大数据相关公司,会有多大的影响,对于大数据本身,会不会是毁灭性的打击?

“互联世界无隐私”,或许这句话在未来是对的,甚至可能被写入法律中,但是在当下,这个敏感的问题还是需要解决的。

国人的隐私权意识貌似到现在还没有觉醒,所以对于现在的大数据公司而言,是个很好的发展时机。但是,要来的终究会来,避免不了的。万一到了那个时候,遭到全民起诉的时代,这些公司的多年苦心经营岂不要付之一炬?

大数据发展的速度估计脱离不了摩尔定律,甚至更快。问题的暴露时间,将会随着大数据本身的发展,而更快的到来。

大数据终将何去何从,我暂时给不出解答。

希望有远见的博友们能帮助解答一二。


推荐阅读
  • 在学习网页爬虫时,使用Selenium进行自动化操作。初次安装selenium模块后,第二天运行代码时遇到了ImportError:无法从'selenium'导入名称'webdriver'。本文将详细解释该问题的原因及解决方案。 ... [详细]
  • 自己用过的一些比较有用的css3新属性【HTML】
    web前端|html教程自己用过的一些比较用的css3新属性web前端-html教程css3刚推出不久,虽然大多数的css3属性在很多流行的浏览器中不支持,但我个人觉得还是要尽量开 ... [详细]
  • 本文详细介绍了头条搜索引擎对网站内容的抓取、解析及索引过程,探讨了收录量与索引量的区别,并提供了实用工具和技巧来监控网站的收录情况。通过这些信息,网站管理员可以更好地理解搜索引擎的工作机制,优化网站内容以提高其在搜索结果中的可见性。 ... [详细]
  • 使用JS、HTML5和C3创建自定义弹出窗口
    本文介绍如何结合JavaScript、HTML5和C3.js来实现一个功能丰富的自定义弹出窗口。通过具体的代码示例,详细讲解了实现过程中的关键步骤和技术要点。 ... [详细]
  • 本文介绍了一个基于 Java SpringMVC 和 SSM 框架的综合系统,涵盖了操作日志记录、文件管理、头像编辑、权限控制、以及多种技术集成如 Shiro、Redis 等,旨在提供一个高效且功能丰富的开发平台。 ... [详细]
  • 推荐几款高效测量图片像素的工具
    本文介绍了几款适用于Web前端开发的工具,这些工具可以帮助用户在图片上绘制线条并精确测量其像素长度。对于需要进行图像处理或设计工作的开发者来说非常实用。 ... [详细]
  • 本文介绍了Python编程中的字符串操作基础知识,包括字符串拼接、索引、子序列选择和查找。此外,还探讨了如何利用字符串处理技术从HTML代码中提取超链接信息,为简单的网页抓取打下基础。 ... [详细]
  • Python3 中使用 lxml 模块解析 XPath 数据详解
    XPath 是一种用于在 XML 文档中查找信息的路径语言,同样适用于 HTML 文件的搜索。本文将详细介绍如何利用 Python 的 lxml 模块通过 XPath 技术高效地解析和抓取网页数据。 ... [详细]
  • Java 中重写与重载的区别
    本文详细解析了 Java 编程语言中重写(Override)和重载(Overload)的概念及其主要区别,帮助开发者更好地理解和应用这两种多态性机制。 ... [详细]
  • MySQL Debug 模式的实现与应用
    本文详细介绍了如何启用和使用 MySQL 的调试模式,包括编译选项、环境变量配置以及调试信息的解析。通过实际案例展示了如何利用调试模式解决客户端无法连接服务器的问题。 ... [详细]
  • 在研究网络爬虫时,遇到了一个问题:抓取到的数据与浏览器中显示的不一致。通过JavaScript动态更新的内容无法直接获取。本文将探讨如何有效捕获这些动态变化的数据。 ... [详细]
  • 本文介绍了如何在Django项目中使用django-crontab库来设置和管理定时任务,包括安装、配置、编写定时任务以及常见问题的解决方案。通过具体实例,帮助开发者快速掌握在Django中实现自动化任务的方法。 ... [详细]
  • 本文介绍了如何利用Java中的URLConnection类来实现基本的网络爬虫功能,包括向目标网站发送请求、接收HTML响应、解析HTML以提取所需信息,并处理可能存在的递归爬取需求。 ... [详细]
  • 探讨HTML中的DIV样式难题
    本文深入分析了HTML中常见的DIV样式问题,并提供了有效的解决策略。适合所有对Web前端开发感兴趣的读者。 ... [详细]
  • PHP 中 preg_match 函数的 isU 修饰符详解
    本文详细解析 PHP 中 preg_match 函数中 isU 修饰符的具体含义及其应用场景,帮助开发者更好地理解和使用正则表达式。 ... [详细]
author-avatar
傻瓜等傻子
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有