热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

大数据发展方向

最近面试了一家做大数据的公司,这也是自从打算从事计算机行业以来的第一家准备加入的公司。公司主要做大数据的分析,具体名字就不说了。闲着没事,就简单了解下大数据,发现现在对于大数据还没有一个统一的

最近面试了一家做大数据的公司,这也是自从打算从事计算机行业以来的第一家准备加入的公司。

公司主要做大数据的分析,具体名字就不说了。

闲着没事,就简单了解下大数据,发现现在对于大数据还没有一个统一的定义,看来新生的事物确实要多磨。

不过,在了解的过程中,发现了一个问题:大数据通常需要通过网络爬虫来获得数据,然会才会汇总分析,这些数据来源全是互联网,完全没有付出任何代价,就能获得大量的数据。

问题来了:在获得这些数据时,数据的创造者们,同意了吗?

关于个人隐私的问题这几年越演越烈,几乎所有的大型互联网公司都或多或少的接到过涉及个人隐私的起诉。还有版权问题的立法,连本国都出台了处理这类问题的法律法规,更何况发达国家。这两个问题对于现在的大数据相关公司,会有多大的影响,对于大数据本身,会不会是毁灭性的打击?

“互联世界无隐私”,或许这句话在未来是对的,甚至可能被写入法律中,但是在当下,这个敏感的问题还是需要解决的。

国人的隐私权意识貌似到现在还没有觉醒,所以对于现在的大数据公司而言,是个很好的发展时机。但是,要来的终究会来,避免不了的。万一到了那个时候,遭到全民起诉的时代,这些公司的多年苦心经营岂不要付之一炬?

大数据发展的速度估计脱离不了摩尔定律,甚至更快。问题的暴露时间,将会随着大数据本身的发展,而更快的到来。

大数据终将何去何从,我暂时给不出解答。

希望有远见的博友们能帮助解答一二。


推荐阅读
  • 本文详细介绍了Git分布式版本控制系统中远程仓库的概念和操作方法。通过具体案例,帮助读者更好地理解和掌握如何高效管理代码库。 ... [详细]
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • 云计算的优势与应用场景
    本文详细探讨了云计算为企业和个人带来的多种优势,包括成本节约、安全性提升、灵活性增强等。同时介绍了云计算的五大核心特点,并结合实际案例进行分析。 ... [详细]
  • JavaScript 中创建对象的多种方法
    本文详细介绍了 JavaScript 中创建对象的几种常见方式,包括对象字面量、构造函数和 Object.create 方法,并提供了示例代码和属性描述符的解释。 ... [详细]
  • 在PHP后端开发中遇到一个难题:通过第三方类文件发送短信功能返回的JSON字符串无法解析。本文将探讨可能的原因并提供解决方案。 ... [详细]
  • 并发编程 12—— 任务取消与关闭 之 shutdownNow 的局限性
    Java并发编程实践目录并发编程01——ThreadLocal并发编程02——ConcurrentHashMap并发编程03——阻塞队列和生产者-消费者模式并发编程04——闭锁Co ... [详细]
  • 本文详细介绍了头条搜索引擎对网站内容的抓取、解析及索引过程,探讨了收录量与索引量的区别,并提供了实用工具和技巧来监控网站的收录情况。通过这些信息,网站管理员可以更好地理解搜索引擎的工作机制,优化网站内容以提高其在搜索结果中的可见性。 ... [详细]
  • 使用JS、HTML5和C3创建自定义弹出窗口
    本文介绍如何结合JavaScript、HTML5和C3.js来实现一个功能丰富的自定义弹出窗口。通过具体的代码示例,详细讲解了实现过程中的关键步骤和技术要点。 ... [详细]
  • 本文介绍了一个基于 Java SpringMVC 和 SSM 框架的综合系统,涵盖了操作日志记录、文件管理、头像编辑、权限控制、以及多种技术集成如 Shiro、Redis 等,旨在提供一个高效且功能丰富的开发平台。 ... [详细]
  • 推荐几款高效测量图片像素的工具
    本文介绍了几款适用于Web前端开发的工具,这些工具可以帮助用户在图片上绘制线条并精确测量其像素长度。对于需要进行图像处理或设计工作的开发者来说非常实用。 ... [详细]
  • 本文介绍了Python编程中的字符串操作基础知识,包括字符串拼接、索引、子序列选择和查找。此外,还探讨了如何利用字符串处理技术从HTML代码中提取超链接信息,为简单的网页抓取打下基础。 ... [详细]
  • Python3 中使用 lxml 模块解析 XPath 数据详解
    XPath 是一种用于在 XML 文档中查找信息的路径语言,同样适用于 HTML 文件的搜索。本文将详细介绍如何利用 Python 的 lxml 模块通过 XPath 技术高效地解析和抓取网页数据。 ... [详细]
  • Java 中重写与重载的区别
    本文详细解析了 Java 编程语言中重写(Override)和重载(Overload)的概念及其主要区别,帮助开发者更好地理解和应用这两种多态性机制。 ... [详细]
  • MySQL Debug 模式的实现与应用
    本文详细介绍了如何启用和使用 MySQL 的调试模式,包括编译选项、环境变量配置以及调试信息的解析。通过实际案例展示了如何利用调试模式解决客户端无法连接服务器的问题。 ... [详细]
  • 在研究网络爬虫时,遇到了一个问题:抓取到的数据与浏览器中显示的不一致。通过JavaScript动态更新的内容无法直接获取。本文将探讨如何有效捕获这些动态变化的数据。 ... [详细]
author-avatar
傻瓜等傻子
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有