热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

读lt;大数据日知录:架构与算法gt;有感

前一段时间,一个老师建议我能够学学大数据和机器学习,他说这必定是今后的热点,学会了,你就是香饽饽。在此之前,我对大数据,机器学习并没有非常深的认识,总觉得它们是那么的缥缈,高不可攀

前一段时间, 一个老师建议我能够学学 '大数据' '机器学习', 他说这必定是今后的热点, 学会了, 你就是香饽饽。在此之前, 我对大数据, 机器学习并没有非常深的认识, 总觉得它们是那么的缥缈, 高不可攀, 也没想着深入学习。

之后, 一次偶然的机会, 在csdn官方博客上看到了这种一个活动 

  

[置顶] 话题讨论&征文--谈论大数据时我们在谈什么

于是, 从下载试读样章, 到正式读书, 開始了学习大数据的过程...


到今天, 差点儿相同两周过去了, 马马虎虎过了一遍, 感触颇多。 以下简单评价下我看完后对这本书的认识。

(ps: 在此之前, 我对大数据等全然没有概念, 接下去的言论, 仅仅是个人的观点, 不喜勿喷)

本书前言中提到:

"从传统IT 业到互联网、互联网到移动互联网,从以智能手机和Pad 为主要终端载体的移动互联网到可穿戴设备的移动互联网。然后再到万物互联的物联网,这一定是不可违抗的发展规律和前进方向。伴随着这个趋势必定有越来越多、形态越来越丰富的超量数据不断产生。而大数据明显是由此衍生出来的明白且必定的发展趋势。 "

   -----<大数据日知录&#xff1a;架构与算法>


看到这, 给我一种感觉, 大数据无处不在, 大数据高贵冷艳...直到如今, 我才干确定, 它确实是这样!

读完最大的感受是有助于建立大数据技术的总体大局观

这书从大数据基本理论、各种架构组件以及算法几个角度归纳了眼下常见的大数据技术&#xff0c;理论部分讲的还挺透彻。也包含了方方面面的技术点&#xff0c;真挺全面&#xff0c;能够当个工具书。

这本书蕴涵的的内容比較多——从大数据的存储结构、内容管理&#xff0c;讲到集群任务调度、分布式数据通信、流行的各类新式数据库的介绍&#xff0c;还有基于机器学习技术的大数据实现以及大数据挖掘应用范例等内容&#xff0c;既包罗万象&#xff0c;又深入浅出。17个章节, 17个不同内容, 尽管有所差别, 可是密切相关, 它们分别从大数据基础理论、大数据系统体系结构、大数据存储&#xff0c;以及包含批处理、流式计算、交互式数据分析、图数据库、并行机器学习的架构与算法以及增量计算等技术, 从不同角度描写叙述了同一个知识--"大数据"&#xff0c;可见作者张俊林扎实的功底。尽管我不是专业从事大数据行业的, 可是仅凭我的一些计算机知识, 也能把这本书读下来, 可见作者写作水平之高。

17章中, 我看的最认真的应该是图数据库(毕竟是样章, 最早看), 等我看完之后, 个人觉得这是书中的一个亮点, (不然也不会拿来当样章), 相同的, 数据结构、集群资源管理这两章也非常不错。 就说图数据库这一章吧, 有完整的理论归纳也有详细小样例&#xff0c;体系感强,也好理解。

喜欢这本书的另外一个理由是图文并茂, 比方在介绍TAO的跨数据中心架构的时候, 给了一张非常直观的图,例如以下。我想这比写再多的文字描写叙述都管用。另外, 在介绍一些知识点的时候, 总会举出非常贴切的样例, 便于读者理解。

比方介绍图的时候, 引入Facebook关系图来描写叙述, 十分贴切。

"Facebook是眼下世界上最著名的社交站点, 假设从数据抽象的角度来看, Facebook的社交图不仅包含好友之间的关系, 还包含人与实体以及实体与实体之间的关系, 每一个用户, 每一个页面, 每张图片, 每一个应用。每一个地点以及每一个评论都能够作为独立的实体......"



另外, 看的比較蛋疼的一章应该是机器学习这一章了。

内容尽管非常有用。覆盖了多数经常使用的互联网应用&#xff0c;也是实际使用中的经常使用算法&#xff0c;但缺点也非常明显&#xff0c;感觉对于刚開始学习的人(就像我这样从没学习过的...)有点深&#xff0c;要具备一些主要的机器学习知识恐怕才干理解。

 所以我想等先看一些入门书籍过后, 再来又一次读读这个章节。

另外, 每一个章节前面都有一小段歌词, 尽管我没看出有什么名堂, 可是感觉挺好的, 重拾好心情, 開始一个新章节的学习。

最后呢, 借用之前学习大数据看到的一段话: "大数据就是互联网发展到现今阶段的一种表象或特征而已&#xff0c;没有必要神话它或对它保持敬畏之心。在以云计算为代表的技术创新大幕的衬托下&#xff0c;这些原本非常难收集和使用的数据開始easy被利用起来了&#xff0c;通过各行各业的不断创新&#xff0c;大数据会逐步为人类创造很多其它的价值。" 

假设, 你想从理论方面学习大数据

(理论是认知的必经途径&#xff0c;也是被广泛认同和传播的基线。在这里从大数据的特征定义理解行业对大数据的总体描绘和定性&#xff1b;从对大数据价值的探讨来深入解析大数据的珍贵所在&#xff1b;洞悉大数据的发展趋势&#xff1b;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈)

或者, 你想从技术方面学习大数据

(技术是大数据价值体现的手段和前进的基石。在这里分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从採集、处理、存储到形成结果的整个过程。)

再不然, 你想从实践方面学习大数据

(实践是大数据的终于价值体现。在这里分别从互联网的大数据。政府的大数据&#xff0c;企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图)。

 我都觉得, <大数据日知录:架构与算法>是一本你值得一读的书,。


非常庆幸,我能静下心看了这本书。




推荐阅读
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 14亿人的大项目,腾讯云数据库拿下!
    全国人 ... [详细]
  • 【回顾】聚焦DTCC | 巨杉数据库与您相约DTCC 数据库技术大会
    2018年5月10-12日,第九届中国数据库技术大会(DTCC2018)将以“数领先机•智赢未来”为主题,设定2大主会场及20个技术专场,邀请来自国内外互联网、金融、教育等行业百余 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • 数字账号安全与数据资产问题的研究及解决方案
    本文研究了数字账号安全与数据资产问题,并提出了解决方案。近期,大量QQ账号被盗事件引起了广泛关注。欺诈者对数字账号的价值认识超过了账号主人,因此他们不断攻击和盗用账号。然而,平台和账号主人对账号安全问题的态度不正确,只有用户自身意识到问题的严重性并采取行动,才能推动平台优先解决这些问题。本文旨在提醒用户关注账号安全,并呼吁平台承担起更多的责任。令牌云团队对此进行了长期深入的研究,并提出了相应的解决方案。 ... [详细]
  • Oracle优化新常态的五大禁止及其性能隐患
    本文介绍了Oracle优化新常态中的五大禁止措施,包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB,并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况,并提出了解决方案。 ... [详细]
  • 本文介绍了OpenStack的逻辑概念以及其构成简介,包括了软件开源项目、基础设施资源管理平台、三大核心组件等内容。同时还介绍了Horizon(UI模块)等相关信息。 ... [详细]
author-avatar
裂爆传说_818
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有