作者:海岛迷情 | 来源:互联网 | 2023-09-18 16:52
title:Hadoop及Spark学习路线及资源收纳date:2018-11-1816:19:54tags:Hadoopcategories:大数据toc:tr
title: Hadoop及Spark学习路线及资源收纳 date: 2018-11-18 16:19:54 tags: Hadoop categories: 大数据 toc: true 点击查看我的博客:Josonlee’s Blog 版权声明:本文为博主原创文章,未经博主允许不得转载(https://blog.csdn.net/lzw2016/)
前言
本人大数据专业方向,收集学习一些相关文章,汇总如下。有些资源来源网络,出处不明,如有错误请告知,谢谢
资源不断更新中。。。
Hadoop
18.11.18
Hadoop新手学习指导 (出处: about云开发)
零基础学习hadoop到上手工作线路指导(初级篇) (出处: about云开发)
推荐一个博客分类博主LanceToBigData:Hadoop
一、学习路线图
Hadoop家族学习路线图 开篇必读
Hive学习路线图
Mahout学习路线图
二、编程实践
Hadoop历史版本安装
用Maven构建Hadoop项目
Hadoop编程调用HDFS
用Maven构建Mahout项目
Mahout推荐算法API详解
用MapReduce实现矩阵乘法
从源代码剖析Mahout推荐引擎
Mahout分步式程序开发 基于物品的协同过滤ItemCF
Mahout分步式程序开发 聚类Kmeans
PageRank算法并行实现
三、案例分析
海量Web日志分析 用Hadoop提取KPI统计指标
用Hadoop构建电影推荐系统
用Mahout构建职位推荐引擎
Mahout构建图书推荐系统
PeopleRank从社交网络中发现个体价值
作者:Lincoln 链接:https://www.zhihu.com/question/19795366/answer/24524910 来源:知乎
18.11.20 我来更新了
推荐博文、博主
小小默’s Blog,分类很乱但是内容确实不错
Hadoop MapReduce Tutorial,挺赞的
哥不是小萝莉·博客园,偏应用吧,概念什么的不咋地
我还搜到一本书,豆瓣上说不错,《Mapreduce2.0源码分析与编程实战》(那个,你们谁有csdn会员啊,csdn上有这个下载,50积分下不起啊。没找到完整版的,你们有的话分享我一下呗。。。)
Spark
18.11.18
书籍
《Spark快速大数据分析》[美] Holden Karau [美] Andy Konwinski [美] Patrick Wendell [加] Matei Zaharia 著
《Spark大数据处理:技术、应用与性能优化》
《Spark快速数据处理·美 Holden Karau 著》
18.11.20 我来更新了
上面推荐的书籍,我一一粗略的翻了一下,最好先看第一本《Spark快速大数据分析》
本人是选用scala作为开发语言,最近也在看这门编程语言。说实话,scala写起来真的是不习惯。。。无语。
最近在看厦大林子雨老师的书和视频——《spark 编程基础·scala版》,书是图书馆借的,挺薄一本讲义类型的书,感觉快速上手scala没问题,他也有配套视频Spark编程基础。有些资料可以上厦大的官网上找到,总之一句话,挺适合小白
慕课网有一门课程《学习Scala 进击大数据Spark生态圈》,收费的,当然你也懂(要善于使用网络资源),我个人是支持知识付费的。这门课我也跟进看了,是讲的scala语言。我感觉单看书就可以了,视频太费时间了 。
博客资源
关于Spark有哪些大牛们的博客?
徽沪一郎·博客园
等等
Spark Overview,这是官方文档,最新的2.4.0版本全英文版。一句话比那些书啊、博客啊好太多了。如果英文不好的话,这里有Spark Overvoew·中文版
就我个人而言,了解scala基础后,在翻完《Spark快速大数据分析》,然后刷文档是非常不错的
最近会停一段时间更新这篇文章,毕竟这么多东西看也要不少时间。我也会把我理解、学习笔记放上来,先这样吧。
点击查看我的博客:Josonlee’s Blog