热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

机器学习自学过程及tips

001.找合适自己的书籍跟视频,快速搭建起知识系统书籍-教材类一类:机器学习实战-基于scikitlearn和TensorFlow(已刷完非神经网络部分,新手实践第一

 

001. 找合适自己的书籍跟视频,快速搭建起知识系统

    书籍-教材类

    一类:机器学习实战-基于scikit learn 和TensorFlow ( 已刷完非神经网络部分,新手实践第一本教材,对于整个机器学习的建模流程非常细致,偏实践)

       西瓜书 (已刷一遍,内容比较精炼,是给本科生研究生上课的教材,大概20多页一个主题,所以内容上有的细点,有的粗点,还包了半监督,规则学习,概率图,强化学习,计算理论,这部分说是给研究生上的,对于形成整体知识体系不错,不过重点的神经网络粗点;整体以介绍脉络为主,偏框架介绍,直接啃这个估计有些难度,老师在序言里也说了,有些话,虽寥寥几语,但都是千锤百炼的,没经验难悟)

       统计学习 (已买,O(∩_∩)O哈哈~,第二版,据说MCMC讲得挺清楚 )

       PRML~MLAPP~花书~动手深度学习~强化学习(未看,除了李沐的“动手”说是给花书打下手的,其他的都丫的“圣经” 。。。好多“宗教”。。)

    二类:偏某一主题领域类 ( 未购 )

         集成学习 (周志华,集成是竞赛神器,但实践中听说不顶用)

       迁移学习(迁移学习拿别人的来训练可以加速,拿来主义,实践方面方便丫)

         联邦学习 (谷歌搞的,微众走在前沿,解决数据的私密性跟共享这对矛盾的,听起来好像在监管加强的情况下,挺有前景的)

       生成对抗(应用目前个人印象中主要在图像跟视频领域,其他的领域再看了,读书少。。)

       图神经网络  ( 在团伙欺诈上有用,主要研究网络的,慢慢学习研究了)

    

    实践类

    百面机器学习  - (其实偏理论,重点把一些问题挑出来回答)

    美团机器学习实践 - (已购)

    阿里天池 - (竞赛经验类,网上其实很多比赛的经验,不过官方推的,又写成了书,肯定牛逼一点点)

    携程实践 - (已购)

    强化学习实践 - (有阿里的技术演进,也有其他的除强化学习圣经之外的几本,都没看) 

    精通特征工程 - (书不厚,内容不多,也没有很深,但有一些常规的处理技巧,具体的特征构建,应该挺看行业,看数据的,但本书会给你一些概念框架,慢慢往里面填咯)

    

    视频

      白板推导系列 ( 差不多已刷完,公式非常细致,展开的很详细,偏理论,无实践,强化学习跟GAN那块感觉还没到位,较弱,整体为大师兄带你飞,带得动)

       吴恩达机器学习(已刷完,小白入门好课,把数学公式推导都弱了,强调机器学习的过程跟思维,里面谈了很多建模过程中的经验,其实对有经验的选手也挺有启发的,应该,因为我是中白 ( > 小白)。。)

       李飞飞深度学习 (经典,名气大,肯定牛,未刷)

       徐亦达/

      台大林轩田 - 机器学习基石 (coursera好课,未学,***能传过来,肯定差不了)

      台大林轩田 - 机器学习技法(coursera好课,未学,***能传过来,肯定差不了)

      台大李宏毅 - 深度学习    (coursera好课,未学,***能传过来,肯定差不了)

        网课:

        https://cn.udacity.com/wp/free-course

        https://www.coursera.org/

        https://courses.cognitiveclass.ai/courses/course-v1:Cognitiveclass+PY0101EN+v2/course/

 

  其他:知乎高赞/微信人气公众号 ( 白话机器学习,手推机器学习算法等)/ 博客/CSDN

  

  关键是找自己看得懂的,激发兴趣,快速搭建知识体系,知道自己学习在什么位置。 

  没必要纠结于“经典”,经典没错误,经得起推敲,但往往深奥难懂。

  在最开始的时候,可能野生博客中有些表述不正式没那么“正统”,但是类比跟说明非常形象,这些感性认识跟心理过程不会在“经典”中出现,但是确实非常有用,拦在路上的有时差得就是那点直观感受,建立了,“感觉”就是“自己的”了。

 

002. 没必要盲目实现算法细节,转行以懂原理/公式/应用为主

  学习重点在公式,原理,技术细节

  能讲出优点,缺点,局限性,部分改进方法

  最好跟最佳应用实践结合起来,找到应用场景

  工业界主流模型要重点掌握

 

  但是: 在我这,只是教训了,作为一个之前在偏理论的数学系里学基础数学的,本科阶段习惯养成了“抠”的习惯,感觉没到公式层面,没到能形象的讲出个一二三的境界,总感觉没学。。。,其实 “快速学习,快速应用,够用即可” 感觉才是王道,快打慢。。

 

003. 写读书笔记,系统的记录,复习

  总结了,才是自己的;

  不复习,学多少,忘记多少;

  不系统化,成点不成网,知识零散不深刻,无法在需要的时候快速提取; 

 

004. 动手动手动手

  1)工具进阶:从Python开始吧,这是烹饪的锅碗瓢盆柴米油盐,经验等俺爬上去再总结Python的进阶了

  2)建模进阶,利用学到的一些“实践理论”,重点在建模的过程,建模思维的构建

      现实能接触到的模型 (公司,实验室)

      竞赛类提升 (初级挺有用,中阶后提升有限了)

      各类偏教学类教材 (有挺多模型的,跟几遍)

      Github - (这里是个宝,无限维度空间,利用率看个人水平了)

  3)  业务思维进阶:

      现实能接触到的模型 (公司,实验室,这部分是重点)

      各类跟业务结合的书籍 ( 强化学习阿里,风控类,美团/携程/阿里等机器学习实践)

      各类付费网课( 没钱买,能白嫖?)

      偏业务的数据分析

  4)其他重要而基础工程类工具,工作中这些的熟练度,能直接反映工作效率: 

      git/github - 版本控制

      TensorFlow / Pytorch /MXNet /Keras  - 深度学习的

      SQL - ETL工具,最基础的一步

      Google Cloud Platform - pipeline/BigQuery/等,现在都上云了,云上作业 

    

005. 参加Kaggle等实战

  真实化数据探索场景 

  由于002的教训,这块还没太多经验。。。

  

 


推荐阅读
author-avatar
小程序员
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有