作者:ciaos | 来源:互联网 | 2024-09-27 12:06
设定一个非常清晰的目标清晰的目标就比如说你要做NLP,你要知道NLP的应用有智能问答,机器翻译,搜索引擎等等。然后如果你要做智能问答你要知道现在最发达的技术是深度学习,使用的算法有
设定一个非常清晰的目标
清晰的目标就比如说你要做NLP,你要知道NLP的应用有智能问答,机器翻译,搜索引擎等等。然后如果你要做智能问答你要知道现在最发达的技术是深度学习,使用的算法有RNN/LSTM/Seq2Seq/等等一系列。而我的清晰目标是在实习的时候给我的任务。当任务很明确的时候,所需要的语言就明确了,所要学习的算法也就明确了,很多东西就顺理成章了不用一头乱撞了。
机器学习是人工智能的一种,深度学习是机器学习的一种。学AI先学机器学习。
理论知识对于AI算法工程师极其重要。敲代码只是思路的一个实现过程。这里的“算法”和计算机CS的“算法”还不太一样,AI算法是偏数学推导的,所以数学底子还是需要点的,学的越深,要求越高。面试的时候,很少让手写代码,90%都是在问模型抠算法细节。
按照数据集有没有Y值可以将机器学习分为监督学习、半监督学习和无监督学习。监督学习是分类算法,无监督学习是聚类算法。
机器学习如何入门
机器学习的三大块:传统的机器学习ML、图像处理CV、自然语言处理NLP
首先推荐一个入门神器:
ML入门该参加的赛题(Titanic)
图像入门该参加的赛题(数字识别)
NLP入门该参加的赛题(情感分析、quora问句语义匹配)
自学如何寻找学习资料?
1、Kaggle(www.kaggle.com)
这是一个世界级的最权威的机器学习比赛,已被谷歌收购。赛题覆盖传统机器学习、nlp、图像处理等,而且都是很实际的问题,来自各行各业。kaggle是数一数二完善的ML社区了,赛题开放的数据集就很有用,非常适合新手练手。对优秀的kaggler也提供工作机会。
上面的赛题不仅很有代表性,还有很多免费的优秀的数据集供你使用,要知道收集数据是机器学习的第一大难题,它就帮你解决了。入门不用立马参加比赛,把数据下载下来,尽情折腾就好了,要是没有思路,去网上搜别人的解题笔记和代码借鉴一下也很美好~因为这是大家都争相打榜的比赛,所以你并不孤单。
2、github(www.github.com)
3、StackOverFlow(www.stackoverflow.com)
代码报错找它,代码不会敲找它!所有与代码相关的坑,基本都有人踩过啦
4、csdn(www.csdn.net)
最接地气的博客聚集地,最常看的网页之一,一般用来搜索细节知识点或者代码报错时
5、sklearn(scikit-learn.org/stable)
专业做机器学习100年!各算法各技巧的例子code应有尽有
6、medium(medium.com)
创办人是Twitter的创始人,推崇优质内容,国内很多AI公众大号的搬运都来自于这里,medium里每个作者都有自己独特的见解,值得学习和开拓眼界,需要科学上网
7、towards data science(towardsdatascience.com)
与medium很像,需要科学上网
8、google AI blog(ai.googleblog.com)
谷歌的AI团队维护的博客,每天至少更新一篇技术博客。刚在上海开的谷歌开发者大会宣布将会免费开放机器学习课程,值得关注一下,毕竟是AI巨头
有口碑的AI公开课平台
coursera(www.coursera.org/browse)
吴恩达(Andrew Ng)机器学习
deeplearning.ai(www.deeplearning.ai)
fast.ai(www.fast.ai)
专注于深度学习。Fast.ai的创始人就蛮有意思的,是横扫kaggle图像处理的高手,不摆架子,也不故弄玄虚。中心思想就是深度学习很简单,不要怕。fast.ai有博客和社区。Jeremy和Rachel鼓励撰写博客,构建项目,在会议中进行讨论等活动,以实力来代替传统证书的证明作用。
udacity(in.udacity.com)
有中文版,课程覆盖编程基础,机器学习,深度学习等。
网易云课堂
实用的小技巧
浏览器首推 chrome
搜索问题一定用google,如果没解决是你的问题不是google的锅