热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

机器学习开篇之机器学习的分类

目录1引言2机器学习分类2.1监督学习(SupervisedLearning)2.1.1传统监督学习2.1.2非监督学习2.1.3半监督学习

目录

1  引言

2  机器学习分类

2.1  监督学习(Supervised Learning)

2.1.1  传统监督学习

2.1.2  非监督学习

2.1.3  半监督学习

2.1.4  其它分类

2.2  强化学习(Reinforcement Learning)

3  总结




1  引言

首先,我们给出四个机器学习任务


  1. 教计算机下棋
  2. 垃圾邮件识别,判断是否是垃圾邮件
  3. 人脸识别,识别这个人是谁
  4. 无人驾驶,从一个地点到达另一个地点

以上四个任务,可以把它分成两类,你会怎么分呢?分类的标准又是什么呢?

       我们可以将以上四个任务分为两类。仔细想想这四个任务,其实我们很容易想到1、4为一类,2、3为一类。那么我们的分类标准又是什么呢?根据我们上一节介绍的定义机器学习的三个量有任务T、性能指标P和经验E(见此篇文章的逻辑定义)。在上面的三个量中,我们只能根据经验E来进行分类。


2  机器学习分类


2.1  监督学习(Supervised Learning)

       在任务2和3中,我们需要进行垃圾邮件识别和人脸识别,经验E即为垃圾邮件数据和人脸数据,而这些数据都是通过人工收集的并输入到计算机中的。

       在垃圾邮件识别中,我们需要收集大量的垃圾邮件和非垃圾邮件数据(我们所称的训练数据),并告诉计算机这是垃圾邮件,这不是垃圾邮件,即给我们收集的数据打标签。最后在输入到计算机中。同样的,对于人脸识别,我们也需要大量人脸数据并告诉计算机这个人是谁(给数据打标签)最后在输入到计算机中。通过以上例子,我们也可以得到经验E就是训练数据样本以及对应数据标签的合集。

       我们把这类由人工采集数据以及相应标签输入计算机的机器学习方法称为监督学习

对于监督学习,我们还可以根据数据标签是否存在将其分为传统监督学习非监督学习半监督学习三类。


2.1.1  传统监督学习

       每一个数据都有对应标签,即称为传统监督学习。对于传统监督学习中,我们会学到的算法主要包括:


  • 支持向量机(Support Vector Machine)
  • 人工神经网络(Neural Networks)
  • 深度神经网络(Deep Neural Networks)

但不仅仅局限于这几种算法。


2.1.2  非监督学习

       所有的数据都没有对应的标签,即称为非监督学习。为什么没有标签的数据也能进行分类呢?这里举一个简单的例子。

       在一个二维空间中有一些样本点,我们不知道这些训练样本的数据类别,这里,我们需要假设一个条件:在空间中相聚更近的点即为一类,如果这个假设成立我们就可以根据样本空间的信息,设计算法将其聚集为两类,从而实现没有标签的机器学习,即无监督学习。主要用到的算法有:


  • 聚类算法(Clustering)
  • EM算法(Expectation-Maximization)
  • 主成分分析(Principle Component Analysis)

但不仅仅局限于这几种算法。


2.1.3  半监督学习

       一部分数据有标签,一部分数据没有标签,即称为半监督学习。半监督学习的运用非常广泛,随着互联网的不断发展,数据量不断增大。进行数据标签的成本也越来越大。因此,利用少量标注数据和大量没有标注的数据训练一个更好的机器学习算法,成为了机器学习领域的热点之一。



2.1.4  其它分类

       另外,我们还可以根据标签的固有属性将监督学习分为两类。


  • 分类(Classification):标签是离散的值
  • 回归(Regression):标签是连续的值

       对于分类,例如在人脸识别中,我们把两张图片是同一个人记为1,不是同一个人记为0,这些标签就是由离散的0和1组成的,因此是分类问题。

       对于回归,标签是连续的值。例如设计算法预测房价走势、股票走势、预测温度等等都属于回归问题。其实在某种情况下,分类和回归的界限是非常模糊的,因为连续和离散之间的关系也是非常模糊的,它们二者可以相互转化。


2.2  强化学习(Reinforcement Learning)

       在任务1和4中,经验E则不是人为进行数据收集获得的,而是由计算机与外界环境进行互动获得的。计算机随机的产生行为,同时获得改行为的结果,而我们的程序需要通过定义这些行为的收益函数,对行为进行奖励或者惩罚。例如计算机下棋,如果下赢了,我们就进行奖励;如果下输了,我们就进行惩罚。同样的对于自动驾驶,如果到达终点,我们就进行奖励;如果没有到达终点或者中途出了事故,我们就进行惩罚。

       同时,我们需要设计算法让计算机自动的改变自己的行为模式来最大化收益函数,完成机器学习任务的过程。即通过计算机与环境的互动逐渐强化自己的行为模式达到一个最佳的效果,称之为强化学习


3  总结

 

       首先,根据任务是否需要与外界交互获得经验E,将机器学习分为两大类;一类是不需要与外界环境交互,人工收集数据监督学习,另一类是需要与外界交互获得强化学习

       其次,我们对监督学习进行了细致的分类。根据训练样本是否有标签我们将其分为三类:


  1. 训练数据部都对应标签——传统监督学习
  2. 训练数据部都没有标签——监督学习
  3. 训练数据一部分有标签,一部分没有标签——监督学习

       另外,监督学习还有另一种分类方法,根据标签是否是离散的可以分为两类:一类是训练数据对应标签,全部是离散的值,我们称为分类;另一类是其训练数据对应标签为连续的值,我们称为回归

如有不对,敬请指正

觉得好的小伙伴就点个赞吧~~

 


推荐阅读
  • 聊聊 中国人工智能科技产业 区域竞争力分析及趋势
    原文链接:聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数(2021ÿ ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • 深度学习与神经网络——邱锡鹏
    深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络:一种以(人工))神经元为基本单元的模型深度学习:一类机器学习问题,主要解决贡献度分配问题知识结构:路线图:顶 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 开源真香 离线识别率高 Python 人脸识别系统
    本文主要介绍关于python,人工智能,计算机视觉的知识点,对【开源真香离线识别率高Python人脸识别系统】和【】有兴趣的朋友可以看下由【000X000】投稿的技术文章,希望该技术和经验能帮到 ... [详细]
  • 北交桑基韬:“超”人的机器学习,非语义特征的得与失
    点击蓝字关注我们AITIME欢迎每一位AI爱好者的加入!作者|桑基韬整理|维克多人工智能目前最大的“拦路虎”是不可信赖性,以深度学习为基础的算法 ... [详细]
  • 65位高校教师接龙晒工资!给打算入高校的研究生们参考!
    本文转载自:募格学术|来源:麦可思研究综合整理自小木虫论坛前有清华教授被骗千万,后有某重点高校青年教师晒出月薪900的工资条, ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • cs231n Lecture 3 线性分类笔记(一)
    内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注:中文翻译 ... [详细]
  • 2017亚马逊人工智能奖公布:他们的AI有什么不同?
    事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器 ... [详细]
  • 论文笔记_S2D.48_2017IEEE RAL_单视图和多视图深度融合
    基本情况题目:Single-viewandmulti-viewdepthfusion出处:FcilJM,ConchaA,MontesanoL,etal ... [详细]
author-avatar
你爱我像谁丶灬
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有