监督学习和无监督学习_第四天：讲透监督学习，无监督学习和强化学习

作者：mobiledu2502908793 | 来源：互联网 | 2023-06-25 19:37

监督学习，无监督学习和强化学习强调的是机器学习模型不同的学习方式。首先给一个通俗的解释：例如你要参加一场考试，首先发给了你很多模拟卷子和答

监督学习&＃xff0c;无监督学习和强化学习强调的是机器学习模型不同的学习方式。首先给一个通俗的解释&＃xff1a;

例如你要参加一场考试&＃xff0c;首先发给了你很多模拟卷子和答案&＃xff0c;你做了模拟卷子&＃xff0c;对了答案&＃xff0c;学习了相关的知识点&＃xff0c;然后再考试&＃xff0c;这就是监督学习。模拟卷子和答案是监督学习中的样本数据。

如果啥卷子没做你就去考试&＃xff0c;肯定是大脑一片空白&＃xff0c;此时只能“三长一短选最短&＃xff0c;三短一长选最长&＃xff0c;两长两短就选B&＃xff0c;同长同短就选A&＃xff0c;参差不齐就选C”了&＃xff0c;这种就是从答案自身的特点进行判断&＃xff0c;属于无监督学习。

最后还有一种情况&＃xff0c;开始你什么都不知道&＃xff0c;然后去考试&＃xff0c;考完后&＃xff0c;告诉你考试的分数&＃xff0c;然后要你重新再考&＃xff0c;这时你肯定会分析前面考试时不确定的题目&＃xff0c;重新来做&＃xff0c;然后考完后&＃xff0c;再告诉你考试的分数&＃xff0c;再重新考试&＃xff0c;通过多次考试的机会&＃xff0c;你不断的总结和改进前面答题的问题&＃xff0c;就可以越考越好了&＃xff0c;这就是强化学习。

由上面的例子可知&＃xff0c;监督学习&＃xff0c;无监督学习和强化学习都符合人类在某种情况下的学习方式&＃xff0c;一般来说&＃xff0c;人们在成长过程中往往是多种学习方式的结合&＃xff0c;因此机器学习后来又出现了半监督学习&＃xff0c;自监督学习等新的流派。

由前面的例子可以知道&＃xff0c;在样本数据可获得的前提下&＃xff0c;监督学习是比较靠谱的&＃xff0c;所以机器学习里监督学习是影响最为广泛的流派。著名的深度学习就是监督学习的典型代表。在监督学习中&＃xff0c;需要大量有标记的监督样本(类似于前面所说的模拟卷子和答案)&＃xff0c;然后根据样本(已知输入和输出的数据)来训练模型&＃xff0c;在这一过程中机器学习模型不断的通过训练样本来指导算法不断改进。如果输出的结果不正确&＃xff0c;那么这个错误结果与期望正确结果之间的误差将作为纠正信号传回到模型&＃xff0c;纠正模型的改进。由于监督学习中&＃xff0c;样本的输入和输出都是预先给定的&＃xff0c;所以监督学习的准确率很高。然而&＃xff0c;在现实世界中&＃xff0c;受限于对求解问题的认知和获取样本的成本&＃xff0c;往往在很多场景中难以获得大量的样本数据&＃xff0c;因此就需要无监督学习或强化学习了。

监督学习

与监督学习不同&＃xff0c;无监督学习只有输入数据&＃xff0c;没有标记好的输出数据&＃xff0c;所以只能够通过探索数据中隐含的模式和分布来进行学习(例如“三长一短选最短&＃xff0c;三短一长选最长”)&＃xff0c;所以难以独立得到高质量的预测结果&＃xff0c;一般主要应用在聚类&＃xff0c;异常检测等任务当中。

无监督学习

强化学习突破了监督与无监督学习的限制&＃xff0c;通过奖励函数(例如考试的得分)的反馈来帮助机器改进自身的行为和算法。强化学习中的智能体(考试的人)通过行为(做题)与环境(考试)相互作用&＃xff0c;而环境(考试)通过奖励函数(考试的得分)来帮助智能体调整做出行为决策的策略函数&＃xff0c;从而在不断的循环中得到表现优异的行为策略(解题的方法)。它十分适合用于训练控制算法、比赛和游戏等场景。

强化学习

不同学习方法的对比

1. 监督学习 v.s 强化学习

在监督学习中对应的输入输出数据(样本数据)扮演了监督的角色&＃xff0c;将其中蕴含的知识通过训练赋予模型&＃xff0c;模型通过数据的纠正信号不断学习最终形成能较好理解数据并准确预测的算法。而在强化学习中监督数据并不是必须的(可以不需要样本)&＃xff0c;主体可以通过与环境相互作用尝试很多方法和表现并调节。我们可以想象围棋的例子&＃xff0c;在最终胜负揭晓之前我们需要执行很多次操作&＃xff0c;每一次操作都有很多种可能&＃xff0c;为这一任务建立监督学习的知识是十分复杂的工作。而强化学习则可以根据与环境相互作用后收到的反馈建立起自己对于棋局的理解。

当开始学习后它便可以不断地充实自己的经验并改善表现。这就是强化学习与监督学习最大的不同了。虽然两种模型都建立了某种输入到输出的映射关系&＃xff0c;但强化学习却是通过奖励函数来帮助系统不断改进模型的。这样的好处在于&＃xff0c;人工智能模型经过监督学习往往最多能达到样本的水平(也就是标记样本的人的水平)&＃xff0c;而强化学习则通过探索有一定的概率能够超越人类&＃xff0c;成为超级智能体。

2.强化学习 v.s 无监督学习

强化学习和无监督学习均不需要训练数据。强化学习是通过智能体(策略)来对输入和输入进行衔接&＃xff0c;但无监督学习则在输入和输出之间没有任何的链接。在无监督学习中&＃xff0c;机器的主要任务是对数据中的模式进行识别而不是建立映射关系。如果我们想要建立一个用户美食系统&＃xff0c;强化学习可以通过用户的使用反馈不断改进&＃xff0c;并建立起用户喜欢的食物偏好实现更精准的菜品设计。而对于无监督学习来说&＃xff0c;则只能从用户点过的菜来分析用户的喜好&＃xff0c;并不能获得用户的真实反馈。

参考文献&＃xff1a;

[1] https://www.toutiao.com/a6540418366522262023/

关注“人工智能教育”公众号&＃xff0c;您将获得我们精选的机器学习教材和代码&＃xff0c;谢谢&＃xff01;

推荐阅读

自然语言处理
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
svm
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
神经网络
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
pytorch
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
神经网络
3年半巨亏242亿！商汤高估了深度学习，下错了棋？

转自：新智元三年半研发开支近70亿，累计亏损242亿。AI这门生意好像越来越不好做了。近日，商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]

蜡笔小新 2023-10-17 16:41:52
自动驾驶
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
神经网络
2017亚马逊人工智能奖公布：他们的AI有什么不同？

事实上，在我们周围，“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊，我们的世界正在变成一个机器 ... [详细]

蜡笔小新 2023-10-16 19:50:15
深度
阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾

本文介绍了阿里Treebased Deep Match(TDM)的学习笔记，同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法，再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用，并介绍了TDM的背景和优势。最后，文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]

蜡笔小新 2023-12-14 19:24:58
深度
词袋模型的通俗介绍

词,袋, ... [详细]

蜡笔小新 2023-12-12 08:20:03
数据挖掘
Python实验报告文档中的文件和数据格式化操作

本文介绍了Python语言程序设计中文件和数据格式化的操作，包括使用np.savetext保存文本文件，对文本文件和二进制文件进行统一的操作步骤，以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]

蜡笔小新 2023-12-10 17:02:16
pytorch
mapreduce数据去重的实现方法

本文介绍了利用mapreduce实现数据去重的方法，同时还介绍了人工智能AI领域中常用的框架和工具，包括Keras、PyTorch、MXNet、TensorFlow和PaddlePaddle，并提供了深度学习实战的代码下载链接。 ... [详细]

蜡笔小新 2023-12-10 15:56:37
数据挖掘
数据结构与算法的重要性及基本概念、存储结构和算法分析

数据结构与算法在编程领域中的重要性不可忽视，无论从事何种岗位，都需要掌握数据结构和算法。本文介绍了数据结构与算法的基本概念、存储结构和算法分析。其中包括线性结构、树结构、图结构、栈、队列、串、查找、排序等内容。此外，还介绍了图论算法、贪婪算法、分治算法、动态规划、随机化算法和回溯算法等高级数据结构和算法。掌握这些知识对于提高编程能力、解决问题具有重要意义。 ... [详细]

蜡笔小新 2023-12-09 10:17:45
自动驾驶
老牌医药收割AI红利：先投个15亿美元抢中国人才

萧箫发自凹非寺量子位报道|公众号QbitAI没想到，一场大会把我的“刻板印象”攻破了。2021世界人工智能大会现场，能看见不少熟悉的身影， ... [详细]

蜡笔小新 2023-10-17 17:40:25
pytorch
python打卡记录去重_Python零基础学习笔记与记录之一（了解Python这个小伙伴）

本人学习笔记，知识点均摘自于网络，用于学习和交流(如未注明出处，请提醒，将及时更正，谢谢)OS:我学习是为了上 ... [详细]

蜡笔小新 2023-10-17 16:05:58
自然语言处理
当写稿机器人真有了观点和感情，我们是该高兴还是恐惧？

目前，写稿机器人多是撰写以数据为主的稿件，当它们能够为文章注入观点之时，这些观点真的是其所“想”吗？最近，《南 ... [详细]

蜡笔小新 2023-10-17 15:17:11

mobiledu2502908793

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章