作者:黑旦儿 | 来源:互联网 | 2024-10-20 11:42
本文共涉及三个问题:
1.机器学习开发流程
2.机器学习算法分类
3.机器学习模型是什么
我们做什么?
机器学习算法的判别依据
机器学习算法的分类
监督学习包括:特征值+目标值
无监督学习包括:特征值
监督学习中,分类算法的目标值是离散型,回归算法的目标值是连续型。
监督学习和无监督学习
监督学习(Supervised learning) :可以从输入数据中学习或建立一个模型,并以此模式推测新的结果。输入数据是由特征值和目标值组成。函数的输出值可以是一个连续的值(称为回归),也可以是一个离散的值(称为分类)。
分类是监督学习的一个核心问题,在监督学习中,当输出变量取有限个离散值时,预测问题变为分类问题。最基础的便是二分类问题,即判断是非,从两个类别中选择一个作为预测结果。
回归是监督学习的另一个核心问题,回归用于预测输入变量和输出变量之间的关系,输出是连续型的值。
无监督学习(unSupervised learning):可以从输入数据中学习或建立一个模型,并以此模式推测新的结果。输入数据是由特征值组成。
分类问题的应用:
回归问题的应用:
机器学习开发流程
1.原始数据,明确问题,要做什么(建立模型,根据数据类型划分应用种类)
2.数据的基本处理:pd处理数据(缺失值、合并表…)
3.特征工程(特征处理,特征抽取、降维…)
4.找到合适的算法进行预测
5.模型的评估,判定效果。
6.如果模型评估合格,达到期望值,如准确率百分之九十八以上。上线使用,以API形式提供。
7.如果模型评估不合格,则可以更换算法或者再次进行特征工程处理,然后再次进行模型评估。
机器学习模型是什么
模型:算法+数据