热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

机器学习算法入门介绍

本文共涉及三个问题:1.机器学习开发流程2.机器学习算法分类3.机器学习模型是什么我们做什么?分析大量数据分析具体业务应用常见算法特征工程、调

本文共涉及三个问题:


1.机器学习开发流程


2.机器学习算法分类


3.机器学习模型是什么


我们做什么?


  • 分析大量数据
  • 分析具体业务
  • 应用常见算法
  • 特征工程、调参数、优化

    我们应该怎么做?

  • 学会分析问题,使用机器学习算法的目的,想要算法完成何种任务。

  • 掌握算法基本思想,学会对问题用相应的算法解决。
  • 学会利用哭或者框架解决问题。

机器学习算法的判别依据

这里写图片描述


机器学习算法的分类

这里写图片描述

监督学习包括:特征值+目标值
无监督学习包括:特征值
监督学习中,分类算法的目标值是离散型,回归算法的目标值是连续型。


监督学习和无监督学习

这里写图片描述
监督学习(Supervised learning) :可以从输入数据中学习或建立一个模型,并以此模式推测新的结果。输入数据是由特征值和目标值组成。函数的输出值可以是一个连续的值(称为回归),也可以是一个离散的值(称为分类)。

分类是监督学习的一个核心问题,在监督学习中,当输出变量取有限个离散值时,预测问题变为分类问题。最基础的便是二分类问题,即判断是非,从两个类别中选择一个作为预测结果。

回归是监督学习的另一个核心问题,回归用于预测输入变量和输出变量之间的关系,输出是连续型的值。

无监督学习(unSupervised learning):可以从输入数据中学习或建立一个模型,并以此模式推测新的结果。输入数据是由特征值组成。

分类问题的应用:
这里写图片描述

回归问题的应用:
这里写图片描述


机器学习开发流程

1.原始数据,明确问题,要做什么(建立模型,根据数据类型划分应用种类)
2.数据的基本处理:pd处理数据(缺失值、合并表…)
3.特征工程(特征处理,特征抽取、降维…)
4.找到合适的算法进行预测
5.模型的评估,判定效果。
6.如果模型评估合格,达到期望值,如准确率百分之九十八以上。上线使用,以API形式提供。
7.如果模型评估不合格,则可以更换算法或者再次进行特征工程处理,然后再次进行模型评估。


机器学习模型是什么

模型:算法+数据


推荐阅读
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • 资源推荐 | TensorFlow官方中文教程助力英语非母语者学习
    来源:机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南,帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 2023年京东Android面试真题解析与经验分享
    本文由一位拥有6年Android开发经验的工程师撰写,详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]
  • Google最新推出的嵌入AI技术的便携式相机Clips现已上架,旨在通过人工智能技术自动捕捉用户生活中值得纪念的时刻,帮助人们减少照片数量过多的问题。 ... [详细]
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  •   上一篇博客中我们说到线性回归和逻辑回归之间隐隐约约好像有什么关系,到底是什么关系呢?我们就来探讨一下吧。(这一篇数学推导占了大多数,可能看起来会略有枯燥,但这本身就是一个把之前算法 ... [详细]
  • 深入剖析 DEX 赛道:从 60 大头部项目看五大趋势
    本文通过分析 60 大头部去中心化交易平台(DEX),揭示了当前 DEX 赛道的五大发展趋势,包括市场集中度、跨链协议、AMM+NFT 结合、新公链崛起以及稳定币和衍生品交易的增长潜力。 ... [详细]
  • 智能投顾机器人:创业者如何应对新挑战?
    随着智能投顾技术在二级市场的兴起,针对一级市场的智能投顾也逐渐崭露头角。近日,一款名为阿尔妮塔的人工智能创投机器人正式发布,它将如何改变投资人的工作方式和创业者的融资策略? ... [详细]
  • 深入浅出TensorFlow数据读写机制
    本文详细介绍TensorFlow中的数据读写操作,包括TFRecord文件的创建与读取,以及数据集(dataset)的相关概念和使用方法。 ... [详细]
  • 在互联网信息爆炸的时代,当用户需求模糊或难以通过精确查询表达时,推荐系统成为解决信息过载的有效手段。美团作为国内领先的O2O平台,通过深入分析用户行为,运用先进的机器学习技术优化推荐算法,提升用户体验。 ... [详细]
  • 机器学习公开课备忘录(三)机器学习算法的应用与大数据集
    机器学习公开课备忘录(三)机器学习算法的应用与大数据集对应机器学习公开课第六周和第10周机器学习算法模型的选择与评价1、对于一个data,可以将data划分为trainingset、t ... [详细]
  • 支持向量机(SVM)是一种基于统计学习理论的模型,主要在VC维和结构风险最小化的理论基础上发展而来。本文将探讨几种不同的SVM方法及其优化策略,旨在提高模型的效率和适用性。 ... [详细]
  • 2017年人工智能领域的十大里程碑事件回顾
    随着2018年的临近,我们一同回顾过去一年中人工智能领域的重要进展。这一年,无论是政策层面的支持,还是技术上的突破,都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]
  • 本文深入探讨了CART(分类与回归树)的基本原理及其在随机森林中的应用。重点介绍了CART的分裂准则、防止过拟合的方法、处理样本不平衡的策略以及其在回归问题中的应用。此外,还详细解释了随机森林的构建过程、样本均衡处理、OOB估计及特征重要性的计算。 ... [详细]
author-avatar
黑旦儿
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有