热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

机器学习算法入门介绍

本文共涉及三个问题:1.机器学习开发流程2.机器学习算法分类3.机器学习模型是什么我们做什么?分析大量数据分析具体业务应用常见算法特征工程、调

本文共涉及三个问题:


1.机器学习开发流程


2.机器学习算法分类


3.机器学习模型是什么


我们做什么?


  • 分析大量数据
  • 分析具体业务
  • 应用常见算法
  • 特征工程、调参数、优化

    我们应该怎么做?

  • 学会分析问题,使用机器学习算法的目的,想要算法完成何种任务。

  • 掌握算法基本思想,学会对问题用相应的算法解决。
  • 学会利用哭或者框架解决问题。

机器学习算法的判别依据

这里写图片描述


机器学习算法的分类

这里写图片描述

监督学习包括:特征值+目标值
无监督学习包括:特征值
监督学习中,分类算法的目标值是离散型,回归算法的目标值是连续型。


监督学习和无监督学习

这里写图片描述
监督学习(Supervised learning) :可以从输入数据中学习或建立一个模型,并以此模式推测新的结果。输入数据是由特征值和目标值组成。函数的输出值可以是一个连续的值(称为回归),也可以是一个离散的值(称为分类)。

分类是监督学习的一个核心问题,在监督学习中,当输出变量取有限个离散值时,预测问题变为分类问题。最基础的便是二分类问题,即判断是非,从两个类别中选择一个作为预测结果。

回归是监督学习的另一个核心问题,回归用于预测输入变量和输出变量之间的关系,输出是连续型的值。

无监督学习(unSupervised learning):可以从输入数据中学习或建立一个模型,并以此模式推测新的结果。输入数据是由特征值组成。

分类问题的应用:
这里写图片描述

回归问题的应用:
这里写图片描述


机器学习开发流程

1.原始数据,明确问题,要做什么(建立模型,根据数据类型划分应用种类)
2.数据的基本处理:pd处理数据(缺失值、合并表…)
3.特征工程(特征处理,特征抽取、降维…)
4.找到合适的算法进行预测
5.模型的评估,判定效果。
6.如果模型评估合格,达到期望值,如准确率百分之九十八以上。上线使用,以API形式提供。
7.如果模型评估不合格,则可以更换算法或者再次进行特征工程处理,然后再次进行模型评估。


机器学习模型是什么

模型:算法+数据


推荐阅读
  • 深入解析层次聚类算法
    本文详细介绍了层次聚类算法的基本原理,包括其通过构建层次结构来分类样本的特点,以及自底向上(凝聚)和自顶向下(分裂)两种主要的聚类策略。文章还探讨了不同距离度量方法对聚类效果的影响,并提供了具体的参数设置指导。 ... [详细]
  • 对象存储与块存储、文件存储等对比
    看到一篇文档,讲对象存储,好奇,搜索文章,摘抄,学习记录!背景:传统存储在面对海量非结构化数据时,在存储、分享与容灾上面临很大的挑战,主要表现在以下几个方面:传统存储并非为非结 ... [详细]
  • H5技术实现经典游戏《贪吃蛇》
    本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术,我们将探讨如何构建这款游戏的两种主要玩法:积分闯关和无尽模式。 ... [详细]
  • 本周三大青年学术分享会即将开启
    由雷锋网旗下的AI研习社主办,旨在促进AI领域的知识共享和技术交流。通过邀请来自学术界和工业界的专家进行在线分享,活动致力于搭建一个连接理论与实践的平台。 ... [详细]
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • 我的读书清单(持续更新)201705311.《一千零一夜》2006(四五年级)2.《中华上下五千年》2008(初一)3.《鲁滨孙漂流记》2008(初二)4.《钢铁是怎样炼成的》20 ... [详细]
  • AI炼金术:KNN分类器的构建与应用
    本文介绍了如何使用Python及其相关库(如NumPy、scikit-learn和matplotlib)构建KNN分类器模型。通过详细的数据准备、模型训练及新样本预测的过程,展示KNN算法的实际操作步骤。 ... [详细]
  • 为助力科研人员提升数据处理与图形展示能力,活动家携手北京市计算中心推出2017年R语言数据可视化研讨会。详情及注册信息请点击链接查看。 ... [详细]
  • 本文详细介绍了数据分析和机器学习的基本流程,包括数据获取、特征工程、模型训练等关键步骤。通过实际案例解析,帮助读者理解如何从原始数据中提取有价值的信息,并构建有效的预测模型。 ... [详细]
  • 计算机学报精选论文概览(2020-2022)
    本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文,旨在为即将投稿的研究者提供参考。 ... [详细]
  • 在将 Android Studio 从 3.0 升级到 3.1 版本后,遇到项目无法正常编译的问题,具体错误信息为:org.gradle.api.tasks.TaskExecutionException: Execution failed for task ':app:processDemoProductDebugResources'。 ... [详细]
  • 实践指南:使用Express、Create React App与MongoDB搭建React开发环境
    本文详细介绍了如何利用Express、Create React App和MongoDB构建一个高效的React应用开发环境,旨在为开发者提供一套完整的解决方案,包括环境搭建、数据模拟及前后端交互。 ... [详细]
  • 2017年软件开发领域的七大变革
    随着技术的不断进步,2017年对软件开发人员而言将充满挑战与机遇。本文探讨了开发人员需要适应的七个关键变化,包括人工智能、聊天机器人、容器技术、应用程序版本控制、云测试环境、大众开发者崛起以及系统管理的云迁移。 ... [详细]
  • 腾讯云移动推送TPNS(Tencent Push Notification Service)为APP开发者和运营人员提供了一站式、高效、稳定的推送解决方案,帮助提升用户活跃度和运营效率。 ... [详细]
  • 专业人士如何做自媒体 ... [详细]
author-avatar
黑旦儿
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有