热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

机器学习要解决的问题

机器学习为什么需要MLML需要解决的问题ML分类数据处理机器学习业务运维ML应用业务场景面试问题为什么需要ML自动化的升级、维护可以自我学习,自我改善解决算法过于复

机器学习

  • 为什么需要ML
  • ML需要解决的问题
  • ML分类
  • 数据处理
  • 机器学习
  • 业务运维
  • ML应用
  • 业务场景
  • 面试问题


为什么需要ML
  1. 自动化的升级、维护
    可以自我学习,自我改善
  2. 解决算法过于复杂的问题
  3. 解决没有具体算法的问题

ML需要解决的问题
  1. 建模问题
    从数据集中,统计、推理 学习到决策函数 y=f(X)y=f(X)y=f(X)

  2. 评估问题
    对于一个输入XXX,决策函数的输出yyy跟实际的值之间 有一定的误差,需要构建评估系统,根据误差来判断决策函数的优劣

  3. 优化问题
    找到最优解


ML分类
  1. 监督学习、无监督学习、半监督学习
    监督学习监督学习:数据集包含数据标记,S(X,y)
    无监督无监督:数据集不含数据标记,S(X)
    半监督半监督:两者的结合,先无监督划分类别,然后使用有监督训练模型

  2. 批量学习、增量学习

    批量学习批量学习:把学习过程、应用过程 分开,使用全部的训练数据来学习模型,然后在实际的场景中应用,效果不理想时,重回到训练过程。

    增量学习增量学习: 将学习过程 、应用过程统一起来,在实际应用中,以增量的方式学习新的内容,边学边用

  3. 基于实例的学习,基于模型的学习

    基于实例基于实例:根据以往的经验,寻找与未知样本xix_ixi相似的样本,以其输出作为预测结果

    基于模型基于模型:根据以往的经验,建立联系输入、输出的数学模型y=f(X)y=f(X)y=f(X),将未知样本xix_ixi代入模型,得预测结果


数据处理
  1. 数据的采集
    a. 数据检索、数据挖掘,根据已有的数据总结归纳出新的数据
    结构化结构化的数据:关系数据库
    非结构化非结构化的数据:文本、图片、语音、视频 等

    b. 爬虫,无数据的情况下,爬取网络数据

  2. 数据清洗
    处理缺失值、异常值

  3. 特征工程
    特征的抽取,选择,转换


机器学习
  1. 选择模型
  2. 训练模型
  3. 评估模型
  4. 测试模型

业务运维
  1. 应用模型
  2. 维度模型

ML应用
  1. 数据预测
  2. 股价预测
  3. 推荐引擎
  4. 自然语言识别
  5. 语音识别
  6. 图像识别
  7. 人脸识别

业务场景
  1. 分类问题
  2. 回归问题
  3. 聚类问题

面试问题

常见问题


推荐阅读
  • 智能全栈云风暴:AI引领的企业转型之路
    当提及AI,人们脑海中常浮现的是天才少年独自编写算法,瞬间点亮机器人的双眼。然而,真正的AI革命正由大型企业和机构推动,它们利用全栈全场景AI技术,实现数字化与智能化的深度转型。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • PHP 5.2.5 安装与配置指南
    本文详细介绍了 PHP 5.2.5 的安装和配置步骤,帮助开发者解决常见的环境配置问题,特别是上传图片时遇到的错误。通过本教程,您可以顺利搭建并优化 PHP 运行环境。 ... [详细]
  • 本文探讨了大型服务端开发过程中常见的几个误区,包括异步任务处理不当、日志同步模式使用、网络操作未设置超时、缓存命中率及响应时间未统计、单一缓存模式、分布式缓存加锁不当以及团队管理上的误区,旨在帮助开发者避免这些常见错误。 ... [详细]
  • 全能终端工具推荐:高效、免费、易用
    介绍一款备受好评的全能型终端工具——MobaXterm,它不仅功能强大,而且完全免费,适合各类用户使用。 ... [详细]
  • Spring Cloud因其强大的功能和灵活性,被誉为开发分布式系统的‘一站式’解决方案。它不仅简化了分布式系统中的常见模式实现,还被广泛应用于企业级生产环境中。本书内容详实,覆盖了从微服务基础到Spring Cloud的高级应用,适合各层次的开发者。 ... [详细]
  • 58同城的Elasticsearch应用与平台构建实践
    本文由58同城高级架构师于伯伟分享,由陈树昌编辑整理,内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用,特别是在58同城的实施案例,包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]
  • 探索Python编程的价值与应用
    本文探讨了学习Python的重要性和广泛的应用场景,从个人技能提升到职业发展的多个方面进行了详细解析。 ... [详细]
  • 数据集成策略:ETL与ELT架构对比及工具选择
    随着企业信息化的深入发展,‘数据孤岛’问题日益突出,阻碍了数据的有效利用与整合。本文探讨了如何通过构建数据仓库解决这一问题,重点分析了ETL与ELT两种数据处理架构的特点及适用场景,为企业选择合适的ETL工具提供了指导。 ... [详细]
  • 掌握Python岗位,你需要了解的关键技能
    最近,在社交平台脉脉上,一条关于Python岗位的消息引起了广泛关注。本文将探讨Python岗位的实际价值,并深入解析阿里巴巴等大公司在面试Python开发者时常见的问题。 ... [详细]
  • 解决getallheaders函数导致的500错误及8种服务器性能优化策略
    本文探讨了解决getallheaders函数引起的服务器500错误的方法,并介绍八种有效的服务器性能优化技术,包括内存数据库的应用、Spark RDD的使用、缓存策略的实施、SSD的引入、数据库优化、IO模型的选择、多核处理策略以及分布式部署方案。 ... [详细]
  • 大数据核心技术解析
    本文深入探讨了大数据技术的关键领域,包括数据的收集、预处理、存储管理、以及分析挖掘等方面,旨在提供一个全面的技术框架理解。 ... [详细]
  • 本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤,帮助开发者快速掌握这一实用技巧。 ... [详细]
  • 通常情况下,修改my.cnf配置文件后需要重启MySQL服务才能使新参数生效。然而,通过特定命令可以在不重启服务的情况下实现配置的即时更新。本文将详细介绍如何在线调整MySQL配置,并验证其有效性。 ... [详细]
  • 本文详细介绍了如何在 Android 中使用值动画(ValueAnimator)来动态调整 ImageView 的高度,并探讨了相关的关键属性和方法,包括图片填充后的高度、原始图片高度、动画变化因子以及布局重置等。 ... [详细]
author-avatar
大道废_796
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有