热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

机器学习要解决的问题

机器学习为什么需要MLML需要解决的问题ML分类数据处理机器学习业务运维ML应用业务场景面试问题为什么需要ML自动化的升级、维护可以自我学习,自我改善解决算法过于复

机器学习

  • 为什么需要ML
  • ML需要解决的问题
  • ML分类
  • 数据处理
  • 机器学习
  • 业务运维
  • ML应用
  • 业务场景
  • 面试问题


为什么需要ML
  1. 自动化的升级、维护
    可以自我学习,自我改善
  2. 解决算法过于复杂的问题
  3. 解决没有具体算法的问题

ML需要解决的问题
  1. 建模问题
    从数据集中,统计、推理 学习到决策函数 y=f(X)y=f(X)y=f(X)

  2. 评估问题
    对于一个输入XXX,决策函数的输出yyy跟实际的值之间 有一定的误差,需要构建评估系统,根据误差来判断决策函数的优劣

  3. 优化问题
    找到最优解


ML分类
  1. 监督学习、无监督学习、半监督学习
    监督学习监督学习:数据集包含数据标记,S(X,y)
    无监督无监督:数据集不含数据标记,S(X)
    半监督半监督:两者的结合,先无监督划分类别,然后使用有监督训练模型

  2. 批量学习、增量学习

    批量学习批量学习:把学习过程、应用过程 分开,使用全部的训练数据来学习模型,然后在实际的场景中应用,效果不理想时,重回到训练过程。

    增量学习增量学习: 将学习过程 、应用过程统一起来,在实际应用中,以增量的方式学习新的内容,边学边用

  3. 基于实例的学习,基于模型的学习

    基于实例基于实例:根据以往的经验,寻找与未知样本xix_ixi相似的样本,以其输出作为预测结果

    基于模型基于模型:根据以往的经验,建立联系输入、输出的数学模型y=f(X)y=f(X)y=f(X),将未知样本xix_ixi代入模型,得预测结果


数据处理
  1. 数据的采集
    a. 数据检索、数据挖掘,根据已有的数据总结归纳出新的数据
    结构化结构化的数据:关系数据库
    非结构化非结构化的数据:文本、图片、语音、视频 等

    b. 爬虫,无数据的情况下,爬取网络数据

  2. 数据清洗
    处理缺失值、异常值

  3. 特征工程
    特征的抽取,选择,转换


机器学习
  1. 选择模型
  2. 训练模型
  3. 评估模型
  4. 测试模型

业务运维
  1. 应用模型
  2. 维度模型

ML应用
  1. 数据预测
  2. 股价预测
  3. 推荐引擎
  4. 自然语言识别
  5. 语音识别
  6. 图像识别
  7. 人脸识别

业务场景
  1. 分类问题
  2. 回归问题
  3. 聚类问题

面试问题

常见问题


推荐阅读
  • Python库在GIS与三维可视化中的应用
    Python库极大地扩展了GIS的能力,使其能够执行复杂的数据科学任务。本文探讨了几个关键的Python库,这些库不仅增强了GIS的核心功能,还推动了地理信息系统向更高层次的应用发展。 ... [详细]
  • 全能终端工具推荐:高效、免费、易用
    介绍一款备受好评的全能型终端工具——MobaXterm,它不仅功能强大,而且完全免费,适合各类用户使用。 ... [详细]
  • PHP 5.2.5 安装与配置指南
    本文详细介绍了 PHP 5.2.5 的安装和配置步骤,帮助开发者解决常见的环境配置问题,特别是上传图片时遇到的错误。通过本教程,您可以顺利搭建并优化 PHP 运行环境。 ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 本文详细介绍了Python编程语言的学习路径,涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划,帮助初学者快速掌握Python的核心技能。 ... [详细]
  • 解决U盘安装系统后无法重启的问题
    本文详细探讨了运维新手常遇到的U盘安装系统后无法正常重启的问题,提供了从问题分析到具体解决方案的完整步骤。通过理解Boot Loader的工作原理和正确配置启动项,帮助用户顺利解决问题。 ... [详细]
  • 基于机器学习的人脸识别系统实现
    本文介绍了一种使用机器学习技术构建人脸识别系统的实践案例。通过结合Python编程语言和深度学习框架,详细展示了从数据预处理到模型训练的完整流程,并提供了代码示例。 ... [详细]
  • Spring Cloud因其强大的功能和灵活性,被誉为开发分布式系统的‘一站式’解决方案。它不仅简化了分布式系统中的常见模式实现,还被广泛应用于企业级生产环境中。本书内容详实,覆盖了从微服务基础到Spring Cloud的高级应用,适合各层次的开发者。 ... [详细]
  • 智能全栈云风暴:AI引领的企业转型之路
    当提及AI,人们脑海中常浮现的是天才少年独自编写算法,瞬间点亮机器人的双眼。然而,真正的AI革命正由大型企业和机构推动,它们利用全栈全场景AI技术,实现数字化与智能化的深度转型。 ... [详细]
  • 探索Python编程的价值与应用
    本文探讨了学习Python的重要性和广泛的应用场景,从个人技能提升到职业发展的多个方面进行了详细解析。 ... [详细]
  • 数据集成策略:ETL与ELT架构对比及工具选择
    随着企业信息化的深入发展,‘数据孤岛’问题日益突出,阻碍了数据的有效利用与整合。本文探讨了如何通过构建数据仓库解决这一问题,重点分析了ETL与ELT两种数据处理架构的特点及适用场景,为企业选择合适的ETL工具提供了指导。 ... [详细]
  • 本文介绍了Java语言开发的远程教学系统,包括源代码、MySQL数据库配置以及相关文档,适用于计算机专业的毕业设计。系统支持远程调试,采用B/S架构,适合现代教育需求。 ... [详细]
  • 热璞数据库与云宏达成兼容性互认证,共筑数据安全屏障
    热璞数据库与云宏信息技术有限公司近期宣布完成产品兼容性互认证,旨在提升数据安全性与稳定性,支持企业数字化转型。 ... [详细]
  • 本文精选了几所优秀的PHP实训和培训学校,为希望深入学习PHP编程的学员提供参考。 ... [详细]
  • 聚焦法是一种采用穷尽搜索策略的Filter型特征选择方法,其核心在于寻找能有效区分不同样本的最小特征集合。此方法的评估标准主要依赖于一致性测量。 ... [详细]
author-avatar
大道废_796
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有