当前位置: 开发笔记 > 后端 > 正文

机器学习算法入门介绍

作者：黑旦儿 | 来源：互联网 | 2024-10-20 11:42

本文共涉及三个问题：1.机器学习开发流程2.机器学习算法分类3.机器学习模型是什么我们做什么？分析大量数据分析具体业务应用常见算法特征工程、调

本文共涉及三个问题&＃xff1a;

1.机器学习开发流程

2.机器学习算法分类

3.机器学习模型是什么

我们做什么&＃xff1f;

分析大量数据
分析具体业务
应用常见算法
特征工程、调参数、优化

我们应该怎么做&＃xff1f;
学会分析问题&＃xff0c;使用机器学习算法的目的&＃xff0c;想要算法完成何种任务。
掌握算法基本思想&＃xff0c;学会对问题用相应的算法解决。
学会利用哭或者框架解决问题。

机器学习算法的判别依据

这里写图片描述

机器学习算法的分类

这里写图片描述

监督学习包括&＃xff1a;特征值&＃43;目标值
无监督学习包括&＃xff1a;特征值
监督学习中&＃xff0c;分类算法的目标值是离散型&＃xff0c;回归算法的目标值是连续型。

监督学习和无监督学习

这里写图片描述
监督学习&＃xff08;Supervised learning&＃xff09; &＃xff1a;可以从输入数据中学习或建立一个模型&＃xff0c;并以此模式推测新的结果。输入数据是由特征值和目标值组成。函数的输出值可以是一个连续的值&＃xff08;称为回归&＃xff09;&＃xff0c;也可以是一个离散的值&＃xff08;称为分类&＃xff09;。

分类是监督学习的一个核心问题&＃xff0c;在监督学习中&＃xff0c;当输出变量取有限个离散值时&＃xff0c;预测问题变为分类问题。最基础的便是二分类问题&＃xff0c;即判断是非&＃xff0c;从两个类别中选择一个作为预测结果。

回归是监督学习的另一个核心问题&＃xff0c;回归用于预测输入变量和输出变量之间的关系&＃xff0c;输出是连续型的值。

无监督学习&＃xff08;unSupervised learning&＃xff09;&＃xff1a;可以从输入数据中学习或建立一个模型&＃xff0c;并以此模式推测新的结果。输入数据是由特征值组成。

分类问题的应用&＃xff1a;
这里写图片描述

回归问题的应用&＃xff1a;
这里写图片描述

机器学习开发流程

1.原始数据&＃xff0c;明确问题&＃xff0c;要做什么&＃xff08;建立模型&＃xff0c;根据数据类型划分应用种类&＃xff09;
2.数据的基本处理&＃xff1a;pd处理数据&＃xff08;缺失值、合并表…&＃xff09;
3.特征工程&＃xff08;特征处理&＃xff0c;特征抽取、降维…&＃xff09;
4.找到合适的算法进行预测
5.模型的评估&＃xff0c;判定效果。
6.如果模型评估合格&＃xff0c;达到期望值&＃xff0c;如准确率百分之九十八以上。上线使用&＃xff0c;以API形式提供。
7.如果模型评估不合格&＃xff0c;则可以更换算法或者再次进行特征工程处理&＃xff0c;然后再次进行模型评估。

机器学习模型是什么

模型&＃xff1a;算法&＃43;数据

推荐阅读

api
厘清机器学习与数据分析的界限

本文旨在探讨机器学习与数据分析之间的差异，不仅在于它们处理的数据类型，还包括技术背景、业务应用场景以及参与者的不同。通过深入分析，希望能为读者提供清晰的理解。 ... [详细]

蜡笔小新 2024-12-12 15:15:36
ci
智慧城市建设现状及未来趋势

随着新基建政策的推进及‘十四五’规划的实施，我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型，促进数字政府建设，新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计，以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]

蜡笔小新 2024-12-16 16:43:21
ci
初探K近邻算法与Scikit-learn API

本文介绍了Scikit-learn这一强大的机器学习库，重点探讨了其最新稳定版本及其安装方法，并通过一个简单的K近邻算法实例展示了如何使用Scikit-learn进行模型训练和预测。 ... [详细]

蜡笔小新 2024-12-10 11:27:51
ci
机器学习核心概念与技术

本文系统梳理了机器学习的关键知识点，涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容，并深入探讨了各算法的原理和应用场景。 ... [详细]

蜡笔小新 2024-12-22 09:15:30
ci
提升代码可读性的关键要素

本文总结了优化代码可读性的核心原则与技巧，通过合理的变量命名、函数和对象的结构化组织，以及遵循一致性等方法，帮助开发者编写更易读、维护性更高的代码。 ... [详细]

蜡笔小新 2024-12-22 02:51:51
go
深入解析：Android 视频处理开源框架

本文将详细介绍多个流行的 Android 视频处理开源框架，包括 ijkplayer、FFmpeg、Vitamio、ExoPlayer 等。每个框架都有其独特的优势和应用场景，帮助开发者更高效地进行视频处理和播放。 ... [详细]

蜡笔小新 2024-12-21 19:49:35
go
现代人幸福感缺失的原因探究

随着生活节奏的加快和压力的增加，越来越多的人感到不快乐。本文探讨了现代社会中导致人们幸福感下降的各种因素，并提供了一些改善建议。 ... [详细]

蜡笔小新 2024-12-21 16:09:25
transform
Python中HOG图像特征提取与应用

本文介绍如何在Python中使用HOG（Histogram of Oriented Gradients）算法进行图像特征提取，探讨其在目标检测中的应用，并详细解释实现步骤。 ... [详细]

蜡笔小新 2024-12-21 15:32:13
ci
Python 工具推荐 | PyHubWeekly 第二十一期：提升命令行体验的五大工具

本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具，涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]

蜡笔小新 2024-12-21 14:45:11
service
深入解析RDMA中的队列对（Queue Pair）

本文将详细探讨RDMA架构中的关键组件——队列对（Queue Pair，简称QP），包括其基本概念、硬件与软件实现、QPC的作用、QPN的分配机制以及用户接口和状态机。通过这些内容，读者可以更全面地理解QP在RDMA通信中的重要性和工作原理。 ... [详细]

蜡笔小新 2024-12-21 11:16:36
go
程序员如何优雅应对35岁职业转型？这里有深度解析

本文探讨了程序员在职业生涯中如何通过不断学习和技能提升，优雅地应对35岁左右的职业转型挑战。我们将深入分析当前热门技术趋势，并提供实用的学习路径。 ... [详细]

蜡笔小新 2024-12-20 18:26:03
go
智能投顾机器人：创业者如何应对新挑战？

随着智能投顾技术在二级市场的兴起，针对一级市场的智能投顾也逐渐崭露头角。近日，一款名为阿尔妮塔的人工智能创投机器人正式发布，它将如何改变投资人的工作方式和创业者的融资策略？ ... [详细]

蜡笔小新 2024-12-20 16:46:18
session
深入浅出TensorFlow数据读写机制

本文详细介绍TensorFlow中的数据读写操作，包括TFRecord文件的创建与读取，以及数据集（dataset）的相关概念和使用方法。 ... [详细]

蜡笔小新 2024-12-19 16:23:17
session
R语言基础入门指南

本文介绍R语言的基本概念，包括其作为区分大小写的解释型语言的特点、主要的数据结构类型如向量、矩阵、数据框及列表等，并探讨了R语言中对象的灵活性与函数的应用。此外，文章还提供了关于如何使用R进行基本操作的示例，以及解决常见编程问题的方法。 ... [详细]

蜡笔小新 2024-12-16 16:35:03
crash
深入解析：主流开源分布式文件系统综述

本文详细探讨了几款主流的开源分布式文件系统，包括HDFS、MooseFS、Lustre、GlusterFS和CephFS，重点分析了它们的元数据管理和数据一致性机制，旨在为读者提供深入的技术见解。 ... [详细]

蜡笔小新 2024-12-08 19:30:59