当前位置: 开发笔记 > 编程语言 > 正文

机器学习（1）：机器学习基础

作者：Devon_Mars | 来源：互联网 | 2023-08-20 20:47

深度学习的第一步从机器学习开始！机器学习就是把无需的数据转换成有用的信息！！！机器学习的数据一般称为特征值特征值分类&

深度学习的第一步从机器学习开始&＃xff01;

机器学习就是把无需的数据转换成有用的信息&＃xff01;&＃xff01;&＃xff01;

机器学习的数据一般称为特征值

特征值分类&＃xff1a;数值型&＃xff08;一般是十进制数字&＃xff09;、二值型&＃xff08;0或1&＃xff09;、枚举类型

机器学习的主要任务就是分类&＃xff01;&＃xff01;&＃xff01;

目标变量是机器学习算法的预测结果&＃xff0c;在分类算法种目标变量的类型通常是标称型的&＃xff0c;而在回归算法种通常是连续型的。训练样本集必须知道目标变量的值&＃xff0c;以便机器去学校算法可以发现特征和目标变量之间的关系

为了测试机器学习学习算法的效果&＃xff0c;通常使用两套独立的样本集&＃xff1a;训练数据和测试数据&＃xff08;当机器学习程序开始运行的时候&＃xff0c;使用训练样本集作为算法的输入&＃xff0c;训练完成后输入测试样本。输入测试样本时并不提高样本的目标变量&＃xff0c;由程序决定样本属于哪个类别。比较测试样本预测的目标变量值与实际样本类别之间的差别&＃xff0c;就可以得出算法的实际精确度&＃xff09;

机器学习分类&＃xff1a;

分类和回归属于监督学习I&＃xff08;这类算法必须知道预测什么&＃xff0c;即目标变量的分类信息&＃xff09;
无监督学习不好给定目标值&＃xff0c;在无监督学习中&＃xff0c;将数据集合分成由类似的对象组成的多个类的过程被称为聚类&＃xff1b;将寻找描述数据统计值的过程称之为密度估计。

如何选择合适的算法&＃xff1f;

如果目标变量是离散型&＃xff0c;选择分类算法
如果目标变量是连续型&＃xff0c;选择回归算法
如果不想预测目标变量的值&＃xff0c;可以选择无监督算法&＃xff0c;进一步分析是否需要将数据划分为离散的组。如果这是唯一的需求&＃xff0c;使用聚类算法&＃xff1b;如果还需要估计数据与每个分组的相似程度&＃xff0c;则需要使用密度估计算法。

开发机器学习的步骤&＃xff1a;收集数据、准备输入数据、分析输入数据、训练算法、测试算法、使用算法。

编程基础&＃xff1a;Python语言&＃xff0c;numpy库&＃xff08;如果有时间的话可以了解一下C&＃43;&＃43;/C语言&＃xff09;

编写代码环境&＃xff08;我推荐jupyter notebooks&＃xff09;

// 安装 jupyter库 pip intall jupyter // 打开 jupyter jupyter notebooks

新建一个.ipynb文件
在这里插入图片描述

推荐阅读

python
31.项目部署

目录1一些概念1.1项目部署1.2WSGI1.3uWSGI1.4Nginx2安装环境与迁移项目2.1项目内容2.2项目配置2.2.1DEBUG2.2.2STAT ... [详细]

蜡笔小新 2023-12-12 12:15:41
go
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
python
Python程序安全运行的三个条件及预防措施

Python已成为全球最受欢迎的编程语言之一，然而Python程序的安全运行存在一定的风险。本文介绍了Python程序安全运行需要满足的三个条件，即系统路径上的每个条目都处于安全的位置、"主脚本"所在的目录始终位于系统路径中、若python命令使用-c和-m选项，调用程序的目录也必须是安全的。同时，文章还提出了一些预防措施，如避免将下载文件夹作为当前工作目录、使用pip所在路径而不是直接使用python命令等。对于初学Python的读者来说，这些内容将有所帮助。 ... [详细]

蜡笔小新 2023-12-09 10:20:23
python
Python对Excel文件的读取方法及模块安装

本文介绍了Python对Excel文件的读取方法，包括模块的安装和使用。通过安装xlrd、xlwt、xlutils、pyExcelerator等模块，可以实现对Excel文件的读取和处理。具体的读取方法包括打开excel文件、抓取所有sheet的名称、定位到指定的表单等。本文提供了两种定位表单的方式，并给出了相应的代码示例。 ... [详细]

蜡笔小新 2023-12-14 19:49:05
go
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
python
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
python
Python如何调用类里面的方法

本文介绍了在Python中调用同一个类中的方法需要加上self参数，并且规范写法要求每个函数的第一个参数都为self。同时还介绍了如何调用另一个类中的方法。详细内容请阅读剩余部分。 ... [详细]

蜡笔小新 2023-12-14 12:52:55
go
解决Cydia数据库错误：could not open file /var/lib/dpkg/status 的方法

本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件，以及ifunbox工具和终端命令，可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中，并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]

蜡笔小新 2023-12-13 19:02:44
go
clone的fork与pthread_create创建线程有何不同

本文讨论了clone的fork与pthread_create创建线程的不同之处。进程是一个指令执行流及其执行环境，其执行环境是一个系统资源的集合。在调用系统调用fork创建一个进程时，子进程只是完全复制父进程的资源，这样得到的子进程独立于父进程，具有良好的并发性。但是二者之间的通讯需要通过专门的通讯机制，另外通过fork创建子进程系统开销很大。因此，在某些情况下，使用clone或pthread_create创建线程可能更加高效。 ... [详细]

蜡笔小新 2023-12-12 20:00:06
java
操作系统的定义和功能

本文介绍了操作系统的定义和功能，包括操作系统的本质、用户界面以及系统调用的分类。同时还介绍了进程和线程的区别，包括进程和线程的定义和作用。 ... [详细]

蜡笔小新 2023-12-11 14:17:13
python
Python操作MySQL（pymysql模块）详解及示例代码

本文介绍了使用Python操作MySQL数据库的方法，详细讲解了pymysql模块的安装和连接MySQL数据库的步骤，并提供了示例代码。内容涵盖了创建表、插入数据、查询数据等操作，帮助读者快速掌握Python操作MySQL的技巧。 ... [详细]

蜡笔小新 2023-12-10 17:50:06
python
开源Keras Faster RCNN模型介绍及代码结构解析

本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构，包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]

蜡笔小新 2023-12-10 17:44:07
python
Python工具安装教程及注意事项

本文介绍了在Windows系统下安装Python、setuptools、pip和virtualenv的步骤，以及安装过程中需要注意的事项。详细介绍了Python2.7.4和Python3.3.2的安装路径，以及如何使用easy_install安装setuptools。同时提醒用户在安装完setuptools后，需要继续安装pip，并注意不要将Python的目录添加到系统的环境变量中。最后，还介绍了通过下载ez_setup.py来安装setuptools的方法。 ... [详细]

蜡笔小新 2023-12-10 16:46:45
go
使用FLASK REST API的机器学习模型

在本教程中，我们将看到如何使用FLASK制作第一个用于机器学习模型的RESTAPI。我们将从创建机器学习模型开始。然后，我们将看到使用Flask创建AP ... [详细]

蜡笔小新 2023-10-17 19:13:12
python
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19

Devon_Mars

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章