当前位置: 开发笔记 > 编程语言 > 正文

AI人工智能基础概念学习

作者：上帝认我做干爹 | 来源：互联网 | 2023-09-14 16:03

AI人工智能基础概念学习准确率(Accuracy)|查准率(Precision)|查全率(Recall)https:www.jianshu.comp8b7324b0f3072

AI人工智能基础概念学习

准确率(Accuracy) | 查准率(Precision) | 查全率(Recall)

https://www.jianshu.com/p/8b7324b0f307

2018.04.02 22:02* 字数 991 阅读 1573评论 3喜欢 1

在机器学习中&＃xff0c;对于一个模型的性能评估是必不可少的。准确率(Accuracy)、查准率(Precision)、查全率(Recall)是常见的基本指标。

为了方便说明&＃xff0c;假设有以下问题场景&＃xff1a;

一个班有50人&＃xff0c;在某场考试中有40人及格&＃xff0c;10人不及格。
现在需要根据一些特征预测出所有及格的学生。

某一模型执行下来&＃xff0c;给出了39人&＃xff0c;其中37人确实及格了&＃xff0c;剩下2人实际上不及格。

样本

要了解这些指标的含义&＃xff0c;首先需要了解两种样本&＃xff1a;

正样本&＃xff1a;即属于某一类&＃xff08;一般是所求的那一类&＃xff09;的样本。在本例中是及格的学生。
负样本&＃xff1a;即不属于这一类的样本。在本例中是不及格的学生。

识别结果

于是我们可以得到下面一张表&＃xff1a;

	正类	负类
被检索	True Positive	False Positive
未检索	False Negative	True Negative

TP&＃xff1a;被检索到正样本&＃xff0c;实际也是正样本&＃xff08;正确识别&＃xff09;
在本例表现为&＃xff1a;预测及格&＃xff0c;实际也及格。
FP&＃xff1a;被检索到正样本&＃xff0c;实际是负样本&＃xff08;一类错误识别&＃xff09;
在本例表现为&＃xff1a;预测及格&＃xff0c;实际不及格。
FN&＃xff1a;未被检索到正样本&＃xff0c;实际是正样本。&＃xff08;二类错误识别&＃xff09;
在本例表现为&＃xff1a;预测不及格&＃xff0c;实际及格了。
TN&＃xff1a;未被检索到正样本&＃xff0c;实际也是负样本。&＃xff08;正确识别&＃xff09;
在本例表现为&＃xff1a;预测不及格&＃xff0c;实际也不及格。

指标计算

有了上述知识&＃xff0c;就可以计算各种指标了。

Accuracy&＃xff08;准确率&＃xff09;

分类正确的样本数与样本总数之比。即&＃xff1a;(TP &＃43; TN) / ( ALL ).

在本例中&＃xff0c;正确分类了45人&＃xff08;及格37 &＃43; 不及格8&＃xff09;&＃xff0c;所以 Accuracy &＃61; 45 / 50 &＃61; 90%.

Precision&＃xff08;精确率、查准率&＃xff09;

被正确检索的样本数与被检索到样本总数之比。即&＃xff1a;TP / (TP &＃43; FP).

在本例中&＃xff0c;正确检索到了37人&＃xff0c;总共检索到39人&＃xff0c;所以 Precision &＃61; 37 / 39 &＃61; 94.9%.

Recall &＃xff08;召回率、查全率&＃xff09;

被正确检索的样本数与应当被检索到的样本数之比。即&＃xff1a;TP / (TP &＃43; FN).

在本例中&＃xff0c;正确检索到了37人&＃xff0c;应当检索到40人&＃xff0c;所以 Recall &＃61; 37 / 40 &＃61; 92.5%.

为什么要不同的指标

根据上边公式的不同&＃xff0c;可以借此理解不同指标的意义。

准确率是最常用的指标&＃xff0c;可以总体上衡量一个预测的性能。但是某些情况下&＃xff0c;我们也许会更偏向于其他两种情况。

「宁愿漏掉&＃xff0c;不可错杀」

在识别垃圾邮件的场景中可能偏向这一种思路&＃xff0c;因为我们不希望很多的正常邮件被误杀&＃xff0c;这样会造成严重的困扰。
因此&＃xff0c;Precision 将是一个被侧重关心的指标。

「宁愿错杀&＃xff0c;不可漏掉」

在金融风控领域大多偏向这种思路&＃xff0c;我们希望系统能够筛选出所有有风险的行为或用户&＃xff0c;然后交给人工鉴别&＃xff0c;漏掉一个可能造成灾难性后果。
因此&＃xff0c;Recall 将是一个被侧重关心的指标。

综合评价 (F-Score)

更多时候&＃xff0c;我们希望能够同时参考 Precision 与 Recall&＃xff0c;但又不是像 Accuracy 那样只是泛泛地计算准确率&＃xff0c;此时便引入一个新指标 F-Score&＃xff0c;用来综合考虑 Precision 与 Recall.

其中 β 用于调整权重&＃xff0c;当 β&＃61;1 时两者权重相同&＃xff0c;简称为 F1-Score.
若认为 Precision 更重要&＃xff0c;则减小 β&＃xff0c;若认为 Recall 更重要&＃xff0c;则增大 β.

推荐阅读

int
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
int
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
int
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
int
2018年人工智能大数据的爆发，学Java还是Python？

本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代，Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言，容易上手。其特色之一是强制使用空白符作为语句缩进，使得新手可以快速上手。目前，Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣，欢迎加入qq群458345782。 ... [详细]

蜡笔小新 2023-12-14 20:08:28
int
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
int
九度OnlineJudge之1002：Grading问题的解决方法

本文介绍了九度OnlineJudge中的1002题目“Grading”的解决方法。该题目要求设计一个公平的评分过程，将每个考题分配给3个独立的专家，如果他们的评分不一致，则需要请一位裁判做出最终决定。文章详细描述了评分规则，并给出了解决该问题的程序。 ... [详细]

蜡笔小新 2023-12-14 13:00:09
int
大量研发销售产品设计市场岗位！

关于我们EMQ是一家全球领先的开源物联网基础设施软件供应商，服务新产业周期的IoT&5G、边缘计算与云计算市场，交付全球领先的开源物联网消息服务器和流处理数据 ... [详细]

蜡笔小新 2023-12-13 21:02:32
int
P1651 塔 (动态规划) 的最大高度计算方法

本文介绍了P1651题目的描述和要求，以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术，将问题转化为求解差值的问题，并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]

蜡笔小新 2023-12-13 19:52:19
int
推荐系统遇上深度学习(十七）详解推荐系统中的常用评测指标

原创：石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人，希望在平日的工作学习中，挖掘数据的价值， ... [详细]

蜡笔小新 2023-12-13 19:35:25
int
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
int
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
web
绕过WAF的XSS检测机制及构建XSS payload的方法

本文介绍了绕过WAF的XSS检测机制的方法，包括确定payload结构、测试和混淆。同时提出了一种构建XSS payload的方法，该payload与安全机制使用的正则表达式不匹配。通过清理用户输入、转义输出、使用文档对象模型（DOM）接收器和源、实施适当的跨域资源共享（CORS）策略和其他安全策略，可以有效阻止XSS漏洞。但是，WAF或自定义过滤器仍然被广泛使用来增加安全性。本文的方法可以绕过这种安全机制，构建与正则表达式不匹配的XSS payload。 ... [详细]

蜡笔小新 2023-12-11 19:42:30
web
GPT-3发布，动动手指就能自动生成代码的神器来了！

近日，OpenAI发布了最新的NLP模型GPT-3，该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB，参数个数高达1750亿，训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站，用户只需用英语描述需求，前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年，OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型，在限定条件下以2:0完胜人类冠军。 ... [详细]

蜡笔小新 2023-12-11 11:04:43
web
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
web
MyBatis错题分析解析及注意事项

本文对MyBatis的错题进行了分析和解析，同时介绍了使用MyBatis时需要注意的一些事项，如resultMap的使用、SqlSession和SqlSessionFactory的获取方式、动态SQL中的else元素和when元素的使用、resource属性和url属性的配置方式、typeAliases的使用方法等。同时还指出了在属性名与查询字段名不一致时需要使用resultMap进行结果映射，而不能使用resultType。 ... [详细]

蜡笔小新 2023-12-13 18:40:17

上帝认我做干爹

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章