当前位置: 开发笔记 > 后端 > 正文

数据运营36计(三)：熵权法如何确定指标权重构建评价体系

作者：亦惜缘2 | 来源：互联网 | 2023-06-05 18:38

1.熵权法信息论基本原理解释信息是系统有序性的度量单位，而熵可以度量系统的无序程度；如果某个指标的信息熵越小，该指标提供的信息量越大&#x

1. 熵权法

信息论基本原理解释信息是系统有序性的度量单位&＃xff0c;而熵可以度量系统的无序程度&＃xff1b;如果某个指标的信息熵越小&＃xff0c;该指标提供的信息量越大&＃xff0c;指标变异程度(方差)高&＃xff0c;因此在综合评价中所起作用理当越大&＃xff0c;权重就应该越高。熵权法的基本原理就是根据指标变异性的大小来确定客观权重。一般来说&＃xff0c;这个方法相比于AHP专家打分更客观。熵权法确定指标权重的推导过程如下&＃xff1a;

第一步&＃xff1a;数据标准化

将各个指标的数据进行标准化处理。假设给定了k个指标&＃xff0c;其中。假设对各指标数据标准化后的值为&＃xff0c;那么

第二步&＃xff1a;求各指标的信息熵

根据信息论中信息熵的定义&＃xff0c;一组数据的信息熵计算为&＃xff1a;

&＃xff0c;其中

第三步&＃xff1a;确定各指标权重

根据信息熵的计算公式&＃xff0c;计算出各个指标的信息熵为。通过信息熵计算各指标的权重&＃xff1a;

2. 评价体系之确定指标权重并计算样本得分

比如最近某快递公司在多地设置了快递点&＃xff0c;但是快递点运营状态如何从数据上来获知&＃xff0c;有哪些快递点需要取消&＃xff0c;哪些快递点需要扩大经营&＃xff1f;如何为给出每个快递点的具体得分&＃xff0c;从而设置奖惩制度。这里建立一个评价体系&＃xff0c;评价体系中包括能很好衡量快递点经营效果的指标&＃xff0c;每个快递点都有这些指标的数据&＃xff0c;因为熵权法可以自己计算出各个指标的权重&＃xff0c;那么避免了专家打分法等主观权重带来的偏见&＃xff0c;因此从该数据基础上即可获得各个快递点的得分。

熵权法计算过程&＃xff1a;

求解过程放在了Excel&＃xff0c;公众号后台回复“熵权法”即可获取。

第一步&＃xff1a;数据标准化。假设有11个快递点参与评价&＃xff0c;评价体系中包括以下7个子指标&＃xff0c;以下指标数据通过归一化公式已实现数据标准化。

表1 数据标准化

第二步&＃xff1a;求各指标的信息熵

表2 求解各数据的Pij

表3 求解信息熵Ei

第三步&＃xff1a;求各指标权重&＃xff0c;见表3倒数第一行。

第四步&＃xff1a;各快递点得分&＃xff0c;见表3最后一列。可以看到快递点S6得分最高。

End

20000字干货笔记&＃xff0c;一天搞定Mysql~ 机器学习万字实战宝典&＃xff01; 数据分析里常用的五个统计学概念『数据不吹牛』二群限额开启后台回复“入群”即可加入

“干货~”

推荐阅读

go
深入解析：手把手教你构建决策树算法

本文详细介绍了机器学习中广泛应用的决策树算法，通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字，建议阅读时间5分钟。 ... [详细]

蜡笔小新 2024-12-27 13:44:59
go
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48
爬虫
Python入门指南：从零开始的全面学习路线

本文详细介绍了Python编程语言的学习路径，涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划，帮助初学者快速掌握Python的核心技能。 ... [详细]

蜡笔小新 2024-12-25 12:54:33
spring
简化报表生成：EasyReport工具的全面解析

本文详细介绍了EasyReport，一个易于使用的开源Web报表工具。该工具支持Hadoop、HBase及多种关系型数据库，能够将SQL查询结果转换为HTML表格，并提供Excel导出、图表显示和表头冻结等功能。 ... [详细]

蜡笔小新 2024-12-22 11:11:28
spring
Python Excel模块开发指南

本文详细介绍了如何使用Python中的xlwt库将数据库中的数据导出至Excel文件，适合初学者和中级开发者参考。 ... [详细]

蜡笔小新 2024-12-18 18:42:11
并发
MySQL性能测试标准倡议：老叶提出的压测基准

进行MySQL的压力测试通常是为了评估新旧版本之间的性能差异、验证硬件升级的效果、测试参数调整的影响以及评估新业务的负载承受能力。老叶提出了一个MySQL压力测试基准值倡议，旨在促进行业内的标准化和成果共享。 ... [详细]

蜡笔小新 2024-12-17 15:10:53
ci
基于决策树的性别分类分析

本文旨在探讨如何利用决策树算法实现对男女性别的分类。通过引入信息熵和信息增益的概念，结合具体的数据集，详细介绍了决策树的构建过程，并展示了其在实际应用中的效果。 ... [详细]

蜡笔小新 2024-12-20 11:57:25
ci
深入浅出TensorFlow数据读写机制

本文详细介绍TensorFlow中的数据读写操作，包括TFRecord文件的创建与读取，以及数据集（dataset）的相关概念和使用方法。 ... [详细]

蜡笔小新 2024-12-19 16:23:17
ci
解决PyCharm中安装PyTorch深度学习d2l包的问题

本文详细介绍了如何在PyCharm中成功安装用于PyTorch深度学习的d2l包，包括环境配置、安装步骤及常见问题的解决方案。 ... [详细]

蜡笔小新 2024-12-19 14:19:22
go
2017苹果全球开发者大会前瞻：iOS革新、Siri智能音箱与AI技术引领未来

2017年苹果全球开发者大会即将开幕，预计iOS将迎来重大更新，同时Siri智能音箱有望首次亮相，AI技术成为大会焦点。 ... [详细]

蜡笔小新 2024-12-18 18:02:27
ci
LambdaMART算法详解

本文详细介绍了LambdaMART算法的背景、原理及其在信息检索中的应用。首先回顾了LambdaMART的发展历程，包括其前身RankNet和LambdaRank，然后深入探讨了LambdaMART如何结合梯度提升决策树（GBDT）和LambdaRank来优化排序问题。 ... [详细]

蜡笔小新 2024-12-18 12:30:35
ci
SHAP图表中负号显示问题及其解决方案

本文探讨了在使用SHAP进行机器学习模型解释时遇到的一个常见问题——负号无法正确显示，并提供了一种有效的解决方法。 ... [详细]

蜡笔小新 2024-12-18 10:55:51
go
美团推荐系统：机器学习优化重排序模型

在互联网信息爆炸的时代，当用户需求模糊或难以通过精确查询表达时，推荐系统成为解决信息过载的有效手段。美团作为国内领先的O2O平台，通过深入分析用户行为，运用先进的机器学习技术优化推荐算法，提升用户体验。 ... [详细]

蜡笔小新 2024-12-17 17:56:15
go
机器学习公开课备忘录（三）机器学习算法的应用与大数据集

机器学习公开课备忘录（三）机器学习算法的应用与大数据集对应机器学习公开课第六周和第10周机器学习算法模型的选择与评价1、对于一个data，可以将data划分为trainingset、t ... [详细]

蜡笔小新 2024-12-17 15:54:47
go
支持向量机（SVM）方法的扩展与优化

支持向量机（SVM）是一种基于统计学习理论的模型，主要在VC维和结构风险最小化的理论基础上发展而来。本文将探讨几种不同的SVM方法及其优化策略，旨在提高模型的效率和适用性。 ... [详细]

蜡笔小新 2024-12-17 14:27:48

亦惜缘2

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章