热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

数据运营36计(三):熵权法如何确定指标权重构建评价体系

1.熵权法信息论基本原理解释信息是系统有序性的度量单位,而熵可以度量系统的无序程度;如果某个指标的信息熵越小,该指标提供的信息量越大&#x

1. 熵权法

信息论基本原理解释信息是系统有序性的度量单位,而熵可以度量系统的无序程度;如果某个指标的信息熵越小,该指标提供的信息量越大,指标变异程度(方差)高,因此在综合评价中所起作用理当越大,权重就应该越高。熵权法的基本原理就是根据指标变异性的大小来确定客观权重。一般来说,这个方法相比于AHP专家打分更客观。熵权法确定指标权重的推导过程如下:

第一步:数据标准化

将各个指标的数据进行标准化处理。假设给定了k个指标,其中。假设对各指标数据标准化后的值为,那么

第二步:求各指标的信息熵

根据信息论中信息熵的定义,一组数据的信息熵计算为:

,其中

第三步:确定各指标权重

根据信息熵的计算公式,计算出各个指标的信息熵为。通过信息熵计算各指标的权重:

2. 评价体系之确定指标权重并计算样本得分

比如最近某快递公司在多地设置了快递点,但是快递点运营状态如何从数据上来获知,有哪些快递点需要取消,哪些快递点需要扩大经营?如何为给出每个快递点的具体得分,从而设置奖惩制度。这里建立一个评价体系,评价体系中包括能很好衡量快递点经营效果的指标,每个快递点都有这些指标的数据,因为熵权法可以自己计算出各个指标的权重,那么避免了专家打分法等主观权重带来的偏见,因此从该数据基础上即可获得各个快递点的得分。

熵权法计算过程:

求解过程放在了Excel,公众号后台回复“熵权法”即可获取。

第一步:数据标准化。假设有11个快递点参与评价,评价体系中包括以下7个子指标,以下指标数据通过归一化公式已实现数据标准化。

表1 数据标准化

第二步:求各指标的信息熵

表2 求解各数据的Pij

表3 求解信息熵Ei

第三步:求各指标权重,见表3倒数第一行。

第四步:各快递点得分,见表3最后一列。可以看到快递点S6得分最高。


End

    20000字干货笔记,一天搞定Mysql~    机器学习万字实战宝典!    数据分析里常用的五个统计学概念
『数据不吹牛』二群限额开启后台回复“入群”即可加入

“干货~”


推荐阅读
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 本文详细介绍了Python编程语言的学习路径,涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划,帮助初学者快速掌握Python的核心技能。 ... [详细]
  • 简化报表生成:EasyReport工具的全面解析
    本文详细介绍了EasyReport,一个易于使用的开源Web报表工具。该工具支持Hadoop、HBase及多种关系型数据库,能够将SQL查询结果转换为HTML表格,并提供Excel导出、图表显示和表头冻结等功能。 ... [详细]
  • 本文详细介绍了如何使用Python中的xlwt库将数据库中的数据导出至Excel文件,适合初学者和中级开发者参考。 ... [详细]
  • MySQL性能测试标准倡议:老叶提出的压测基准
    进行MySQL的压力测试通常是为了评估新旧版本之间的性能差异、验证硬件升级的效果、测试参数调整的影响以及评估新业务的负载承受能力。老叶提出了一个MySQL压力测试基准值倡议,旨在促进行业内的标准化和成果共享。 ... [详细]
  • 本文旨在探讨如何利用决策树算法实现对男女性别的分类。通过引入信息熵和信息增益的概念,结合具体的数据集,详细介绍了决策树的构建过程,并展示了其在实际应用中的效果。 ... [详细]
  • 深入浅出TensorFlow数据读写机制
    本文详细介绍TensorFlow中的数据读写操作,包括TFRecord文件的创建与读取,以及数据集(dataset)的相关概念和使用方法。 ... [详细]
  • 解决PyCharm中安装PyTorch深度学习d2l包的问题
    本文详细介绍了如何在PyCharm中成功安装用于PyTorch深度学习的d2l包,包括环境配置、安装步骤及常见问题的解决方案。 ... [详细]
  • 2017年苹果全球开发者大会即将开幕,预计iOS将迎来重大更新,同时Siri智能音箱有望首次亮相,AI技术成为大会焦点。 ... [详细]
  • LambdaMART算法详解
    本文详细介绍了LambdaMART算法的背景、原理及其在信息检索中的应用。首先回顾了LambdaMART的发展历程,包括其前身RankNet和LambdaRank,然后深入探讨了LambdaMART如何结合梯度提升决策树(GBDT)和LambdaRank来优化排序问题。 ... [详细]
  • SHAP图表中负号显示问题及其解决方案
    本文探讨了在使用SHAP进行机器学习模型解释时遇到的一个常见问题——负号无法正确显示,并提供了一种有效的解决方法。 ... [详细]
  • 在互联网信息爆炸的时代,当用户需求模糊或难以通过精确查询表达时,推荐系统成为解决信息过载的有效手段。美团作为国内领先的O2O平台,通过深入分析用户行为,运用先进的机器学习技术优化推荐算法,提升用户体验。 ... [详细]
  • 机器学习公开课备忘录(三)机器学习算法的应用与大数据集
    机器学习公开课备忘录(三)机器学习算法的应用与大数据集对应机器学习公开课第六周和第10周机器学习算法模型的选择与评价1、对于一个data,可以将data划分为trainingset、t ... [详细]
  • 支持向量机(SVM)是一种基于统计学习理论的模型,主要在VC维和结构风险最小化的理论基础上发展而来。本文将探讨几种不同的SVM方法及其优化策略,旨在提高模型的效率和适用性。 ... [详细]
author-avatar
亦惜缘2
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有