热门标签 | HotTags
当前位置:  开发笔记 > 开发工具 > 正文

信息检索评价指标NDCG、a-NDCG

PAMM中使用的检索多样性的评估方法为:。在NDCG中,文档的相关度可以分为多个等级进行打分。(1)CG(CumulativeGain):表示前p个位置累计得到


PAMM中使用的检索多样性的评估方法为:

 

NDCG中,文档的相关度可以分为多个等级进行打分。

 

1)CG(Cumulative Gain):

表示前p个位置累计得到的效益,公式为:

其中rel表示第i个文档的相关等级,如2表示非常相关,1表示相关,0表示无关,-1表示垃圾文件。

 

2)DCG(Discounted Cumulative gain)

 

CG中的计算没有考虑到位置信息,比如检索到了三个文档相关度一次为(3,-1,1)和(-1,1,3),显然前面的排序好一点,但是两个排名的CG值是相同的,所以要在CG运算中中加入位置信息的计算。假设每个位置按照从小到大排序,它们的价值依次递减,如:假设第i个位置的价值为

DCG的公式为:



另一种比较常用的,用来增加相关度影响比重的DCG计算方式是:



 

3)IDCG(ideal DCG)

 

IDCG是指理想情况下的DCG,即DCG取得最大值的情况。公式为:


其中|REL|表示文档按照相关性从大到小的顺序排序,取前p个文档组成的集合。

 

4)NDCG(Normalize DCG)

由于每个查询语句所能检索到的结果文档集合长度不一,p值的不同会对DCG的计算有较大的影响。所以不能对不同查询语句的DCG进行求平均,需要进行归一化处理。NDCG就是用IDCG进行归一化处理,表示当前DCG比IDCG还差多大的距离。公式如下:


这样每个查询语句的NDCG就是从0到1,不同查询语句之间就可以做比较,就可以求多个查询语句的平均NDCGNDCG@10NDCG@20分别表示求p为10和20的时候的NDCG

(5)PAMM中的

NDCG的变形,其中新发现的subtopics被奖励,多余的subtopics被惩罚。等级k的得分可以通过将标准NDCG@k中的原始增益值替换为新颖性收益来定义。公式为:



其中是排名列表y中排在r位置的新颖性收益


是包含第s个subtopic的r-1排名内观察到的文档数目;


为在正排名中排在r位的新颖性收益


y(k)是排名为k的文档索引; 


参数通常设置为0.5 。

 

 

 



推荐阅读
  • CentOS 7 磁盘与文件系统管理指南
    本文详细介绍了磁盘的基本结构、接口类型、分区管理以及文件系统格式化等内容,并提供了实际操作步骤,帮助读者更好地理解和掌握 CentOS 7 中的磁盘与文件系统管理。 ... [详细]
  • 本文详细记录了在基于Debian的Deepin 20操作系统上安装MySQL 5.7的具体步骤,包括软件包的选择、依赖项的处理及远程访问权限的配置。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • PyCharm下载与安装指南
    本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境(IDE),涵盖Windows、macOS和Linux系统,同时提供详细的安装步骤及配置建议。 ... [详细]
  • 本文介绍了如何使用 Spring Boot DevTools 实现应用程序在开发过程中自动重启。这一特性显著提高了开发效率,特别是在集成开发环境(IDE)中工作时,能够提供快速的反馈循环。默认情况下,DevTools 会监控类路径上的文件变化,并根据需要触发应用重启。 ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]
  • 资源推荐 | TensorFlow官方中文教程助力英语非母语者学习
    来源:机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南,帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]
  • Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]
  • 深入解析 HDFS Federation:多命名空间架构详解
    HDFS Federation 是一种扩展 HDFS 架构的方式,通过引入多个独立的 NameNode 来解决单点故障和性能瓶颈问题。本文将详细探讨 HDFS Federation 的工作原理、优势以及潜在挑战。 ... [详细]
  • IT项目管理过程中的方法、工具、技术
    工欲善其事,必先利其器。而对于一个软件开发项目,最重要的器就是方法,工具和技术。而这三要素中重要的又是方法论,方法是基础&# ... [详细]
  • 探讨如何高效使用FastJSON进行JSON数据解析,特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]
  • 本文介绍了如何在具备多个IP地址的FTP服务器环境中,通过动态地址端口复用和地址转换技术优化网络配置。重点讨论了2Mb/s DDN专线连接、Cisco 2611路由器及内部网络地址规划。 ... [详细]
  • 深入理解 SQL 视图、存储过程与事务
    本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式,存储过程则封装了复杂的SQL逻辑,而事务确保了数据库操作的完整性和一致性。 ... [详细]
author-avatar
书生
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有