【论文泛读138】BARTScore：将生成的文本评估为文本生成

作者：大美妞meilei | 来源：互联网 | 2024-09-27 09:01

贴一下汇总贴：论文阅读记录论文链接：《BARTScore:EvaluatingGeneratedTextasTextGeneration》一、摘要

贴一下汇总贴&＃xff1a;论文阅读记录

论文链接&＃xff1a;《BARTScore: Evaluating Generated Text as Text Generation》

一、摘要

各种各样的 NLP 应用程序&＃xff0c;例如机器翻译、摘要和对话&＃xff0c;都涉及文本生成。这些应用程序面临的一个主要挑战是如何评估此类生成的文本是否真正流畅、准确或有效。在这项工作中&＃xff0c;我们将生成文本的评估概念化为文本生成问题&＃xff0c;使用预训练的序列到序列模型进行建模。一般的想法是&＃xff0c;当生成的文本更好时&＃xff0c;训练模型将生成的文本转换为参考输出或源文本将获得更高的分数。我们使用 BART&＃xff08;一种基于编码器-解码器的预训练模型&＃xff09;来实现这一想法&＃xff0c;并提出了一个具有多种变体的度量 BARTScore&＃xff0c;这些变体可以以无监督的方式灵活应用于从不同角度&＃xff08;例如信息量、流畅度、或事实&＃xff09;。BARTScore 在概念上很简单&＃xff0c;在经验上也很有效。它可以在 22 个测试设置中的 16 个测试设置中优于现有的最高分指标&＃xff0c;涵盖对 16 个数据集的评估&＃xff08;例如&＃xff0c;机器翻译、文本摘要&＃xff09;和 7 个不同的角度&＃xff08;例如&＃xff0c;信息量、事实性&＃xff09;。计算 BARTScore 的代码可在github&＃xff0c;并且我们在 ExplainaBoard 平台上的这个 github上发布了一个用于元评估的交互式排行榜 &＃xff0c;这使我们能够以交互方式了解每个指标的优势、劣势和互补性。

二、结论

在本文中&＃xff0c;我们提出了一个度量标准BARTSCORE&＃xff0c;它将生成文本的评估作为一个文本生成任务&＃xff0c;并通过实验证明了它的有效性。在没有人工判断的监督下&＃xff0c;BARTSCORE可以从7个角度有效地评估文本&＃xff0c;并在22个设置中的16个设置上相对于现有的最高评分指标取得最佳性能。

三、model

faithfulness
precison
recall
f score

在这里插入图片描述

推荐阅读

ci
[论文笔记] Crowdsourcing Translation: Professional Quality from Non-Professionals (ACL, 2011)

Time:4hoursTimespan:Apr15–May3,2012OmarZaidan,ChrisCallison-Burch:CrowdsourcingTra ... [详细]

蜡笔小新 2024-12-28 13:39:05
substring
解析Java中Text.splitText()方法及其应用场景

本文详细介绍了Java中org.w3c.dom.Text类的splitText()方法，通过多个代码示例展示了其实际应用。该方法用于将文本节点在指定位置拆分为两个节点，并保持在文档树中。 ... [详细]

蜡笔小新 2024-12-26 18:31:42
function
JQuery基础：省市联动与表单验证

本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先，通过change事件监听用户选择的省份，并动态加载对应的城市列表。其次，详细讲解了使用Validation插件进行表单验证的方法，包括内置规则、自定义规则及实时验证功能。 ... [详细]

蜡笔小新 2024-12-27 17:10:48
function
分页插件3指定到某一页

前言--页数多了以后需要指定到某一页（只做了功能，样式没有细调）html ... [详细]

蜡笔小新 2024-12-27 15:19:01
string
2018-2019学年第六周《Java数据结构与算法》学习总结

本文总结了2018-2019学年第六周在《Java数据结构与算法》课程中的学习内容，重点介绍了非线性数据结构——树的相关知识及其应用。 ... [详细]

蜡笔小新 2024-12-22 16:43:19
foreach
实用正则表达式有哪些

小编给大家分享一下实用正则表达式有哪些，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下 ... [详细]

蜡笔小新 2024-12-22 13:59:04
string
Mathematica 12.3.1 中英文版正式发布，附新功能介绍

历经三十年的开发，Mathematica 已成为技术计算领域的标杆，为全球的技术创新者、教育工作者、学生及其他用户提供了一个领先的计算平台。最新版本 Mathematica 12.3.1 增加了多项核心语言、数学计算、可视化和图形处理的新功能。 ... [详细]

蜡笔小新 2024-12-22 09:34:59
function
ReactJS 计算器应用：增加功能

本文将指导如何向ReactJS计算器应用添加必要的功能，使其能够响应用户操作并正确计算数学表达式。 ... [详细]

蜡笔小新 2024-12-19 13:09:18
function
探讨System.Diagnostics.Trace作为.NET通用日志工具的可行性

本文探讨了如何利用System.Diagnostics.Trace作为.NET库中的通用日志记录方法，同时考虑了其在性能关键代码中的影响。 ... [详细]

蜡笔小新 2024-12-18 12:57:05
controller
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
string
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
header
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
function
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
function
使用snownlp进行微博情感分析的学习实践

本文介绍了如何利用snownlp库对微博内容进行情感分析，包括安装、基本使用以及如何自定义训练模型以提高分析准确性。 ... [详细]

蜡笔小新 2024-11-27 15:01:46
select
cnn多实例attention选择的句子关系分类提取Neural Relation Extraction with Selective Attention over Instances

作者提供代码在https:github.comthunlpOpenNRE网址主要技术：文章主要是通过一对实体和对应的多个包含实体对的句子实例作为训练数据集ÿ ... [详细]

蜡笔小新 2024-11-25 13:23:21

大美妞meilei

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章