当前位置: 开发笔记 > 编程语言 > 正文

100%抄袭！ICLR2022投稿论文剽窃两篇顶会，程序主席放「实锤」严词拒稿！

作者：TXCWB_523 | 来源：互联网 | 2023-08-22 16:19

每天给你送来NLP技术干货！转载自：新智元|来源：Reddit编辑：小咸鱼好困【导读】ICLR2022会议投稿出现抄袭事件&

每天给你送来NLP技术干货&＃xff01;

转载自&＃xff1a;新智元 | 来源&＃xff1a;Reddit

编辑&＃xff1a;小咸鱼好困

【导读】ICLR 2022会议投稿出现抄袭事件&＃xff0c;夸张的是数据和表格都是从以前的paper上直接拿下来的。在项目主席以严重的剽窃案例为由发出Desk Reject之前&＃xff0c;作者竟然撤回了提交的内容。这是怎么回事&＃xff1f;

朋友们&＃xff0c;又到了一月好几度的「学术不端」曝光时间了。

之前什么「借鉴」idea&＃xff0c;「英译中」都弱爆了&＃xff0c;甚至直接照搬都没有这次的「别出心裁」&＃xff0c;至少人家还是「忠实原著」的。

随便举一个例子&＃xff0c;比如下面这个是原论文的图。

Wang et al. EMNLP 2020

再来看看这篇论文的图。

ICLR 2022投稿

请看两处红色横线部分&＃xff0c;莫非这就是传说中的「抄串行」了&＃xff1f;

但通篇读下来&＃xff0c;其实严格来说并不是100%相似&＃xff0c;而是99%。因为还有1%是抄或者改错的部分&＃xff08;doge&＃xff09;。

这么明目张胆地搞事情难道没人管管么&＃xff1f;

果不其然&＃xff0c;11月1日&＃xff0c;一封来自ICLR 2022程序主席的Desk Reject直接怼脸了。

图1是100%复制/粘贴自[1]&＃xff08;作者注明「采用自」&＃xff09;&＃xff0c;包括图注
表1是来自[1]的截图&＃xff08;作者注明「采用自」&＃xff09;&＃xff0c;标题是复制/粘贴的&＃xff0c;没有任何署名
表2&＃xff1a;和[1]差不多&＃xff0c;但有一些替换&＃xff08;例如。Android <- Phone, kitchen <- room, shirt <- clothing)
表3&＃xff1a;复制了[1]中的前3行&＃xff0c;没有注明出处&＃xff0c;第4行是新的&＃xff08;比[1]中的第4行表现更差&＃xff09;
算法1是来自[2]的截图&＃xff1b;未注明出处

被抄袭的两篇论文为&＃xff1a;

[1] CAT-Gen: Improving Robustness in NLP Models via Controlled Adversarial Text Generation. Wang et al. EMNLP 2020

https://arxiv.org/pdf/2010.02338.pdf

[2] FreeLB: Enhanced Adversarial Training for Natural Language Understanding. Zhu et al. ICLR 2020

https://arxiv.org/pdf/1909.11764.pdf

其实&＃xff0c;作者团队在10月29日就确认撤稿了。

但是对于学术不端的行为&＃xff0c;怎么能放过这个「公开处刑」的机会呢&＃xff01;

连换词都懒得换的「抄袭」

虽然之前很火的「Patches are all you need」只有4页&＃xff0c;但是这篇论文只有「6页」的原因&＃xff0c;显然是不一样的。

https://openreview.net/pdf?id&＃61;EO4VJGAllb

摘要

读论文嘛&＃xff0c;首先要看看摘要部分。

左&＃xff1a;CAT-Gen原文&＃xff1b;右&＃xff1a;Text-Gen论文

用红色圈出相似的地方之后&＃xff0c;嚯&＃xff0c;有点厉害啊。

这篇论文向我们展示了经典的单词替换 &＃43;「把」字句变「被」字句。显然&＃xff0c;意思丝毫不变。

甚至&＃xff0c;摘要的前半部分还算是稍微动手改了改&＃xff0c;后半部分直接把原文拿过来贴上。真的&＃xff0c;是一个单词都没有改。&＃xff08;但复制的时候还挺不小心的&＃xff0c;漏了空格和横短线&＃xff09;

引言

引言部分居然还有点「良心发现」&＃xff0c;挪用了些关键词&＃xff0c;句子嘛&＃xff0c;倒是好好重写了一番。

左&＃xff1a;CAT-Gen原文&＃xff1b;右&＃xff1a;Text-Gen论文

就是这个引用的文章&＃xff0c;是不是重合的太多了&＃xff1f;

论文正文

这上来就已经「彻底放弃抵抗」了&＃xff0c;大段大段直接往上糊。

左&＃xff1a;CAT-Gen原文&＃xff1b;右&＃xff1a;Text-Gen论文

你说一个字不改也就罢了&＃xff0c;抄还抄不全乎。

单词拼不对&＃xff0c;单词之间少空格&＃xff0c;强迫症看了真心头疼&＃xff0c;抄袭也得有点「责任心」嘛。

这两篇文章都提到了一个「三阶段」架构&＃xff0c;那就都拿出来看看。

上&＃xff1a;CAT-Gen原文&＃xff1b;下&＃xff1a;Text-Gen论文

Text-Gen这篇论文的图直接是从CAT-Gen原文复制过来的&＃xff0c;就把箭头的示意图从虚线改成实线。

但是&＃xff0c;虽然示意图是变了&＃xff0c;图中的箭头只有一半改成了实线&＃xff0c;另一半还是虚线。

Text-Gen文中的算法&＃xff0c;乍一看和CAT-Gen原文不一样&＃xff0c;原来是从另一篇文章FreeLB里面直接贴过来的。

左&＃xff1a;FreeLB原文&＃xff1b;右&＃xff1a;Text-Gen论文

右边看上去没有左边清晰&＃xff0c;那是因为Text-Gen论文这个算法部分并不是手敲进去的&＃xff0c;而是直接从FreeLB原文截的图。

实验结果

实验结果自然也是完全一样。

展示前人的工作效果时也是直接截图。

上&＃xff1a;CAT-Gen原文&＃xff1b;下&＃xff1a;Text-Gen论文

轮到自己的工作时&＃xff0c;Text-Gen的实验结果表格几乎和CAT-Gen原文一样&＃xff0c;就只进行了一些单词字面的替代。&＃xff08;表格画得也是潦草得很&＃xff09;

上&＃xff1a;CAT-Gen原文&＃xff1b;下&＃xff1a;Text-Gen论文

这最后的定量实验数据就更搞笑了。

上&＃xff1a;CAT-Gen原文&＃xff1b;下&＃xff1a;Text-Gen论文

文章都已经是抄袭了&＃xff0c;还要坚守最后一点「倔强」&＃xff0c;非要用Text-Gen自己的数据作为试验结果。Text-Gen的性能数据漂亮也就罢了&＃xff0c;结果还不如人家原文的CAT-Gen的数据。

连评委都在吐槽。&＃xff08;编都不知道编个好点的&＃xff09;

网友评论

抄袭事件一出&＃xff0c;Reddit已经有了好多人的评论。有的网友觉得这个造假者的「撤稿」行为太「冠冕堂皇」。

「难道他们内心认可抄袭这件事是错的&＃xff0c;然后还是去抄袭了吗&＃xff1f;」

有的网友感觉这种抄袭已经没什么好大惊小怪的了。

「机器学习和深度学习的论文经常会出现抄袭的情况。这种事就看有没有人去查。抄袭的人本质上就是在赌没有人会注意到他的抄袭。」

另一个网友也非常同意「抄袭的人本质上就是在赌没有人会注意到他的抄袭」这个观点。

「许多剽窃博士学位的人发现他们看似是『逃脱』了辛苦&＃xff0c;但他们的整个职业生涯都被毁掉了。」

最近的学术不端行为频频发生&＃xff0c;这也是给学术研究者时时刻刻的提醒&＃xff0c;科研工作者心中一定要牢记求真&＃xff0c;求实&＃xff0c;对学术诚信要有敬畏之心&＃xff0c;绝不能踏过红线&＃xff0c;不要有侥幸心理&＃xff0c;否则就是自毁前程。每位科研工作者在做好自己的工作时&＃xff0c;要懂得尊重他人的学术成果。

参考资料&＃xff1a;

https://www.reddit.com/r/MachineLearning/comments/qkb6ga/plagiarism_case_detected_iclr_2022_newsdiscussion/

涉事论文&＃xff1a;https://openreview.net/pdf?id&＃61;EO4VJGAllb

论文[1]&＃xff1a;https://arxiv.org/pdf/2010.02338.pdf

论文[2]&＃xff1a;https://arxiv.org/pdf/1909.11764.pdf

投稿或交流学习&＃xff0c;备注&＃xff1a;昵称-学校&＃xff08;公司&＃xff09;-方向&＃xff0c;进入DL&NLP交流群。

方向有很多&＃xff1a;机器学习、深度学习&＃xff0c;python&＃xff0c;情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易&＃xff0c;还望给个在看&＃xff01;

推荐阅读

text
Android开发笔记：使用Picasso加载网络图片等比例缩放

在Android开发中，使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法，并提供了具体的代码实现。通过获取图片的宽高，计算目标宽度和高度，并创建新图实现等比例缩放。 ... [详细]

蜡笔小新 2023-12-14 17:34:00
text
android listview OnItemClickListener失效原因

最近在做listview时发现OnItemClickListener失效的问题，经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效，还会导致单击后listview每个item的背景改变，使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况，并提供了解决方法。 ... [详细]

蜡笔小新 2023-12-14 14:25:50
text
Android 7自学笔记总结、移动架构视频、安卓面试真题、项目实战源码讲义

本文介绍了Android 7的学习笔记总结，包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容，并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同，否则会出现问题。 ... [详细]

蜡笔小新 2023-12-13 10:06:58
text
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14
go
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
get
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
text
C#之数据集：DataSet对象的使用及相关方法详解

本文介绍了C#中数据集DataSet对象的使用及相关方法详解，包括DataSet对象的概述、与数据关系对象的互联、Rows集合和Columns集合的组成，以及DataSet对象常用的方法之一——Merge方法的使用。通过本文的阅读，读者可以了解到DataSet对象在C#中的重要性和使用方法。 ... [详细]

蜡笔小新 2023-12-14 12:09:13
text
后台获取视图对应的字符串

1.帮助类后台获取视图对应的字符串publicclassViewHelper{将View输出为字符串(注：不会执行对应的ac ... [详细]

蜡笔小新 2023-12-13 18:03:01
text
XML介绍与使用的概述及标签规则

本文介绍了XML的基本概念和用途，包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则，包括标签的尖括号和合法标识符的组成，标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读，读者可以对XML的基本知识有一个全面的了解。 ... [详细]

蜡笔小新 2023-12-13 17:39:50
go
如何通过全新应用内评价获取更多优质用户反馈？

Google Play推出全新的应用内评价API，帮助开发者获取更多优质用户反馈。用户每天在Google Play上发表数百万条评论，这有助于开发者了解用户喜好和改进需求。开发者可以选择在适当的时间请求用户撰写评论，以获得全面而有用的反馈。全新应用内评价功能让用户无需返回应用详情页面即可发表评论，提升用户体验。 ... [详细]

蜡笔小新 2023-12-13 17:23:03
text
拥抱Android Design Support Library新变化（导航视图、悬浮ActionBar）

转载请注明明桑AndroidAndroid5.0Loollipop作为Android最重要的版本之一，为我们带来了全新的界面风格和设计语言。看起来很受欢迎࿰ ... [详细]

蜡笔小新 2023-12-13 16:11:00
get
自动轮播，反转播放的ViewPagerAdapter的使用方法和效果展示

本文介绍了如何使用自动轮播、反转播放的ViewPagerAdapter，并展示了其效果。该ViewPagerAdapter支持无限循环、触摸暂停、切换缩放等功能。同时提供了使用GIF.gif的示例和github地址。通过LoopFragmentPagerAdapter类的getActualCount、getActualItem和getActualPagerTitle方法可以实现自定义的循环效果和标题展示。 ... [详细]

蜡笔小新 2023-12-13 14:41:31
text
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
blob
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
blob
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52

TXCWB_523

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章