当前位置: 开发笔记 > 编程语言 > 正文

一周AI最火论文|使用图形界面就能搭建的强化学习模型

作者： | 来源：互联网 | 2023-09-08 12:01

大数据文摘出品作者：ChristopherDossman编译：李雷、Luna、云舟呜啦啦啦啦啦啦啦大家好，本周的AIScholarWeekly栏目又和大家见面啦！AIScholar

大数据文摘出品

作者：Christopher Dossman

编译：李雷、Luna、云舟

呜啦啦啦啦啦啦啦大家好，本周的AI Scholar Weekly栏目又和大家见面啦！

AI ScholarWeekly是AI领域的学术专栏，致力于为你带来最新潮、最全面、最深度的AI学术概览，一网打尽每周AI学术的前沿资讯。

每周更新，做AI科研，每周从这一篇开始就够啦！

本周关键词：自动驾驶、强化学习、GANs

本周最佳学术研究

Waymo开放数据集挑战赛

今年3月，Alphabet旗下的自动驾驶公司Waymo发起公开挑战赛，参赛者可以使用其自动驾驶数据集（包括2D和3D检测、2D和3D跟踪以及域适应数据）来建立和测试机器学习模型。挑战赛收到来自世界各地的上百份代码提交，最终入围决赛的选手来自中国、英国、新加坡、美国等多个国家。

最近公开的Waymo开放数据集（Waymo Open Dataset，WOD）是用于自动驾驶研究的大型数据集，提供了1000个用于训练和验证以及150个用于测试的驾驶片段。每个片段包含拍摄自不同摄像机的镜头，平均每部摄像机约200帧图像，这其中还包括5台分辨率为1280×1920或886×1920的高分辨率摄像机。总而言之，该数据集包含约115万张关于车辆、行人和骑自行车的人的图像，以及990万张2D边界框。

本论文给出了Waymo开放数据集（WOD）2020挑战赛的最佳解决方案。作者采用FPN（Feature pyramid networks）作为基本框架，而级联RCNN、堆叠PAFPN（Path aggregation FPN）和多头RCNN则用于提高性能。为了处理WOD中的小目标检测问题，训练和测试都使用了超大尺寸的图像，本文的方案在2D对象检测跟踪中排名第一。作者们计划持续增加数据集，希望这将有助于国际研究界在机器感知和自动驾驶技术方面取得进步。

原文：

https://arxiv.org/abs/2008.01365v1

MusPy - 用于生成符号音乐的工具包

本文介绍了MusPy，一个用于生成符号音乐的开源Python库。MusPy为音乐生成系统中的基本组件提供了易于使用的工具，包括数据集管理，数据I / O，数据预处理和模型评估等。

为了展示模型能力，作者对MusPy当前支持的11个数据集进行了统计分析。此外，他们还进行了跨数据集的泛化实验，通过在每个数据集上训练自回归模型，测量其他数据集上的留存可能性（MusPy的数据集管理系统使此过程变得更加容易）。

源码及文档：

https://github.com/salu133445/muspy

原文：

https://arxiv.org/abs/2008.01951v1

深度轻量级Transformer模型

在本论文中，Facebook人工智能实验室和艾伦人工智能研究所的研究人员提出了一种名为DeLighT的极深度轻量级Transformer模型。他们认为，与其他基于Transformer的模型相比，DeLighT可以提供类似或更好的性能，并且参数要少得多。

DeLighT可以高效地分配参数，它使用DExTra（一种深度轻量级转换）在每个Transformer编码器层中分配参数，而在各层之间使用逐层缩放的方法，这种方法允许在输入附近使用较浅较窄的DeLighT层，在输出附近使用较宽较深的DeLighT层。

总体而言，DeLighT网络的深度可以是标准Transformer模型的2.5至4倍，但参数和操作却少得多。在机器翻译和语言建模任务上进行的实验表明，DeLighT可以用更少的参数达到Transformer基线模型的性能。

源码：

https://github.com/sacmehta/delight

原文：

https://arxiv.org/abs/2008.00623v1

一个新型、简单并且可扩展性高的强化学习框架

强化学习（RL）已成为当下主流之一的研究领域，前沿的人工智能公司都会将其作为重要工具来对待。因此，许多研究人员建立了RL框架，例如openAI Gym和KerasRL，以简化其他人的使用。

为了降低RL新手的入门障碍，本文提出了一个新框架——EasyRL。EasyRL是一个通过交互式GUI来构建、训练和评估RL代理的框架。

由于EasyRL完全以GUI呈现，因此不需要有关于训练或测试其内置RL代理的编程知识。该框架还支持自定义RL代理和环境，这对于RL研究人员评估和比较其RL模型非常有帮助。

原文：

https://arxiv.org/abs/2008.01700v1

用于图像和视频合成的GANs：算法与应用

GANs现在是执行各种图像和视频合成任务的强大工具。它们能生成高分辨率的逼真图像和视频，而在此之前这是一项艰巨甚至不可能的任务。GANs还能在内容创作中生成一些新内容。

在这项工作中，研究人员提供了GANs的概述，着重于视觉合成的算法和应用。它们涵盖了稳定GANs训练的几种重要技术，尤其是一些臭名昭著的技术难点。他们还讨论了其在图像翻译，图像处理，视频合成和神经渲染中的应用。

原文：

https://arxiv.org/abs/2008.02793v1

其他爆款论文

简单的Modulo可以大大胜过基于深度学习的代码：

https://arxiv.org/abs/2008.01686v1

一种用于有效标记的主动图像合成方法，可提高使用小数据进行学习任务时的性能：

https://arxiv.org/abs/1902.01522v4

引入Cylinder3D进行驾驶场景LiDAR语义分割:

https://arxiv.org/abs/2008.01550v1

单个示例生成连贯的层级样式:

https://arxiv.org/abs/2008.01531v1

学习资源

机器学习简单的自学资源：

https://developers.google.com/machine-learning/crash-course

吴恩达讲授斯坦福机器学习课程：

http://www.holehouse.org/mlclass/?fbclid=IwAR1XmS0CtIXUDg0s2bxeTUpiv2Dh08L_DaDQqA2HCXqafUFfcWays6S07UI

AI大事件

AI可能会创造的20种严重犯罪：

https://www.zdnet.com/article/evil-ai-these-are-the-20-most-dangerous-crimes-that-artificial-intelligence-will-create/

Julia 1.5发布：

https://www.zdnet.com/article/programming-language-julia-version-1-5-is-out-lots-of-new-features-better-performance/

推荐阅读

数组
Python实验报告文档中的文件和数据格式化操作

本文介绍了Python语言程序设计中文件和数据格式化的操作，包括使用np.savetext保存文本文件，对文本文件和二进制文件进行统一的操作步骤，以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]

蜡笔小新 2023-12-10 17:02:16
int
提升Python编程效率的十点建议

本文介绍了提升Python编程效率的十点建议，包括不使用分号、选择合适的代码编辑器、遵循Python代码规范等。这些建议可以帮助开发者节省时间，提高编程效率。同时，还提供了相关参考链接供读者深入学习。 ... [详细]

蜡笔小新 2023-12-14 21:51:04
python
2018年人工智能大数据的爆发，学Java还是Python？

本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代，Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言，容易上手。其特色之一是强制使用空白符作为语句缩进，使得新手可以快速上手。目前，Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣，欢迎加入qq群458345782。 ... [详细]

蜡笔小新 2023-12-14 20:08:28
int
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
int
lua语言闭包、模式匹配、日期、编译、模块的特性及应用

本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值，函数可以作为变量自由传递，也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性，为程序开发带来了便利。 ... [详细]

蜡笔小新 2023-12-14 18:18:21
rsa
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
php
Android中高级面试必知必会，积累总结

本文介绍了Android中高级面试的必知必会内容，并总结了相关经验。文章指出，如今的Android市场对开发人员的要求更高，需要更专业的人才。同时，文章还给出了针对Android岗位的职责和要求，并提供了简历突出的建议。 ... [详细]

蜡笔小新 2023-12-14 14:53:02
int
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
python
使用 Ubuntu 中的 Python 获取浏览器历史记录

使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]

蜡笔小新 2023-12-14 08:57:59
python
计算机网络初识及通信流程分析

本文介绍了计算机网络的定义和通信流程，包括客户端编译文件、二进制转换、三层路由设备等。同时，还介绍了计算机网络中常用的关键词，如MAC地址和IP地址。 ... [详细]

蜡笔小新 2023-12-13 16:50:29
install
如何在Windows环境下配置php+apache环境

本文介绍了在Windows环境下如何配置php+apache环境，包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]

蜡笔小新 2023-12-13 10:39:24
int
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
search
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
object
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
python
读手语图像识别论文笔记2

文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1（手语识别背景和方法）一、前言一句：“做完了&#x ... [详细]

蜡笔小新 2023-10-17 20:45:15

Tags | 热门标签

RankList | 热门文章