热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

脸书开源第一个使用卷积神经网络技术的端到端语音识别系统

https:www.toutiao.coma66394493709136696352018-12-2707:34:30脸书发布全新自动语音识别的卷积方法,以及开源目

https://www.toutiao.com/a6639449370913669635/

 

2018-12-27 07:34:30

脸书发布全新自动语音识别的卷积方法 ,以及开源目前最先进的端到端语音识别系统wav2letter++。这个自动语音识别方法使用卷积神经网络(CNN)进行声音建模和语言建模,再加上脸书一同发布的工具,让其他开发者也能实例出相同的成果。

脸书开源第一个使用卷积神经网络技术的端到端语音识别系统

 

通常CNN架构比起循环架构(Recurrent Architecture),对于有建模长期相依性的任务更具有竞争力,能够良好执行语言建模、机器翻译和语音合成等工作,而在端到端的语音识别其中,循环架构在声音建模和语言建模上却更为普遍。

而脸书的这项研究,是在端到端语音识别中使用CNN架构,脸书表示,端到端语音识别可以轻松的扩展到多种语言,另外,直接从原始语音学习,则是解决音频品质变化大的好方法。脸书的语音团队现在发布第一个全卷积的语音识别系统,从波型到最后的单词转录为文本,系统的可学习部分,能仅由卷积层组成,而这样的性能则可以与循环架构相当。

脸书开源第一个使用卷积神经网络技术的端到端语音识别系统

 

另外,脸书还发布了快速且灵活的独立机器学习函数库Flashlight,这是由脸书的语音团队以及Torch和DeepSpeech的开发者共同设计的,能为现代C++进行JIT编译,并针对CPU和GPU后端,实现性能与规模最大化,而Wav2letter++工具则创建于Flashlight之上。

由于高性能框架Wav2letter++能进行快速迭代,因此可以加速研究进展,并方便的对新数据集和任务进行模型优化。脸书发布全新自动语音识别的卷积方法的同时,也同时发布了Flashlight和Wav2letter++开发框架,以实现成果的可重复性。


推荐阅读
  • 自SQL Server 2005以来,微软的这款数据库产品逐渐崭露头角,成为企业级应用中的佼佼者。本文将探讨SQL Server 2008的革新之处及其对企业级数据库市场的影响。 ... [详细]
  • 如何用GPU服务器运行Python
    如何用GPU服务器运行Python-目录前言一、服务器登录1.1下载安装putty1.2putty远程登录 1.3查看GPU、显卡常用命令1.4Linux常用命令二、 ... [详细]
  • 本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用,涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]
  • Spring Cloud因其强大的功能和灵活性,被誉为开发分布式系统的‘一站式’解决方案。它不仅简化了分布式系统中的常见模式实现,还被广泛应用于企业级生产环境中。本书内容详实,覆盖了从微服务基础到Spring Cloud的高级应用,适合各层次的开发者。 ... [详细]
  • Python基础教程:struct模块与格式化字符详解
    本文详细介绍了Python中struct模块的功能,以及如何利用格式化字符实现Python与C语言结构体之间的数据转换。文章通过具体实例讲解了struct模块的主要方法及其应用场景。 ... [详细]
  • 本文记录了Android学习的初期阶段,包括Android的基本架构、Dalvik虚拟机与JVM的区别、ADB工具的使用以及应用程序的打包安装流程。 ... [详细]
  • 本文深入探讨了Redis中的两种主要持久化方式——RDB(Redis Database)和AOF(Append Only File),并详细解析了两者的实现机制、优缺点以及在实际应用中的选择策略。 ... [详细]
  • Docker基础指南与核心命令解析
    本文全面介绍了Docker的基本概念、安装方法、核心命令及其用法,并深入探讨了Docker容器的数据卷管理及应用部署策略,适合初学者快速掌握Docker技术。 ... [详细]
  • 本文详细介绍了 TensorFlow 的入门实践,特别是使用 MNIST 数据集进行数字识别的项目。文章首先解析了项目文件结构,并解释了各部分的作用,随后逐步讲解了如何通过 TensorFlow 实现基本的神经网络模型。 ... [详细]
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • java程序员_Java程序员最新职业规划,逆袭面经分享
    java程序员_Java程序员最新职业规划,逆袭面经分享 ... [详细]
  • Java Servlet中获取客户端IP与MAC地址的方法
    本文介绍了一种在Java Servlet应用中获取客户端IP地址及MAC地址的技术实现方法,通过示例代码详细解析了获取过程中的关键步骤和技术点。 ... [详细]
  • 深入理解Quartz:Java定时任务框架详解
    Quartz是一个功能强大的调度库,适用于各种规模的应用程序。本文将详细介绍Quartz的基本概念、配置方法以及如何在Java项目中使用Quartz来管理定时任务。 ... [详细]
  • a16z 宣布成立全新的加密研究实验室,旨在推动加密技术和 Web3 领域的科学发展。 ... [详细]
  • 本文详细介绍了如何通过微信H5网页授权机制获取用户的code,并进一步获取用户的基本信息,包括必要的配置步骤和前端代码实现。 ... [详细]
author-avatar
mobiledu2502913165
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有