当前位置: 开发笔记 > 后端 > 正文

谷歌开源实时语音转录引擎LiveTranscribeSpeechEngine

作者：最美的你 | 来源：互联网 | 2023-07-29 22:53

谷,歌,开源,实时,语音,转录,引擎,live,transcribe,spe

昨日，谷歌在其开源博客中宣布开源 Android 语音识别转录工具 —— Live Transcribe 的语音引擎（Live Transcribe Speech Engine），它旨在将语音或对话实时转录为文字，还能够为听障人士提供帮助。

Live Transcribe 是谷歌于今年 2 月推出的一款 Android 应用程序，它的语音识别由谷歌最先进的 Cloud Speech API 提供。但是，依赖于云引入了一些复杂性，不断变化的网络连接、数据成本和延迟的鲁棒性等等都带来一些考验。因此，谷歌把它开源出来，希望开发人员在已有的基础上进一步构建和开发。

Cloud Speech API 目前无法支持无限的音频流，团队采取了一些措施来解决这一难题，例如在达到超时之前关闭并重新启动流式传输请求，这将有效减少会话中丢失的文本量。

无限流媒体音频带来了一大挑战。在许多国家，网络数据非常昂贵，并且在互联网较差的地方，带宽可能有限。Live Transcribe Speech Engine 的团队对音频编解码器进行了大量实验，并最终在不影响精度的情况下将数据使用量减少了 10 倍。

另外，由于是提供实时语音转录，转录出来的文本会随着语音的输入不断发生变化，降低延迟自然十分必要。该引擎能够大大降低延迟率，这都要归功于它的自定义 Opus 编码器。

此外，值得一提的是，Live Transcribe 支持超过 70 种语言，并能够根据语音自动识别语种，其中也包括中文。

推荐阅读

http
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
上传
如何配置Unturned服务器及其消息设置

本文详细介绍了Unturned服务器的配置方法和消息设置技巧，帮助用户了解并优化服务器管理。同时，提供了关于云服务资源操作记录、远程登录设置以及文件传输的相关补充信息。 ... [详细]

蜡笔小新 2024-12-27 13:47:38
static
2023年京东Android面试真题解析与经验分享

本文由一位拥有6年Android开发经验的工程师撰写，详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]

蜡笔小新 2024-12-26 17:45:48
api
基于双Xilinx Kintex-7 FPGA的高性能6U VPX存储板

VPX611是北京青翼科技推出的一款采用6U VPX架构的高性能数据存储板。该板卡搭载两片Xilinx Kintex-7系列FPGA作为主控单元，内置RAID控制器，支持多达8个mSATA盘，最大存储容量可达8TB，持续写入带宽高达3.2GB/s。 ... [详细]

蜡笔小新 2024-12-26 11:41:58
java
深入解析：阿里实战 SpringCloud 微服务架构与应用

本文将详细介绍 SpringCloud 在微服务架构中的应用，涵盖入门、实战和案例分析。通过丰富的代码示例和实际项目经验，帮助读者全面掌握 SpringCloud 的核心技术和最佳实践。 ... [详细]

蜡笔小新 2024-12-26 03:50:43
http
深入解析 Apache Shiro 安全框架架构

本文详细介绍了 Apache Shiro，一个强大且灵活的开源安全框架。Shiro 专注于简化身份验证、授权、会话管理和加密等复杂的安全操作，使开发者能够更轻松地保护应用程序。其核心目标是提供易于使用和理解的API，同时确保高度的安全性和灵活性。 ... [详细]

蜡笔小新 2024-12-25 16:03:57
注入
云函数与数据库API实现增删查改的对比

本文将深入探讨使用云函数和数据库API实现数据操作（增删查改）的不同方法，通过详细的代码示例帮助读者更好地理解和掌握这些技术。文章不仅提供代码实现，还解释了每种方法的特点和适用场景。 ... [详细]

蜡笔小新 2024-12-22 00:56:21
java
深入解析 Android 值动画实现细节

本文详细介绍了如何在 Android 中使用值动画（ValueAnimator）来动态调整 ImageView 的高度，并探讨了相关的关键属性和方法，包括图片填充后的高度、原始图片高度、动画变化因子以及布局重置等。 ... [详细]

蜡笔小新 2024-12-20 17:58:54
api
深入解析Spring Cloud微服务架构与分布式系统实战

本文详细介绍了Spring Cloud在微服务架构和分布式系统中的应用，结合实际案例和最新技术，帮助读者全面掌握微服务的实现与优化。 ... [详细]

蜡笔小新 2024-12-19 16:02:50
http
Spring Cloud学习指南：深入理解微服务架构

本文介绍了微服务架构的基本概念及其在Spring Cloud中的实现。讨论了微服务架构的主要优势，如简化开发和维护、快速启动、灵活的技术栈选择以及按需扩展的能力。同时，也探讨了微服务架构面临的挑战，包括较高的运维要求、分布式系统的复杂性、接口调整的成本等问题。最后，文章提出了实施微服务时应遵循的设计原则。 ... [详细]

蜡笔小新 2024-12-19 09:25:36
注入
掌握Spring MVC中自定义类型转换与格式化的技巧

近期，在开发一款小程序的过程中遇到了几个Spring MVC接口需要传递时间参数的问题。本文将详细介绍如何利用Java 8 Time API在Spring MVC中实现时间参数的自定义类型转换和格式化。 ... [详细]

蜡笔小新 2024-12-17 15:37:19
api
资源推荐 | TensorFlow官方中文教程助力英语非母语者学习

来源：机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南，帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]

蜡笔小新 2024-12-28 09:00:51
上传
PHP 实现微信素材上传

本文介绍了如何使用PHP代码实现微信平台的媒体素材上传功能，详细解释了API接口的使用方法和注意事项，确保文件路径正确以避免常见的错误。 ... [详细]

蜡笔小新 2024-12-26 16:54:06
java
深入解析 MUI 开发中 plusReady 和 init 的区别

在使用 MUI 框架进行应用开发时，开发者常常会遇到 mui.init() 和 mui.plusReady() 这两个方法。本文将详细解释它们的区别及其在不同开发环境下的应用。 ... [详细]

蜡笔小新 2024-12-26 15:57:00
api
深入理解 ExtJS 类的别名机制

在 ExtJS 中，类的别名（alias）是开发过程中非常有用的一个特性。通过别名，开发者可以使用简短且易于记忆的名称来引用复杂的类名。本文将详细探讨如何在 ExtJS API 中使用和定义别名，并提供实例说明。 ... [详细]

蜡笔小新 2024-12-26 15:19:42

最美的你

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章