当前位置: 开发笔记 > 编程语言 > 正文

意念实时转语音！Facebook的非植入式脑机接口，解码准确率达到76%

作者：z1996y | 来源：互联网 | 2023-10-11 11:50

铜灵发自凹非寺量子位出品|公众号QbitAI今天，加州大学旧金山分校（UCSF）和Facebook在NatureCommuications

铜灵发自凹非寺
量子位出品 | 公众号 QbitAI

今天&＃xff0c;加州大学旧金山分校&＃xff08;UCSF&＃xff09;和Facebook在Nature Commuications上发表的一项研究显示&＃xff1a;

他们在“非植入式”的穿戴设备上取得了最新进展&＃xff0c;构建出了一个大脑-计算机系统&＃xff0c;能准确解码佩戴设备的人听到和说出词语和对话&＃xff0c;实时从大脑信号中解码。

也就是说&＃xff0c;在这种脑机接口面前&＃xff0c;你的所思所想已无处遁形&＃xff0c;Facebook已经让意念打字成为了现实。

此前&＃xff0c;马斯克的脑机接口公司Neuralink也发布过脑机接口系统&＃xff0c;但这种植入式的设备需要向大脑中植入3000多个电极&＃xff0c;以此来检测神经元的活动&＃xff0c;但非植入式的设备就免去了复杂的植入步骤。

研究人员表示&＃xff0c;目前对生成和感知的两部分语言进行解码&＃xff0c;准确率超出了他们的想象&＃xff0c;分别能达到61%和76%的准确率。

640?wx_fmt&＃61;jpeg

这项项目对于正常人和残疾人来说&＃xff0c;都具有实用意义。

比如&＃xff0c;你可以将思维直连到语音助手siri&＃xff0c;查询天气、搜索信息不用直接喊出来了。

研究人员之一、加州大学旧金山分校神经外科医生Edward Chang表示&＃xff0c;这是向神经植入物迈出的重要一步&＃xff0c;因为中风&＃xff0c;脊髓损伤或其他疾病而失去说话能力的患者&＃xff0c;有望因此获得自然交流的能力。

如何意念转语音

这项成果来自Facebook Reality Labs&＃xff0c;一直与加州大学旧金山分校合作开展这项脑机接口的研究。

Facebook的设想是&＃xff0c;设计一种可以将大脑信号转换成语言的装置&＃xff0c;不需要劳动任何一块肌肉&＃xff0c;深度学习就能直接读懂大脑&＃xff0c;解码脑中所想&＃xff0c;实现流畅交流。

为了进行试验&＃xff0c;研究人员此前还招募了五名在医院接受癫痫治疗的志愿者。

640?wx_fmt&＃61;png

他们先是从高密度皮层活动中提取相关信号特征。志愿者们说了上百句话&＃xff0c;而通过植入性大脑皮层电图&＃xff08;ECoG&＃xff09;&＃xff0c;研究人员可以跟踪控制语言和发音的大脑区域的活动&＃xff0c;并将这些活动与志愿者说话时嘴唇、舌头、喉部和下颚的微妙运动联系起来&＃xff0c;然后将这些运动学特征翻译成口语句子。

研究人员采用bLSTM&＃xff08;bidi-rectional long short-term memory&＃xff09;循环神经网络来破译ECoG信号表达的运动学表征。

接着用另外一个bLSTM解码先前破译的运动学特征中的声学特征。

在这个过程中&＃xff0c;两个神经网络都会被投喂训练数据&＃xff0c;以提高它们的解码性能。

640?wx_fmt&＃61;png

在今年的四月份&＃xff0c;利用这样的方法&＃xff0c;Facebook已经实现了以每分钟150词的速度帮你说出所思所想。

而在这篇最新的论文Real-time decoding of question-and-answer speech dialogue using human cortical activity中&＃xff0c;他们在此前研究基础上&＃xff0c;研究人员想进一步提高精度。

640?wx_fmt&＃61;png

大多数语音解码的工作原理是对一个人在想什么声音做出最佳猜测&＃xff0c;在解码过程中可能会被“synthesizer”和“fertilizer”这类发音相似的单词混淆。

但Facebook的新系统增加了上下文信息来帮助区分这些单词。

首先&＃xff0c;这个算法预测从一组已知问题中听到的问题&＃xff0c;比如“你在一块土地上撒了什么?”然后&＃xff0c;这些信息作为上下文来帮助预测答案&＃xff1a;“肥料”&＃xff08;fertilizer&＃xff09;。

640?wx_fmt&＃61;png

Edward Chang表示&＃xff0c;通过添加上下文&＃xff0c;这个系统能够用的指定问题和答案解码感知&＃xff08;听到&＃xff09;的语音准确率达到76%&＃xff0c;解码产生&＃xff08;口头&＃xff09;的语音准确率达到了61%。

640?wx_fmt&＃61;png

Facebook表示&＃xff0c;未来将扩大系统的词汇量&＃xff0c;让其能适用在更广泛的领域。

缘起两年前

Facebook早在两年前&＃xff0c;就开始着手这个项目了。

2017年4月&＃xff0c;Facebook旗下的前沿产品研发团队Building 8负责人Regina Dugan宣布&＃xff0c;这家社交网络公司将在未来两年内&＃xff0c;开发出一个能以每分钟100字的速度从人脑向外传输语句的“帽子”。

640?wx_fmt&＃61;png

Facebook设想中的“帽子”&＃xff0c;是用来分享你的思维的。此前清华大学也做过类似概念的研究&＃xff0c;头戴一个小巧的电极帽&＃xff0c;控制屏幕软键盘上的26个字母就能打出任何语句。

640?wx_fmt&＃61;gif

Facebook最终计划&＃xff0c;是想打造一款AR眼镜。

Facebook AR/VR业务副总裁Andrew “Boz” Bosworth表示&＃xff0c;这个项目的初衷&＃xff0c;是想构建一个非侵入式可穿戴设备&＃xff0c;让人们只想通过想象他们想说什么来打字&＃xff0c;展示未来对AR眼镜的投入和互动成为现实的潜力。

传送门

Facebook官方博客&＃xff1a;
https://tech.fb.com/imagining-a-new-interface-hands-free-communication-without-saying-a-word/

论文Real-time decoding of question-and-answer speech dialogue using human cortical activity
地址&＃xff1a;
https://www.nature.com/articles/s41467-019-10994-4

论文Speech synthesis from neural decoding of spoken sentences&＃xff1a;
https://www.gwern.net/docs/ai/2019-anumanchipalli.pdf

— 完 —

加入社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

640?wx_fmt&＃61;jpeg

量子位 QbitAI · 头条号签约作者

վ&＃39;ᴗ&＃39; ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 &＃xff01;

推荐阅读

search
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
search
非计算机专业的朋友如何拿下多个Offer

大家好，我是归辰。秋招结束后，我已顺利入职，并应公子龙的邀请，分享一些秋招面试的心得体会，希望能帮助到学弟学妹们，让他们在未来的面试中更加顺利。 ... [详细]

蜡笔小新 2024-11-13 18:41:58
search
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
search
理工科男女不容错过的神奇资源网站

十一长假即将结束，你的假期学习计划进展如何？无论你是在家中、思念家乡，还是身处异国他乡，理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档，能够帮助你在假期中高效学习和提升专业技能。 ... [详细]

蜡笔小新 2024-11-01 11:51:44
function
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
sum
《Linux高性能服务器编程》深入解析：3.2 TCP报头结构与功能

在《Linux高性能服务器编程》一书中，第3.2节深入探讨了TCP报头的结构与功能。TCP报头是每个TCP数据段中不可或缺的部分，它不仅包含了源端口和目的端口的信息，还负责管理TCP连接的状态和控制。本节内容详尽地解析了TCP报头的各项字段及其作用，为读者提供了深入理解TCP协议的基础。 ... [详细]

蜡笔小新 2024-11-10 14:18:44
search
如何更有效地提升对支持部门的协助与支撑？ - Enhancing Support for the Support Department: Strategies and Best Practices

尽管我们尽最大努力，任何软件开发过程中都难免会出现缺陷。为了更有效地提升对支持部门的协助与支撑，本文探讨了多种策略和最佳实践，旨在通过改进沟通、增强培训和支持流程来减少这些缺陷的影响，并提高整体服务质量和客户满意度。 ... [详细]

蜡笔小新 2024-11-07 06:55:33
search
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
function
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
python
基于OpenCV的图像拼接技术实践与示例代码解析

图像拼接技术在全景摄影中具有广泛应用，如手机全景拍摄功能，通过将多张照片根据其关联信息合成为一张完整图像。本文详细探讨了使用Python和OpenCV库实现图像拼接的具体方法，并提供了示例代码解析，帮助读者深入理解该技术的实现过程。 ... [详细]

蜡笔小新 2024-11-03 12:48:59
sum
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
function
吴恩达深度学习课程笔记：第一部分第三周——浅层神经网络详解

浅层神经网络解析：本文详细探讨了两层神经网络（即一个输入层、一个隐藏层和一个输出层）的结构与工作原理。通过吴恩达教授的课程，读者将深入了解浅层神经网络的基本概念、参数初始化方法以及前向传播和反向传播的具体实现步骤。此外，文章还介绍了如何利用这些基础知识解决实际问题，并提供了丰富的实例和代码示例。 ... [详细]

蜡笔小新 2024-11-02 12:20:03
python
Python与R语言的功能对比及应用场景分析

Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性，但Python作为一种通用编程语言，适用于更广泛的领域，包括Web开发、自动化脚本和机器学习等。对于初学者而言，Python的学习曲线更为平缓，上手更加容易。此外，Python拥有庞大的社区支持和丰富的第三方库，使其在实际应用中更具灵活性和扩展性。 ... [详细]

蜡笔小新 2024-11-01 18:37:10
python
超分辨率技术的全球研究进展与应用现状综述

本文综述了图像超分辨率（Super-Resolution, SR）技术在全球范围内的最新研究进展及其应用现状。超分辨率技术旨在从单幅或多幅低分辨率（Low-Resolution, LR）图像中恢复出高质量的高分辨率（High-Resolution, HR）图像。该技术在遥感、医疗成像、视频处理等多个领域展现出广泛的应用前景。文章详细分析了当前主流的超分辨率算法，包括基于传统方法和深度学习的方法，并探讨了其在实际应用中的优缺点及未来发展方向。 ... [详细]

蜡笔小新 2024-10-31 15:10:48
function
Python编程中的高级技巧与应用

在Python编程中，掌握高级技巧对于提升代码效率和可读性至关重要。本文重点探讨了生成器和迭代器的应用，这两种工具不仅能够优化内存使用，还能简化复杂数据处理流程。生成器通过按需生成数据，避免了大量数据加载对内存的占用，而迭代器则提供了一种优雅的方式来遍历集合对象。此外，文章还深入解析了这些高级特性的实际应用场景，帮助读者更好地理解和运用这些技术。 ... [详细]

蜡笔小新 2024-10-30 16:12:26

z1996y

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

意念实时转语音！Facebook的非植入式脑机接口，解码准确率达到76%

铜灵 发自 凹非寺量子位 出品 | 公众号 QbitAI

如何意念转语音

缘起两年前

传送门

铜灵发自凹非寺
量子位出品 | 公众号 QbitAI