flask与js交互的示例代码_基于EAIDK310和SoundAIAzero的语音交互系统

作者：qtl4431541 | 来源：互联网 | 2023-07-28 09:31

一、概述语音交互技术的发展，给我们的生活带来了很大的改变，智能音箱就是其典型的应用产品，比如现在常见的小爱、小度、天猫精灵等智能音箱。我们

一、概述

语音交互技术的发展&＃xff0c;给我们的生活带来了很大的改变&＃xff0c;智能音箱就是其典型的应用产品&＃xff0c;比如现在常见的小爱、小度、天猫精灵等智能音箱。我们通过与智能音箱对话&＃xff0c;就可以实现听歌、听书、听新闻等等功能。

今天&＃xff0c;我们就介绍下以EAIDK-310开发套件为核心&＃xff0c;“制作”一款智能音箱&＃xff0c;通过语音交互&＃xff0c;让它给我们唱歌、读书、讲段子。

二、产品介绍

EAIDK(Embedded Artificial Intelligence Development Kit)- 嵌入式人工智能开发套件,是全球首个采用Arm架构的人工智能开发平台&＃xff0c;是OPEN AI LAB专为 AI 开发者精心打造&＃xff0c;面向边缘计算的人工智能开发套件。硬件平台具备语音、视觉等传感器数据采集能力&＃xff0c;及适用于多场景的运动控制接口&＃xff1b;智能软件平台支持视觉处理与分析、语音识别、语义分析、SLAM等应用的基础平台和主流开源算法&＃xff0c;满足端侧AI教育、算法应用开发、产品原型开发验证等需求。

EAIDK-310作为EAIDK产品系列中的一款套件&＃xff0c;该套件硬件平台使用的是含有4核A53 CPU的高性能Arm SoC(瑞芯微rk3228H)&＃xff0c;通过搭载OPEN AI LAB开发的嵌入式深度学习框架Tengine&＃xff0c;为AI应用提供简洁、高效、统一的API接口&＃xff0c;加速终端AI产品的场景化应用落地实现。同时&＃xff0c;使用自建的源服务器&＃xff0c;便于用户快速上手使用。

EAIDK平台&＃xff0c;配置专有更新源文档内容服务&＃xff0c;该源服务器支持Tengine/Blade CV以及其他标准第三方软件安装和更新。

EAIDK-310 硬件规格

EAIDK-310 软件规格

实现本案例除了需要一块EAIDK-310核心板&＃xff0c;我们还需要一个usb麦克风阵列和一个usb音箱。麦克风阵列用于音频采集&＃xff0c;usb音箱用于音频播放。

本案例中我们使用的是4mic麦克风线型阵列SoundPi linear麦克风模组&＃xff0c;购买链接(https://dwz.cn/67hqlbFD)。

三、操作步骤

3.1 下载源码

首先我们从下面链接中下载源码包Azero_SDK_for_Linux.tar.gz
ftp://ftp.eaidk.net/EAIDK310_Source/SoundAI/

把下载好的源码包拷贝到U盘&＃xff0c;把U盘插入EAIDK310设备usb口&＃xff0c;将源码包拷贝到板子目录下

cp /run/media/openailab/Azero_SDK_for_Linux.tar.gz ~

解压源码包Azero_SDK_for_Linux.tar.gz&＃xff0c;然后进入Azero_SDK_for_Linux目录

tar -xzvf Azero_SDK_for_Linux.tar.gz cd Azero_SDK_for_Linux/

可以看到&＃xff0c;SDK工程结构如下

3.2 修改文件参数

下载源码后&＃xff0c;我们需要根据我们设备实际情况修改某些文件参数&＃xff0c;如麦克风节点、比特率等。

首先将麦克风通过USB接口连接到EAIDK-310开发套件

此时可以在开发套件上用命令可查询到麦克风线性阵列的设备节点&＃xff0c;结果如下&＃xff1a;

arecord -l

从上图可知&＃xff0c;card2就是我们的usb麦克风阵列&＃xff0c;设备节点为2,0

修改代码Azero_SDK_for_Linux/src/main.cpp的麦克风数量mic_num和实际节点号*hw&＃xff0c;此麦克风比特率默认16000。

void* load_plugin_basex() { void *handle; int mic_num &＃61; 4; int board_num &＃61; 8; int frame &＃61; 16*16; const char *hw &＃61; "hw:2,0"; char chmap[16] &＃61; "0,1,2,3,4,5,6,7"; handle &＃61; SaiMicBaseX_Init(board_num, mic_num, frame, hw); SaiMicBaseX_SetBit(handle,16); SaiMicBaseX_SetSampleRate(handle,16000); SaiMicBaseX_SetMicShiftBits(handle,16); SaiMicBaseX_SetRefShiftBits(handle,16); SaiMicBaseX_SetPeroidSize(handle,512); SaiMicBaseX_SetBufferSize(handle,2048);

注&＃xff1a;在修改上述参数之前&＃xff0c;我们可以先使用arecord进行录音测试&＃xff0c;看是否能够正常获取音频数据&＃xff0c;以此为依据来确认我们mic的具体参数

arecord -Dhw:2,0 -d 10 -f S16_LE -r 16000 -c 8 -t wav test.wav

参数解析
-D 指定了录音设备&＃xff0c;2,0 是card 2 device 0的意思
-d 指定录音的时长&＃xff0c;单位时秒
-f 指定录音格式
-r 指定了采样率&＃xff0c;单位时Hz
-c 指定channel 个数
-t 指定生成的文件格式

拷贝资源及配置文件到/data目录

sudo mkdir -p /data sudo chmod 777 /data sudo cp sai_config/arm/* /data -rf

设置环境变量&＃xff0c;指定动态链接库路径

export LD_LIBRARY_PATH&＃61;./link-libs/aarch64-linux-gnu/lib/

3.3 编译运行

根据麦克风实际情况修改完上述参数后&＃xff0c;即可执行编译

./run.sh aarch64-gnu

编译成功的话会显示如下

执行如下命令来启动软件

./sai_client

启动软件之后&＃xff0c;在联网的情况下&＃xff0c;通过喊 “小艺小艺”来唤醒设备&＃xff0c;然后即可进行语音交互。将 usb音箱接到EAIDK-310开发套件上&＃xff0c;即可听到小艺的回应。

到这里&＃xff0c;我们就可以与小艺进行对话了。除常见的聊天、新闻、广播、天气、音乐等功能外&＃xff0c;还可以查百科、查路况、听相声、做算术等&＃xff0c;有几十项实用、好玩的技能&＃xff0c;内容还是比较丰富的&＃xff0c;可以满足简单的娱乐需求。

3.4 补充

main.cpp软件初始化时有三个重要参数&＃xff1a;clientId、productId以及device_SN(Device Serial Number)。其中&＃xff0c;clientId、productId用以标识产品类别&＃xff0c;device_SN用以标识个体设备。

//config customer info const char *client_ID &＃61; "xxxxxxxx"; //set to your own client const char *product_ID &＃61; "xxxxxxxx"; //set your owner product ID const char *device_SN &＃61; "xxxxxxxx"; //set the unique device SN. azero_set_customer_info(client_ID,product_ID,device_SN);

此处软件已经配置了默认的ID &＃xff0c;所以上面我们跳过了这个步骤&＃xff1b;如需使用自己创建的技能&＃xff0c;可以参考https://github.com/sai-azero/Azero_SDK_for_Linux的《示例运行》&＃xff0c;注册、填写自己的clientId、productId以及device_SN等参数&＃xff0c;重新编译运行即可。

关于麦克风阵列&＃xff0c;此处使用的是声智科技的4mic线型阵列&＃xff0c;另外也可以使用声智科技的6mic环型阵列&＃xff0c;如下图

四、总结

此案例可以帮助大家在EAIDK-310开发套件上完成SoundAI Azero语音交互系统示例的部署和运行。

通过此案例&＃xff0c;EAIDK-310摇身一变&＃xff0c;成为了我们所熟知的智能音箱。智能语音助手是存在于智能音箱中的虚拟形象&＃xff0c;当你无聊的时候&＃xff0c;或者需要提神醒脑的时候&＃xff0c;可以试着问它一些“有趣的问题”&＃xff0c;或许能够得到一些“有趣的回答 ”。

如有疑问或想要了解更多关于EAIDK开发平台方面的内容&＃xff0c;欢迎加入EAIDK开发者大本营&＃xff0c;QQ群&＃xff1a;625546458。

推荐阅读

function
Linux信号量操作详解：sem_init, sem_wait, sem_post, sem_destroy

本文详细介绍了Linux系统中信号量的相关函数，包括sem_init、sem_wait、sem_post和sem_destroy，解释了它们的功能和使用方法，并提供了示例代码。 ... [详细]

蜡笔小新 2024-11-21 21:21:16
export
Red Hat Linux 下 GCC 4.4.2 的安装指南

本文详细介绍了在 Red Hat Linux 系统上安装 GCC 4.4.2 的步骤，包括必要的依赖库的安装及常见问题的解决方法。 ... [详细]

蜡笔小新 2024-11-22 10:41:00
export
探索阿里巴巴的开源世界

从理想主义者的内心深处萌发的技术信仰，推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]

蜡笔小新 2024-11-21 09:06:54
metadata
对象存储与块存储、文件存储等对比

看到一篇文档，讲对象存储，好奇，搜索文章，摘抄,学习记录！背景：传统存储在面对海量非结构化数据时，在存储、分享与容灾上面临很大的挑战，主要表现在以下几个方面：传统存储并非为非结 ... [详细]

蜡笔小新 2024-11-17 18:21:23
text
Nginx 配置下 Chrome 和 Firefox 对静态资源缓存处理差异

在使用 Nginx 作为服务器时，发现 Chrome 能正确从缓存中读取 CSS 和 JS 文件，而 Firefox 却无法有效利用缓存，导致加载速度显著变慢。 ... [详细]

蜡笔小新 2024-11-21 19:57:43
text
龙蜥社区开发者访谈：技术生涯的三次蜕变 | 第3期

龙蜥社区的开发者们通过自己的实践和经验，推动着开源技术的发展。本期「龙蜥开发者说」聚焦于一位资深开发者的三次技术转型，分享他在龙蜥社区的成长故事。 ... [详细]

蜡笔小新 2024-11-21 11:12:28
list
深入探讨前端代码优化策略

本文深入讨论了前端开发中代码优化的关键技术，包括JavaScript、HTML和CSS的优化方法，旨在提升网页加载速度和用户体验。 ... [详细]

蜡笔小新 2024-11-21 10:57:01
client
入门指南：使用FastRPC技术连接Qualcomm Hexagon DSP

本文旨在为初学者提供关于如何使用FastRPC技术连接Qualcomm Hexagon DSP的基础知识。FastRPC技术允许开发者在本地客户端实现远程调用，从而简化Hexagon DSP的开发和调试过程。 ... [详细]

蜡笔小新 2024-11-21 10:03:34
python
Python 领跑！2019年2月编程语言排名更新

根据最新的编程语言流行指数（PYPL）排行榜，Python 在2019年2月的份额达到了26.42%，稳坐榜首位置。 ... [详细]

蜡笔小新 2024-11-21 09:18:39
export
Vue3中如何提高开发效率

小编给大家分享一下Vue3中如何提高开发效率，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获， ... [详细]

蜡笔小新 2024-11-20 15:33:07
node.js
实践指南：使用Express、Create React App与MongoDB搭建React开发环境

本文详细介绍了如何利用Express、Create React App和MongoDB构建一个高效的React应用开发环境，旨在为开发者提供一套完整的解决方案，包括环境搭建、数据模拟及前后端交互。 ... [详细]

蜡笔小新 2024-11-20 10:05:15
callback
Flutter 核心技术与混合开发模式深入解析

本文深入探讨了 Flutter 的核心技术，特别是其混合开发模式，包括统一管理模式和三端分离模式，以及混合栈原理。通过对比不同模式的优缺点，帮助开发者选择最适合项目的混合开发策略。 ... [详细]

蜡笔小新 2024-11-19 13:48:51
callback
Java代码保护与混淆：ProGuard详解

在Java开发中，保护代码安全是一个重要的课题。由于Java字节码容易被反编译，因此使用代码混淆工具如ProGuard变得尤为重要。本文将详细介绍如何使用ProGuard进行代码混淆，以及其基本原理和常见问题。 ... [详细]

蜡笔小新 2024-11-18 16:46:17
sum
c# 项目文件，C#viual studio使用方法

一、项目文件1）Properties节点下主要存放的是当前程序集相关的信息，如版本号、标题等。双击”Properties“，打开如下项目属 ... [详细]

蜡笔小新 2024-11-18 09:51:05
list
深入解析RelativeLayout、LinearLayout与FrameLayout的性能差异

本文详细分析了FrameLayout和LinearLayout的性能对比，通过具体的测量数据和源码解析，探讨了不同布局在不同场景下的性能表现。 ... [详细]

蜡笔小新 2024-11-17 16:09:35

qtl4431541

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章