c++tostring函数不能识别_基于MCU设计的语音识别系统

作者：天边的云YEAH_988 | 来源：互联网 | 2023-10-12 10:37

0引言传统的人机交互依靠复杂的键盘或按钮来实现，随着科技的发展，一些新型的人机交互方式也随之诞生，带给人们全新的体验。基于语音识别的人机交

0 引言

传统的人机交互依靠复杂的键盘或按钮来实现&＃xff0c;随着科技的发展&＃xff0c;一些新型的人机交互方式也随之诞生&＃xff0c;带给人们全新的体验。基于语音识别的人机交互方式是目前热门的技术之一。但是语音识别功能算法复杂、计算量大&＃xff0c;一般在计算机上实现&＃xff0c;即使是嵌入式方面&＃xff0c;多数方案也需要运算能力强的 ARM 或 DSP&＃xff0c;并且外扩 RAM、FLASH 等资源&＃xff0c;增加了硬件成本&＃xff0c;这些特点无疑限制了语音识别技术的应用&＃xff0c;尤其是嵌入式领域。

本系统采用的主控 MCU为 Atmel 公司的 ATMEGA128&＃xff0c;语音识别功能则采用 ICRoute 公司的单芯片 LD3320。LD3320 内部集成优化过的语音识别算法&＃xff0c;无需外部 FLASH&＃xff0c;RAM 资源&＃xff0c;可以很好地完成非特定人的语音识别任务。

1 整体方案设计

1&＃xff0e;1 语音识别原理

在计算机系统中&＃xff0c;语音信号本身的不确定性、动态性和连续性是语音识别的难点。主流的语音识别技术是基于统计模式识别的基本理论&＃xff0c;原理如图 1 所示。

2&＃xff0e;1 控制器电路

控制器选用 Atmel 公司生产的 ATMEGA128 芯片&＃xff0c;采用先进的 RISC 结构&＃xff0c;内置 128 KB FLASH&＃xff0c;4 KB SRAM&＃xff0c;4 KB E2PROM 等丰富资源。该芯片是业界高性能、低功耗的 8 位微处理器&＃xff0c;并在 8 位单片机市场有着广泛应用。

2&＃xff0e;2 LD3320 语音识别电路

LD3320 芯片是一款“语音识别”专用芯片。该芯片集成了语音识别处理器和一些外部电路&＃xff0c;包括 A&＃xff0f;D、D&＃xff0f;A 转换器、麦克风接口、声音输出接口等&＃xff0c;而且可以播放 MP3。不需要外接任何的辅助芯片如 FLASH&＃xff0c;RAM 等&＃xff0c;直接集成到产品中即可以实现语音识别、声控、人机对话功能。

图 3 为 LD3320 电路原理图&＃xff0c;与 MCU 通信采用 SPI 总线方式&＃xff0c;时钟不能超过 1&＃xff0e;5MHz。

麦克风工作电路如图 4 所示&＃xff0c;音频输出只需将扬声器连接到 SPOP 和 SPON 即可。使用 SPI 总线方式时&＃xff0c;LD3320 的 MD 要设为高电平&＃xff0c;SPIS 设为低电平。SPI 总线的引脚有 SDI&＃xff0c;SDO&＃xff0c;SDCK 以及 SCS。INTB 为中断端口&＃xff0c;当有识别结果或 MP3 数据不足时&＃xff0c;会触发中断&＃xff0c;通知 MCU 处理。RSTB 引脚是 LD3320 复位端&＃xff0c;低电平有效。LED1&＃xff0c;LED2 作为上电指示灯。

3 软件系统设计

软件设计主要有两部分&＃xff0c;分别为移植 LD3320 官方代码和编写语音识别应用程序。

3&＃xff0e;1 移植 LD3320 源代码

LD3320 源代码是基于 51 单片机实现的&＃xff0c;SPI 部分采用的是软件模拟方式&＃xff0c;但在播放 MP3 数据时会有停顿现象&＃xff0c;原因是 51 单片机主频较低&＃xff0c;导致 SPI 速率很慢&＃xff0c;不能及时更新 MP3 数据。移植到 ATMEGA128 需要修改底层寄存器读写函数、中断函数等。底层驱动在 Reg_RW&＃xff0e;c 文件中&＃xff0c;首先在 Reg_RW&＃xff0e;h 使用 HARD_PARA_PORT 宏定义&＃xff0c;以支持硬件 SPI。然后在 Reg_RW&＃xff0e;c 文件中找到 HARD_PARA_PORT 对应条件宏的代码段&＃xff0c;保留 AVR 的 SPI 接口代码。

3&＃xff0e;2 应用程序实现

在代码中预先设定几个单词&＃xff1a;“你好”&＃xff0c;“播放音乐”&＃xff0c;“打开”。当用户说“播放音乐”时&＃xff0c;MCU 控制 LD3320 播放一段音乐&＃xff0c;如果是其他词语&＃xff0c;则在串口中打印识别结果&＃xff0c;然后再次转换到语音识别状态。

3&＃xff0e;2&＃xff0e;1 MP3 播放代码

LD3320 支持 MP3 数据播放&＃xff0c;播放声音的操作顺序为&＃xff1a;

通用初始化→MP3 播放用初始化→调节播放音量→开始播放。

将 MP3 数据顺序放入数据寄存器&＃xff0c;芯片播放完一定数量的数据时会发出中断请求&＃xff0c;在中断函数中连续送入声音数据&＃xff0c;直到声音数据结束。MP3 播放函数实现代码如下&＃xff1a;

由于 MCU 容量限制&＃xff0c;选取测试的 MP3 文件不能太大。首先在计算机上将 MP3 文件的二进制数据转为标准 C 数组格式文件&＃xff0c;然后将该文件加入工程中。源代码中 MP3 文件存储在外扩的 SPI FLASH 中&＃xff0c;工程中需要注释和移除全部相关代码。MP3 数据读取函数是 LD_ReloadMp3Data&＃xff0c;只需将读取的 SPI FLASH 数据部分改成以数组数据读取的方式即可。

3&＃xff0e;2&＃xff0e;2 语音识别程序

LD3320 语音识别芯片完成的操作顺序为&＃xff1a;通用初始化→ASR 初始化→添加关键词→开启语音识别。在源代码中的 RunASR函数已经实现了上面的过程&＃xff0c;直接调用即可开启语音识别功能。

RunASR函数代码如下&＃xff1a;

用户说完话后&＃xff0c;LD3320 通过打分的方式&＃xff0c;将关键词列表中特征最相似的一个作为输出。然后 LD3320 会产生一个中断信号&＃xff0c;此时 MCU 跳入中断函数读取 C5 寄存器的值&＃xff0c;该值即为识别结果&＃xff0c;得到结果后&＃xff0c;用户可以根据数值来实现一些功能&＃xff0c;比如读取到 1&＃xff0c;说明是“播放音乐”&＃xff0c;那么可以调用前面的 PlaySound函数来播放音乐。

语音识别控制的关键点在于语音识别的准确率。表 1 给出了测试结果&＃xff0c;当然也可以在识别列表中加入更多的关键词来做测试。通过测试结果可以看出&＃xff0c;LD3320 的识别率在 95&＃xff05;上&＃xff0c;能够满足用户需求。

4 结语

本文讨论了基于 AVR 单片机的语音识别系统设计的可行性&＃xff0c;并给出了设计方案。通过多次测试结果表明&＃xff0c;本系统具有电路运行稳定&＃xff0c;语音识别率高&＃xff0c;成本低等优点。同时借助于 LD3320 的 MP3 播放功能&＃xff0c;该系统具有一定的交互性和娱乐性。移植性方面&＃xff0c;系统通过简单的修改&＃xff0c;可以很方便地将 LD3320 驱动程序移植到各种嵌入式系统中。随着人们对人工智能功能的需求&＃xff0c;语音识别技术将越来越受到人们的关注&＃xff0c;相信不久的将来&＃xff0c;语音识别将会拥有更广阔的应用。

推荐阅读

hash
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
hash
2023年京东Android面试真题解析与经验分享

本文由一位拥有6年Android开发经验的工程师撰写，详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]

蜡笔小新 2024-12-26 17:45:48
format
CUGB图论专题：排水系统中的最大流问题 - EK与Dinic算法解析

本题探讨如何通过最大流算法解决农场排水系统的设计问题。题目要求计算从水源点到汇合点的最大水流速率，使用经典的EK（Edmonds-Karp）和Dinic算法进行求解。 ... [详细]

蜡笔小新 2024-12-25 17:47:23
get
深入理解KMP算法中的next数组：北大OJ 2406题解

本文详细探讨了KMP算法中next数组的构建及其应用，重点分析了未改良和改良后的next数组在字符串匹配中的作用。通过具体实例和代码实现，帮助读者更好地理解KMP算法的核心原理。 ... [详细]

蜡笔小新 2024-12-28 11:30:01
hash
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
settings
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
format
HDFS与Hive中的数据存储和管理机制

本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射，详细解释了两者的创建、加载及删除操作，并提供了查看表详细信息的方法。通过对比这两种表类型，帮助读者理解如何更好地管理和保护数据。 ... [详细]

蜡笔小新 2024-12-27 20:21:48
get
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
get
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
string
深入理解C++中的KMP算法：高效字符串匹配的利器

本文详细介绍C++中实现KMP算法的方法，探讨其在字符串匹配问题上的优势。通过对比暴力匹配（BF）算法，展示KMP算法如何利用前缀表优化匹配过程，显著提升效率。 ... [详细]

蜡笔小新 2024-12-27 14:45:30
hash
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
main
C++ 中的数组与动态数组初始化

本文探讨了 C++ 中普通数组和标准库类型 vector 的初始化方法。普通数组具有固定长度，而 vector 是一种可扩展的容器，允许动态调整大小。文章详细介绍了不同初始化方式及其应用场景，并提供了代码示例以加深理解。 ... [详细]

蜡笔小新 2024-12-26 15:38:03
main
C语言的起源与发展历程

本文详细介绍了C语言的起源、发展及其标准化过程，涵盖了从早期的BCPL和B语言到现代C语言的演变，并探讨了其在操作系统和跨平台编程中的重要地位。 ... [详细]

蜡笔小新 2024-12-23 14:11:43
case
C语言实现小写金额转换为大写金额

在金融和会计领域，准确无误地填写票据和结算凭证至关重要。这些文件不仅是支付结算和现金收付的重要依据，还直接关系到交易的安全性和准确性。本文介绍了一种使用C语言实现小写金额转换为大写金额的方法，确保数据的标准化和规范化。 ... [详细]

蜡笔小新 2024-12-27 12:39:06
get
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18

天边的云YEAH_988

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章