当前位置: 开发笔记 > 编程语言 > 正文

python如何实现人工智能应用_Python人工智能之初识接口

作者：农村小姑娘0 | 来源：互联网 | 2023-09-18 12:49

本节需要的两个工具:1.FFmpeg:链接：https:pan.baidu.coms1jonSAa_TG2XuaJEy3iTmHg密码：w6hk2.ba

本节需要的两个工具:

1.FFmpeg:

链接&＃xff1a;https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg

密码&＃xff1a;w6hk

2.baidu-aip:

pip install baidu-aip

一丶创建小机器人

目前市面上主流的AI技术提供公司有很多,比如百度,阿里,腾讯,主做语音的科大讯飞,做只能问答的图灵机器人等等

这些公司投入了很大一部分财力物力人力将底层封装,提供应用接口给我们,尤其是百度,完全免费的接口

既然百度这么仗义,咱们就不要浪费掉怎么好的资源,从百度AI入手,开启人工智能之旅

看看我大百度的AI大法,这些技术全部都是封装好的接口,看着就爽

接下来咱们就一步一步的操作一下

首先进入控制台,注册一个百度的账号(百度账号通用)

开通一下我们百度AI开放平台的授权

然后找到已开通服务中的百度语音

走到这里,想必已经知道咱们要从语音入手了,语音识别和语音合成

打开百度语音,进入语音应用管理界面,创建一个新的应用

创建一个应用

回到应用列表我们可以看到已创建的应用了

这里面有三个值 AppID , API Key , Secret Key 记住可以从这里面看到 , 在之后的学习中我们会用到

好了百度语音的应用已经创建完成了接下来我会用Python 代码作为实例进行应用及讲解

一.安装百度的人工智能SDK:

首先咱们要 pip install baidu-aip 安装一个百度人工智能开放平台的Python SDK实在是太方便了,这也是为什么我们选择百度人工智能的最大原因

安装完成之后就来测试一下:

from aip importAipSpeech"""你的 APPID AK SK"""APP_ID&＃61; &＃39;15520977&＃39;API_KEY&＃61; &＃39;DlG7q19rfg1XEgsI7KVfgZe&＃39;SECRET_KEY&＃61; &＃39;tt12zkFdv0e2pIwCH4cSzgqu1yKDZ3B&＃39;client&＃61;AipSpeech(APP_ID, API_KEY, SECRET_KEY)

result&＃61; client.synthesis(&＃39;你好呀&＃39;, &＃39;zh&＃39;, 1, {&＃39;vol&＃39;: 5,&＃39;spd&＃39;: 3,&＃39;pit&＃39;: 7,&＃39;per&＃39;: 4,

})#识别正确返回语音二进制错误则返回dict 参照下面错误码

if notisinstance(result, dict):

with open(&＃39;audio.mp3&＃39;, &＃39;wb&＃39;) as f:

f.write(result)

在工程目录下,就可以看到 s1.mp3 这个文件了,来听一听

上面咱们测试了一个语音合成的例子,那么就从语音合成开始入手

二.语音合成:

技术上,代码上任何的疑惑,都可以从官方文档中得到答案

baidu-aip Python SDK 语音合成技术文档 : https://ai.baidu.com/docs#/TTS-Online-Python-SDK/top

刚才我们做了一个语音合成的例子,就用这个例子来展开说明

先来看第一段代码

from aip importAipSpeech"""你的 APPID AK SK"""APP_ID&＃61; &＃39;15421977&＃39;API_KEY&＃61; &＃39;DlG7q19rfg1X1EjsI7KVfgZe&＃39;SECRET_KEY&＃61; &＃39;tt12zkFdv0e2pIdwH4cSzgqu1yKDZ3B&＃39;client&＃61; AipSpeech(APP_ID, API_KEY, SECRET_KEY)

这是与百度进行一次加密校验 , 认证你是合法用户合法的应用

AipSpeech 是百度语音的客户端认证成功之后,客户端将被开启,这里的client 就是已经开启的百度语音的客户端了

再来看第二段代码:

result &＃61; client.synthesis(&＃39;你好呀&＃39;, &＃39;zh&＃39;, 1, {&＃39;vol&＃39;: 5,&＃39;spd&＃39;: 3,&＃39;pit&＃39;: 7,&＃39;per&＃39;: 4,

})#识别正确返回语音二进制错误则返回dict 参照下面错误码

if notisinstance(result, dict):

with open(&＃39;audio.mp3&＃39;, &＃39;wb&＃39;) as f:

f.write(result)

用百度语音客户端中的synthesis方法,并提供相关参数

成功可以得到音频文件,失败则返回一段错误信息

从参数入手分析:

按照这些参数,从新发起一个语音合成

这都是语音语调的作用 0 - 9 其实就是御姐音 - 萝莉音

这就是人工智能中的语音合成技术,调用百度的SDK,只用了5分钟,完成了1年的开发量,哈哈哈哈

一定要自己练习一下语音合成, 别把它玩儿坏了

三.语音识别:

哎,每次到这里,我都默默无语泪两行,声音这个东西格式太多样化了,如果要想让百度的SDK识别咱们的音频文件,就要想办法转变成百度SDK可以识别的格式PCM

目前DragonFire已知可以实现自动化转换格式并且屡试不爽的工具 : FFmpeg 这个工具的下载地址是 : 链接&＃xff1a;https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg 密码&＃xff1a;w6hk

FFmpeg 环境变量配置:

首先你要解压缩,然后找到bin目录,我的目录是 C:\ffmpeg\bin

然后以 windows 10 为例,配置环境变量

如果没搞明白的话,我也没有办法了,这么清晰这么明白

尝试一下,是否配置成功

看到这个界面就算配置成功了,配置成功有什么用呢, 这个工具可以将wav wma mp3 等音频文件转换为 pcm 无压缩音频文件

做一个测试,首先要打开windows的录音机,录制一段音频(说普通话)

现在假设录制的音频文件的名字为 audio.wav 放置在 D:\DragonFireAudio\

然后我们用命令行对这个 audio.wav 进行pcm格式的转换然后得到 audio.pcm

命令是 : ffmpeg -y -i audio.wav -acodec pcm_s16le -f s16le -ac 1 -ar 16000 audio.pcm

然后打开目录就可以看到pcm文件了

pcm文件已经得到了,赶紧进入正题吧

百度语音识别SDK的应用:

前提是你的audio.pcm 要与你当前的文件在同一个目录,还是分段看一下代码

读取文件的内容,file_context 是 audio.pcm 文件打开的二进制流

asr函数需要四个参数,第四个参数可以忽略,自有默认值,参照一下这些参数是做什么的

第一个参数: speech 音频文件流建立包含语音内容的Buffer对象, 语音文件的格式&＃xff0c;pcm 或者 wav 或者 amr。(虽说支持这么多格式,但是只有pcm的支持是最好的)

第二个参数: format 文件的格式,包括pcm(不压缩)、wav、amr (虽说支持这么多格式,但是只有pcm的支持是最好的)

第三个参数: rate 音频文件采样率如果使用刚刚的FFmpeg的命令转换的,你的pcm文件就是16000

第四个参数: dev_pid 音频文件语言id 默认1537(普通话输入法模型)

再来看下一段代码,打印返回结果:

成功的dict中 result 就是我们要的识别文本

失败的dict中 err_no 就是我们要的错误编码,错误编码代表什么呢?

如果err_no不是0的话,就参照一下错误码表

到此百度AI语音部分的调用就结束了,是不是感觉很简单

推荐阅读

js
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
js
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
js
Python爬虫实战：豆瓣电影Top250数据抓取

本文详细介绍了如何使用Python编写爬虫程序，从豆瓣电影Top250页面抓取电影信息。文章涵盖了从基础的网页请求到处理反爬虫机制，再到多页数据抓取的全过程，并提供了完整的代码示例。 ... [详细]

蜡笔小新 2024-12-27 16:55:07
js
资源推荐 | TensorFlow官方中文教程助力英语非母语者学习

来源：机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南，帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]

蜡笔小新 2024-12-28 09:00:51
js
深入理解Cookie与Session会话管理

本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息，以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制，解释其原理及应用场景。 ... [详细]

蜡笔小新 2024-12-27 18:20:43
io
解决 Python 项目中 setuptools_rust 模块缺失问题

本文介绍了在安装或运行 Python 项目时遇到的 'ModuleNotFoundError: No module named setuptools_rust' 错误，并提供了解决方案。 ... [详细]

蜡笔小新 2024-12-27 18:06:18
copy
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
copy
360SRC安全应急响应：从漏洞提交到修复的全过程

本文详细介绍了360SRC平台处理一起关键安全事件的过程，涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例，展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]

蜡笔小新 2024-12-27 11:10:05
copy
离线环境下的Python及其第三方库安装指南

在项目开发中，有时会遇到电脑只能连接内网或完全无法联网的情况。本文将详细介绍如何在这种环境下安装Python及其所需的第三方库，确保开发工作的顺利进行。 ... [详细]

蜡笔小新 2024-12-26 19:51:48
yaml
使用Python在SAE上开发新浪微博应用的初步探索

最近重新审视了新浪云平台（SAE）提供的服务，发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用，并分享开发过程中的关键步骤。 ... [详细]

蜡笔小新 2024-12-26 13:36:52
search
Python 爬虫基础教程及代码实例

根据最新发布的《互联网人才趋势报告》，尽管大量IT从业者已转向Python开发，但随着人工智能和大数据领域的迅猛发展，仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-26 10:42:40
js
Python文本处理与可视化：分词及词云生成

本文介绍如何使用Python进行文本处理，包括分词和生成词云图。通过整合多个文本文件、去除停用词并生成词云图，展示文本数据的可视化分析方法。 ... [详细]

蜡笔小新 2024-12-26 08:37:18
js
牛客携手阿里云，提升全球在线面试体验

通过与阿里云的合作，牛客网成功解决了跨国视频面试中的网络卡顿问题，为求职者和面试官提供了更加流畅的沟通体验。 ... [详细]

蜡笔小新 2024-12-26 06:14:52
js
ThinkPHP框架中处理JS和CSS缓存问题的解决方案

本文探讨了在ThinkPHP框架中，当启用调试模式（APP_DEBUG）时，删除public文件夹中的CSS和JS文件后页面仍然显示旧样式的问题，并提供了一种有效的解决方法。 ... [详细]

蜡笔小新 2024-12-25 20:55:44
js
Babylon.js 实例展示

探索 Babylon.js 的强大功能，通过全屏演示体验其卓越性能。本文提供在线文档链接和默认渲染管线的源码调试地址，帮助您深入了解 Babylon.js 的工作原理。 ... [详细]

蜡笔小新 2024-12-25 18:55:24

农村小姑娘0

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章