当前位置: 开发笔记 > 运维 > 正文

Python基于百度AI实现OCR文字识别

作者：望奇迹般地神话 | 来源：互联网 | 2021-10-29 05:39

这篇文章主要介绍了Python基于百度AI实现OCR文字识别,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

百度AI功能还是很强大的，百度AI开放平台真的是测试接口的天堂，免费接口很多，当然有量的限制，但个人使用是完全够用的，什么人脸识别、MQTT服务器、语音识别等等，应有尽有。

看看OCR识别免费的量

快速安装：执行pip install baidu-aip即可

新建一个AipOcr：

from aip import AipOcr

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

通用文字识别

""" 读取图片 """
def get_file_content(filePath):
  with open(filePath, 'rb') as fp:
    return fp.read()

image = get_file_content('example.jpg')

""" 调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image);

""" 如果有可选参数 """
optiOns= {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"

""" 带参数调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image, options)

url = "http//www.x.com/sample.jpg"

""" 调用通用文字识别, 图片参数为远程url图片 """
client.basicGeneralUrl(url);

""" 如果有可选参数 """
optiOns= {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"

""" 带参数调用通用文字识别, 图片参数为远程url图片 """
client.basicGeneralUrl(url, options)

通用文字识别请求参数详情

通用文字识别返回数据参数详情

通用文字识别

from aip import AipOcr

#更换为自己的注册信息
APP_ID = '---'
API_KEY = '---'
SECRET_KEY = '---'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)#创建连接
fp=open("tu2.png","rb").read()#打开并读取文件内容
res=client.basicGeneral(fp)#普通
#print(res)

#将所有的文字都合并到一起
strx=""
for tex in res["words_result"]:#遍历结果
  strx+=tex["words"]#每一行
print(strx)#输出内容

最终代码

from aip import AipOcr
 
# 定义常量
APP_ID = '14544448'
API_KEY = 'yRZGUXAlCd0c9vQj1kAjBEfY'
SECRET_KEY = 'sc0DKGy7wZ9MeWFGZnbscbRyoDB2IQlj'
 
# 初始化AipFace对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
 
# 读取图片
def get_file_content(filePath):
  with open(filePath, 'rb') as fp:
    return fp.read()
 
image = get_file_content('binary_best.jpg')
# 调用通用文字识别, 图片为本地图片
res=client.general(image)
print(res)
 
for item in res['words_result']:
  print(item['words'])

例：

from aip import AipOcr
import re
APP_ID='17010327'
API_KEY='X2MWCU1LG1PX5H6GAXgdlWD7'
SECRET_KEY='vz6GZ6TkhSFvY3quqcuC3EG8oEW3kThB'
client=AipOcr(APP_ID,API_KEY,SECRET_KEY)

i=open(r'C:\Users\Administrator\Desktop\example.png','rb')
image = i.read()

result=client.basicGeneral(image)

#将所有的文字都合并到一起
for item in result['words_result']:
  print(item['words'])

通用文字识别client.basicGeneral(image)

通用文字识别（高精度版）client.basicAccurate(image);

通用文字识别（含位置信息版）client.general(image);

通用文字识别（含位置高精度版）client.accurate(image);

通用文字识别（含生僻字版）client.enhancedGeneral(image);

网络图片文字识别client.webImage(image);

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

推荐阅读

linux
MySQL 安装指南

本文档提供了详细的MySQL安装步骤，包括解压安装文件、选择安装类型、配置MySQL服务以及设置管理员密码等关键环节，帮助用户顺利完成MySQL的安装。 ... [详细]

蜡笔小新 2024-11-27 09:10:30
linux
时序数据库的应用与设计策略

时序数据是指按时间顺序排列的数据集。通过时间轴上的数据点连接，可以构建多维度报表，揭示数据的趋势、规律及异常情况。 ... [详细]

蜡笔小新 2024-11-26 17:30:42
linux
Git版本控制基础解析

本文探讨了Git作为版本控制工具的基本概念及其重要性，不仅限于代码管理，还包括文件的历史记录与版本切换功能。通过对比Git与SVN，进一步阐述了分布式版本控制系统的独特优势。 ... [详细]

蜡笔小新 2024-11-24 19:32:57
port
Quartz 实现 Web 工程动态定时任务调度方案

本文探讨了一个Web工程项目的需求，即允许用户随时添加定时任务，并通过Quartz框架实现这些任务的自动化调度。文章将介绍如何设计任务表以存储任务信息和执行周期，以及如何通过一个定期扫描机制自动识别并加载新任务到调度系统中。 ... [详细]

蜡笔小新 2024-11-24 16:22:58
port
使用jQuery与百度地图API实现地址转经纬度功能

本文详细介绍了如何利用jQuery和百度地图API将地址转换为经纬度，包括申请API密钥、页面构建及核心代码实现。 ... [详细]

蜡笔小新 2024-11-24 14:33:10
port
物联网学习之旅：微信小程序控制STM32（三）STM32代码编写

STM32代码编写STM32端不需要写关于连接MQTT服务器的代码，连接的工作交给ESP8266来做，STM32只需要通过串口接收和发送数据，间接的与服务器交互。串口三配置串口一已 ... [详细]

蜡笔小新 2024-11-23 21:37:55
sudo
PHP版本选择指南：适应不同场景的最佳实践

本文详细探讨了如何根据不同的应用场景选择合适的PHP版本，包括多版本切换技巧、稳定性分析及针对WordPress等特定平台的版本建议。 ... [详细]

蜡笔小新 2024-11-23 17:00:59
ubuntu
H5技术实现经典游戏《贪吃蛇》

本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术，我们将探讨如何构建这款游戏的两种主要玩法：积分闯关和无尽模式。 ... [详细]

蜡笔小新 2024-11-21 20:16:59
ftp
Oracle VM VirtualBox 使用指南：创建静态网页及高级功能

本文详细介绍了如何在Oracle VM VirtualBox中实现主机与虚拟机之间的数据交换，包括安装Guest Additions增强功能，以及如何利用这些功能进行文件传输、屏幕调整等操作。 ... [详细]

蜡笔小新 2024-11-21 18:13:22
linux
软件测试行业深度解析：迈向高薪的必经之路

本文深入探讨了软件测试行业的发展现状及未来趋势，旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]

蜡笔小新 2024-11-21 17:32:44
linux
Android平台下的人脸识别应用：FaceU的深度解析与技术探讨

FaceU是一款由今日头条脸萌团队开发的拍照相机应用，支持iOS和Android平台。自2014年底启动开发以来，FaceU通过其创新的人脸识别技术和丰富的滤镜效果，在2015年9月迅速获得了用户的广泛认可。本文将深入解析FaceU的技术架构和实现方法，探讨其在Android平台下的应用前景和优化策略。 ... [详细]

蜡笔小新 2024-11-09 19:36:16
linux
去控件化在线文档处理，推动高效信创办公环境

探讨在线文档处理去控件化的趋势及其对构建高效信创办公生态的影响。 ... [详细]

蜡笔小新 2024-11-27 17:18:04
server
Qt TCP通信中的多线程服务器端设计

本文探讨了在Qt框架下实现TCP多线程服务器端的方法，解决了一个常见的问题：服务器端仅能与最后一个连接的客户端通信。通过继承QThread类并利用socketDescriptor标识符，实现了多个客户端与服务器端的同时通信。 ... [详细]

蜡笔小新 2024-11-27 16:31:40
dns
J2EE平台的13项核心技术规范

J2EE平台集成了多种服务、API和协议，旨在支持基于Web的多层应用开发。本文将详细介绍J2EE平台中的13项关键技术规范，涵盖从数据库连接到事务处理等多个方面。 ... [详细]

蜡笔小新 2024-11-27 16:27:50
server
如何清理远程桌面连接的缓存记录

了解如何有效清除远程桌面连接中的缓存记录，对于提升服务器安全性至关重要。本文将指导您完成这一过程。 ... [详细]

蜡笔小新 2024-11-27 13:32:08

望奇迹般地神话

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章