热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python处理txt文档里的双引号_「python」使用百度OCR进行文字识别将图片转TXT文档...

先要有百度的账号,在百度智能云的管理中心,找到人工智能-文字识别,然后选择创建应用,得到APP_ID、API_KEY、SEC

先要有百度的账号,在百度智能云管理中心,找到人工智能-文字识别,然后选择创建应用,得到APP_IDAPI_KEYSECRECT_KEY三个关键参数。

cc3719a2744d8fc7b76c3152a0187c8b.png

百度智能云控制台

然后打开cmd,输入如下代码:

pip install baidu-aip

然后再新建个python文件,输入如下代码:

import osimport timefrom aip import AipOcr# 功能:将图片提交到百度OCR转换成文本。# 2020-5-30:添加了判断txt文本是否存在,存在的话不进行ocr# 2020-10-3:添加识别当前路径#在下面的三行输入自己的参数APP_ID = 'xxxxxxx'API_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxxx'SECRECT_KEY = 'xxxxxxxxxxxxxxxxxxxx'client = AipOcr(APP_ID, API_KEY, SECRECT_KEY)path = os.getcwd() # 获取当前目录,图片目录fName = [] # 新建数组for root, dirs, files in os.walk(path): for name in files: # 在path里面查找文件 fName.append(os.path.join(root, name)) for name in dirs: # 在path子目录里面查找文件 fName.append(os.path.join(root, name))for f in fName: if f.split('.')[-1] == "jpg" or f.split('.')[-1] == "png": # 如果文件扩张名为jpg print(f) if not os.path.exists(path+(f.split("")[-1]).split(".") [0]+".txt"): t = open(path+(f.split("")[-1]).split(".") [0]+".txt", mode="w") # 创建与jpg同名的文档 img = open(f, 'rb').read() # 打开图片 message = client.basicAccurate(img) # 图片ocr try: res = message['words_result'] except Exception: time.sleep(6) message = client.basicAccurate(img) res = message['words_result'] for i in res: w = t.write(i['words']) # 将结果写入txt print(t.name) t.close() time.sleep(2) else: print("txt文件已存在")

把脚本放在需要文字识别的图片的目录,运行后就会得到同样文件名的txt文件,里面就是识别出来的文字了。



推荐阅读
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 个人学习使用:谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]
  • 基于dlib的人脸68特征点提取(眨眼张嘴检测)python版本
    文章目录引言开发环境和库流程设计张嘴和闭眼的检测引言(1)利用Dlib官方训练好的模型“shape_predictor_68_face_landmarks.dat”进行68个点标定 ... [详细]
  • 如何查询zone下的表的信息
    本文介绍了如何通过TcaplusDB知识库查询zone下的表的信息。包括请求地址、GET请求参数说明、返回参数说明等内容。通过curl方法发起请求,并提供了请求示例。 ... [详细]
  • 开源Keras Faster RCNN模型介绍及代码结构解析
    本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构,包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]
  • 如何自行分析定位SAP BSP错误
    The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • 阿,里,云,物,联网,net,core,客户端,czgl,aliiotclient, ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • 本文介绍了一个适用于PHP应用快速接入TRX和TRC20数字资产的开发包,该开发包支持使用自有Tron区块链节点的应用场景,也支持基于Tron官方公共API服务的轻量级部署场景。提供的功能包括生成地址、验证地址、查询余额、交易转账、查询最新区块和查询交易信息等。详细信息可参考tron-php的Github地址:https://github.com/Fenguoz/tron-php。 ... [详细]
  • 图像因存在错误而无法显示 ... [详细]
  • 本文讨论了在VMWARE5.1的虚拟服务器Windows Server 2008R2上安装oracle 10g客户端时出现的问题,并提供了解决方法。错误日志显示了异常访问违例,通过分析日志中的问题帧,找到了解决问题的线索。文章详细介绍了解决方法,帮助读者顺利安装oracle 10g客户端。 ... [详细]
  • Python操作MySQL(pymysql模块)详解及示例代码
    本文介绍了使用Python操作MySQL数据库的方法,详细讲解了pymysql模块的安装和连接MySQL数据库的步骤,并提供了示例代码。内容涵盖了创建表、插入数据、查询数据等操作,帮助读者快速掌握Python操作MySQL的技巧。 ... [详细]
author-avatar
咖啡色的午后_905
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有