python处理txt文档里的双引号_「python」使用百度OCR进行文字识别将图片转TXT文档...

作者：咖啡色的午后_905 | 来源：互联网 | 2023-08-23 08:05

先要有百度的账号，在百度智能云的管理中心，找到人工智能-文字识别，然后选择创建应用，得到APP_ID、API_KEY、SEC

先要有百度的账号&＃xff0c;在百度智能云的管理中心&＃xff0c;找到人工智能-文字识别&＃xff0c;然后选择创建应用&＃xff0c;得到APP_ID、API_KEY、SECRECT_KEY三个关键参数。

百度智能云控制台

然后打开cmd&＃xff0c;输入如下代码&＃xff1a;

pip install baidu-aip

然后再新建个python文件&＃xff0c;输入如下代码&＃xff1a;

import osimport timefrom aip import AipOcr# 功能&＃xff1a;将图片提交到百度OCR转换成文本。# 2020-5-30:添加了判断txt文本是否存在&＃xff0c;存在的话不进行ocr# 2020-10-3&＃xff1a;添加识别当前路径#在下面的三行输入自己的参数APP_ID &＃61; &＃39;xxxxxxx&＃39;API_KEY &＃61; &＃39;xxxxxxxxxxxxxxxxxxxxxxxxx&＃39;SECRECT_KEY &＃61; &＃39;xxxxxxxxxxxxxxxxxxxx&＃39;client &＃61; AipOcr(APP_ID, API_KEY, SECRECT_KEY)path &＃61; os.getcwd() # 获取当前目录&＃xff0c;图片目录fName &＃61; [] # 新建数组for root, dirs, files in os.walk(path): for name in files: # 在path里面查找文件 fName.append(os.path.join(root, name)) for name in dirs: # 在path子目录里面查找文件 fName.append(os.path.join(root, name))for f in fName: if f.split(&＃39;.&＃39;)[-1] &＃61;&＃61; "jpg" or f.split(&＃39;.&＃39;)[-1] &＃61;&＃61; "png": # 如果文件扩张名为jpg print(f) if not os.path.exists(path&＃43;(f.split("")[-1]).split(".") [0]&＃43;".txt"): t &＃61; open(path&＃43;(f.split("")[-1]).split(".") [0]&＃43;".txt", mode&＃61;"w") # 创建与jpg同名的文档 img &＃61; open(f, &＃39;rb&＃39;).read() # 打开图片 message &＃61; client.basicAccurate(img) # 图片ocr try: res &＃61; message[&＃39;words_result&＃39;] except Exception: time.sleep(6) message &＃61; client.basicAccurate(img) res &＃61; message[&＃39;words_result&＃39;] for i in res: w &＃61; t.write(i[&＃39;words&＃39;]) # 将结果写入txt print(t.name) t.close() time.sleep(2) else: print("txt文件已存在")

把脚本放在需要文字识别的图片的目录&＃xff0c;运行后就会得到同样文件名的txt文件&＃xff0c;里面就是识别出来的文字了。

推荐阅读

pip
Python 程序转换为 EXE 文件：详细解析 .py 脚本打包成独立可执行文件的方法与技巧

在开发了几个简单的爬虫 Python 程序后，我决定将其封装成独立的可执行文件以便于分发和使用。为了实现这一目标，首先需要解决的是如何将 Python 脚本转换为 EXE 文件。在这个过程中，我选择了 Qt 作为 GUI 框架，因为之前对此并不熟悉，希望通过这个项目进一步学习和掌握 Qt 的基本用法。本文将详细介绍从 .py 脚本到 EXE 文件的整个过程，包括所需工具、具体步骤以及常见问题的解决方案。 ... [详细]

蜡笔小新 2024-11-09 14:59:47
format
HDFS API

Hadoop的文件操作位于包org.apache.hadoop.fs里面，能够进行新建、删除、修改等操作。比较重要的几个类：(1)Configurati ... [详细]

蜡笔小新 2024-11-13 17:31:50
数组
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
数组
异步 Rust 中的多线程为何无法实现并行化？

探讨异步 Rust 中多线程代码无法实现并行化的原因及解决方案。 ... [详细]

蜡笔小新 2024-11-13 15:43:52
substring
Spring Boot 中配置全局文件上传路径并实现文件上传功能

本文介绍如何在 Spring Boot 项目中配置全局文件上传路径，并通过读取配置项实现文件上传功能。通过这种方式，可以更好地管理和维护文件路径。 ... [详细]

蜡笔小新 2024-11-13 11:19:38
php
Java 编程错误：对象无法转换为 long 类型

本文介绍了在 Java 编程中遇到的一个常见错误：对象无法转换为 long 类型，并提供了详细的解决方案。 ... [详细]

蜡笔小新 2024-11-13 10:57:24
integer
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
php
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新 2024-11-12 16:19:40
php
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
php
Spring详解（六）AOP

原文网址：https:www.cnblogs.comysoceanp7476379.html目录1、AOP什么？2、需求3、解决办法1:使用静态代理4 ... [详细]

蜡笔小新 2024-11-12 14:40:40
header
python解决CSF布料模拟滤波的批处理问题（解决获取多个点云数据las数据）

解决问题：1、批量读取点云las数据2、点云数据读与写出3、csf滤波分类参考：https:github.comsuyunzzzCSF论文题目ÿ ... [详细]

蜡笔小新 2024-11-12 11:32:15
dll
开机自启动的几种方式

0x01快速自启动目录快速启动目录自启动方式源于Windows中的一个目录，这个目录一般叫启动或者Startup。位于该目录下的PE文件会在开机后进行自启动 ... [详细]

蜡笔小新 2024-11-12 11:16:30
format
Python 序列图分割与可视化编程入门教程

本文介绍了如何使用 Python 进行序列图的快速分割与可视化。通过一个实际案例，详细展示了从需求分析到代码实现的全过程。具体包括如何读取序列图数据、应用分割算法以及利用可视化库生成直观的图表，帮助非编程背景的用户也能轻松上手。 ... [详细]

蜡笔小新 2024-11-11 07:14:26
php
Python 字符串处理全解：常用操作与技巧汇总

本文全面解析了 Python 中字符串处理的常用操作与技巧。首先介绍了如何通过 `s.strip()`, `s.lstrip()` 和 `s.rstrip()` 方法去除字符串中的空格和特殊符号。接着，详细讲解了字符串复制的方法，包括使用 `sStr1 = sStr2` 进行简单的赋值复制。此外，还探讨了字符串连接、分割、替换等高级操作，并提供了丰富的示例代码，帮助读者深入理解和掌握这些实用技巧。 ... [详细]

蜡笔小新 2024-11-10 09:01:29
format
Python多线程编程技巧与实战应用详解

Python多线程编程技巧与实战应用详解 ... [详细]

蜡笔小新 2024-11-09 20:44:15

咖啡色的午后_905

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章