pythonocr中文识别库_python库学习pytesseract识别图片中文字

作者：吕贞吟明辉碧瑜 | 来源：互联网 | 2023-08-19 13:20

写在前面：1、依赖工具tesseract。下载好后需要配置环境变量，将C:\ProgramFiles(x86)\Tesseract-OCR和C:\P

写在前面&＃xff1a;

1、依赖工具 tesseract。

下载好后需要配置环境变量&＃xff0c;将 C:\Program Files (x86)\Tesseract-OCR 和 C:\Program Files (x86)\Tesseract-OCR\tessdata两个路径配置到环境变量中去即可使用

只使用工具进行文字识别的方式 &＃xff1a;

tesseract E://figures/other/poems.jpg E://figures/other/poems.txt

命令行中执行上述命令即可将图片识别为文字并保存到 poems.txt 文件中

如果要识别中文&＃xff0c;需要将下载好的中文包放到C:\Program Files (x86)\Tesseract-OCR\tessdata路径下&＃xff0c;然后执行命令&＃xff1a;

tesseract E://figures/other/timg.jpg E://figures/other/timg.txt -l chi_sim

2、使用python库

pip install Pillow # 一个图片识别库

pip install pytesseract

如果已经配置过tesseract的本地环境变量则无需再额外配置&＃xff0c;一行代码即可

注意: 为了使环境变量生效&＃xff0c;需要关闭cmd窗口或是关闭pycharm等ide重新启动

text &＃61; pytesseract.image_to_string(Image.open("test.png"),lang&＃61;&＃39;chi_sim&＃39;)

因为我是做手游测试的&＃xff0c;实际测试下来效果并不十分好&＃xff0c;对图片进行灰度、二化值处理后稍微好一点点。这里贴一下对应的写法

from PIL import Image

import pytesseract

# 识别图片中的文字。对图片进行灰度、二化值处理

def get_picture_str(self, picturePath):

## 图片灰度处理

picture &＃61; Image.open(picturePath).convert(&＃39;L&＃39;)

## 二值化&＃xff0c;采用阈值分割法&＃xff0c;threshold为分割点

threshold &＃61; 200

table &＃61; []

for j in range(256):

if j

table.append(0)

else:

table.append(1)

newPicture &＃61; picture.point(table, &＃39;1&＃39;)

## 保存的时候调整屏幕分辨率为300&＃xff0c;有利于 tesseract 识别

newPicture.save(picturePath, dpi&＃61;(300.0,300.0))

## 识别

text&＃61;pytesseract.image_to_string(Image.open(picturePath) ,lang&＃61;&＃39;chi_sim&＃39;)

return text

推荐阅读

default
Spring源码解密之默认标签的解析方式分析

本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断，区分默认命名空间和自定义命名空间，并采用不同的解析方式。其中，bean标签的解析最为复杂和重要。 ... [详细]

蜡笔小新 2023-12-14 17:24:50
default
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
default
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
case
Go Cobra命令行工具入门教程

本文介绍了Go语言实现的命令行工具Cobra的基本概念、安装方法和入门实践。Cobra被广泛应用于各种项目中，如Kubernetes、Hugo和Github CLI等。通过使用Cobra，我们可以快速创建命令行工具，适用于写测试脚本和各种服务的Admin CLI。文章还通过一个简单的demo演示了Cobra的使用方法。 ... [详细]

蜡笔小新 2023-12-12 20:02:41
default
C#制作Java+Mysql+Tomcat环境安装程序，一键式安装教程

本文介绍了如何使用C#制作Java+Mysql+Tomcat环境安装程序，实现一键式安装。通过将JDK、Mysql、Tomcat三者制作成一个安装包，解决了客户在安装软件时的复杂配置和繁琐问题，便于管理软件版本和系统集成。具体步骤包括配置JDK环境变量和安装Mysql服务，其中使用了MySQL Server 5.5社区版和my.ini文件。安装方法为通过命令行将目录转到mysql的bin目录下，执行mysqld --install MySQL5命令。 ... [详细]

蜡笔小新 2023-12-12 19:29:55
default
Java太阳系小游戏分析和源码详解

本文介绍了一个基于Java的太阳系小游戏的分析和源码详解。通过对面向对象的知识的学习和实践，作者实现了太阳系各行星绕太阳转的效果。文章详细介绍了游戏的设计思路和源码结构，包括工具类、常量、图片加载、面板等。通过这个小游戏的制作，读者可以巩固和应用所学的知识，如类的继承、方法的重载与重写、多态和封装等。 ... [详细]

蜡笔小新 2023-12-14 19:53:34
default
获取当前模块所在路径的GetModuleFileName函数用法详解

本文详细介绍了GetModuleFileName函数的用法，该函数可以用于获取当前模块所在的路径，方便进行文件操作和读取配置信息。文章通过示例代码和详细的解释，帮助读者理解和使用该函数。同时，还提供了相关的API函数声明和说明。 ... [详细]

蜡笔小新 2023-12-14 19:29:57
random
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
post
在类中定义数组时出错 - Error on defining arrays in class

Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]

蜡笔小新 2023-12-14 17:38:12
post
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
post
Linux重启网络命令实例及关机和重启示例教程

本文介绍了Linux系统中重启网络命令的实例，以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法，以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]

蜡笔小新 2023-12-14 15:52:52
default
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
default
使用 Ubuntu 中的 Python 获取浏览器历史记录

使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]

蜡笔小新 2023-12-14 08:57:59
php
php 主动断掉http,怎么在PHP项目中实现一个HTTP断点续传功能

怎么在PHP项目中实现一个HTTP断点续传功能发布时间：2021-01-1916:26:06来源：亿速云阅读：96作者：Le ... [详细]

蜡笔小新 2023-12-12 17:17:29
php
Python中如何隐藏密码输入

本文介绍了在Python中使用getpass模块隐藏密码输入的方法，以保护用户的密码不被其他人员看到。同时还提到了在PyCharm中运行该命令无效的问题，需要在terminal中运行。 ... [详细]

蜡笔小新 2023-12-11 13:46:19

吕贞吟明辉碧瑜

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章