当前位置: 开发笔记 > 编程语言 > 正文

python文字识别训练_python文字识别之pytesseract

作者：陈怡伶翰纬 | 来源：互联网 | 2023-10-11 07:51

pytesseract资源链接：https:pan.baidu.coms1eTsqhsY密码：j0yo安装时前面一直next就可以了，直到

pytesseract资源

链接&＃xff1a;https://pan.baidu.com/s/1eTsqhsY 密码&＃xff1a;j0yo

安装时前面一直next就可以了&＃xff0c;直到这一步&＃xff0c;勾选Math和Chinese&＃xff0c;支持计算和中文

要记住安装的目录

我的是 F:\Program Files (x86)\Tesseract-OCR

然后&＃xff0c;

在系统变量中添加一个TESSDATA_PREFIX&＃xff0c;变量值还是文件路径

我的是F:\Program Files (x86)\Tesseract-OCR

打开Python安装路径&＃xff1a;\Python36\Lib\site-packages\pytesseract\pytesseract.py&＃xff0c;把路径改为自己的安装路径

运行下面代码

from PIL import Image

import pytesseract

img &＃61; Image.open(&＃39;aaa.png&＃39;)

text &＃61; pytesseract.image_to_string(img,lang&＃61;&＃39;chi_sim&＃39;)

print (text)

图片&＃xff1a;1.png

运行结果

结果会有一点出入&＃xff0c;需要对现有模型进行训练才能提高匹配度

chi_sim.traineddata是中文对应的模型&＃xff0c;后面会学习对模型的训练&＃xff0c;提供匹配度

关于安装pytesseract的一些链接&＃xff1a;

http://blog.csdn.net/cjvs9k/article/details/79044548

http://blog.csdn.net/qiushi_1990/article/details/78041375

http://blog.csdn.net/ztzy520/article/details/53946327

https://www.cnblogs.com/chenbjin/p/4147564.html

推荐阅读

install
BeautifulSoup4：Python的HTML/XML解析利器

BeautifulSoup4 是一个功能强大的HTML和XML解析库，它能够帮助开发者轻松地从网页中提取信息。本文将介绍BeautifulSoup4的基本功能、安装方法、与其他解析工具的对比以及简单的使用示例。 ... [详细]

蜡笔小新 2024-11-26 14:44:14
install
Ubuntu 14.04 环境下搭建 Caffe（仅限 CPU）

本文详细介绍了如何在 Ubuntu 14.04 系统上搭建仅使用 CPU 的 Caffe 深度学习框架，包括环境准备、依赖安装及编译过程。 ... [详细]

蜡笔小新 2024-11-22 16:43:30
get
Python 文件与目录操作指南

本文档详细介绍了如何在 Python 中进行文件和目录的基本操作，包括文件的打开、关闭、读取、写入、复制以及文件和目录的创建、删除和重命名等。 ... [详细]

蜡笔小新 2024-11-27 11:43:53
web
MVC框架下使用DataGrid实现时间筛选与枚举填充

本文介绍如何在ASP.NET MVC项目中利用DataGrid组件增强搜索功能，具体包括使用jQuery UI的DatePicker插件添加时间筛选条件，并通过枚举数据填充下拉列表。 ... [详细]

蜡笔小新 2024-11-27 11:02:33
char
深入解析Android中的SQLite数据库

SQLite是一种轻量级的关系型数据库管理系统，尽管体积小巧，却能支持高达2TB的数据库容量，每个数据库以单个文件形式存储。本文将详细介绍SQLite在Android开发中的应用，包括其数据存储机制、事务处理方式及数据类型的动态特性。 ... [详细]

蜡笔小新 2024-11-26 21:57:20
range
pip安装报错：'ascii'码不能解码，安装路径有中文

转载自：https:blog.csdn.netu013948858articledetails77800663【python】pip安装报错UnicodeDecode ... [详细]

蜡笔小新 2024-11-26 13:29:58
install
Frida环境搭建与基础使用教程

本文详细介绍了如何在本地环境中安装配置Frida及其服务器组件，以及如何通过Frida进行基本的应用程序动态分析，包括获取应用版本和加载的类信息。 ... [详细]

蜡笔小新 2024-11-25 17:43:00
install
华为云openEuler环境下的Web应用部署实践

本文详细记录了在华为云openEuler系统上进行Web应用部署的具体步骤，包括配置yum源、安装Apache、MariaDB、PHP及其相关组件，并完成WordPress的安装与配置过程。 ... [详细]

蜡笔小新 2024-11-25 12:39:31
web
初学者指南：使用CSS为博客园文章中的超链接添加图标

作为一名CSS初学者，我在博客园中尝试通过CSS美化页面，特别是为超链接添加图标，以提升阅读体验。本文将分享如何使用CSS和字体图标库来实现这一功能。 ... [详细]

蜡笔小新 2024-11-27 08:43:46
char
字符、字符串和文本的处理之Char类型

.NetFramework中处理字符和字符串的主要有以下这么几个类:(1)、System.Char类一基础字符串处理类(2)、System.String类一处理不可变的字符串(一经 ... [详细]

蜡笔小新 2024-11-26 21:04:40
char
HTML download 属性详解及应用

本文探讨了 HTML 中 download 属性的应用场景及其在不同浏览器中的实现方式，通过示例代码展示了如何利用 JavaScript 实现文件下载功能。 ... [详细]

蜡笔小新 2024-11-26 19:35:38
install
如何更换Anaconda和pip的国内镜像源

本文详细介绍了如何通过国内多个知名镜像站（如北京外国语大学、中国科学技术大学、阿里巴巴等）更换Anaconda和pip的源，以提高软件包的下载速度和安装效率。 ... [详细]

蜡笔小新 2024-11-26 10:06:26
install
2023年7月7日网络安全动态

汇总了2023年7月7日最新的网络安全新闻和技术更新，包括最新的漏洞披露、工具发布及安全事件。 ... [详细]

蜡笔小新 2024-11-23 13:35:48
web
如何在Win10系统下通过VMware 14 Pro安装CentOS 7

本文详细介绍了在Windows 10操作系统中使用VMware Workstation 14 Pro搭建CentOS 7虚拟环境的步骤，包括所需工具、安装过程及系统配置等。 ... [详细]

蜡笔小新 2024-11-22 12:35:03
install
Red Hat Linux 下 GCC 4.4.2 的安装指南

本文详细介绍了在 Red Hat Linux 系统上安装 GCC 4.4.2 的步骤，包括必要的依赖库的安装及常见问题的解决方法。 ... [详细]

蜡笔小新 2024-11-22 10:41:00

陈怡伶翰纬

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章