当前位置: 开发笔记 > 编程语言 > 正文

文字识别：TesseractOCR

作者：冬日暖光816 | 来源：互联网 | 2023-09-12 19:12

一、安装并配置Tesseract1、下载Tesseract-OCR（网上直接下载即可）2、双击安装，选择所有人均可使用，避免

一、安装并配置Tesseract

1、下载Tesseract-OCR （网上直接下载即可）

2、双击安装，选择所有人均可使用，避免权限问题

勾选最后一项添加语言包，但是全部勾选需要1.3G，可以点开加号，选择自己所需的语言包即可。

注意：这里最好装在C盘，之前装在F盘报错，无法使用Tesseract

备注：在这里先复制好安装路径，后面还需要将其添加至环境变量中。C:\Program Files (x86)\Tesseract-OCR

这一步是创建快捷方式，在这里勾选不创建

安装过程中，如果出现错误，点击确定即可，并不影响后续使用。

安装完成后，需要将刚才的安装路径添加至环境变量中。在此电脑上右键，选择属性，选择高级系统设置

在高级中选择环境变量

分别在用户变量和系统变量中修改path

双击Path，点击新建，然后将刚才复制的安装路径复制进来

点击确定后，在系统变量中双击Path，添加，点击确定。

然后在系统变量中，点击新建，新建一个变量名为：TESSDATA_PREFIX

值为：刚才的路径加上 \tessdata

此时，Tesseract 环境配置完成。如何测试是否可以使用？

Win+R 在cmd中输入：tesseract -v 可以查看版本信息

出现以下结果证明已经可以正常使用：

补充：输入：

tesseract --list-langs 来查看本地 Tesseract-ORC 支持语言库

二、使用Tesseract 进行文字识别

1、将需要测试的图片保存为test.jpg ，然后新建一个test.txt文件

（这样测试图片中的文字就会直接读写到文本文件中）

在cmd中先进入桌面，使用 cd desktop , 然后输入： tesseract+空格+路径+空格+文本文件名，回车

然后可以在文本文件中看到所识别的文字信息，如下图所示：

推荐阅读

文件
Linux如何安装Mongodb的详细步骤和注意事项

本文介绍了Linux如何安装Mongodb的详细步骤和注意事项，同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库，适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作，能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]

蜡笔小新 2023-12-12 21:54:15
文件
Python3中选择文件对话框的格式打开和保存图片

本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数，可以方便地选择要打开或保存的图片文件，并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]

蜡笔小新 2023-12-14 17:46:55
chat
【Windows】实现微信双开或多开的方法及步骤详解

本文介绍了在Windows系统下实现微信双开或多开的方法，通过安装微信电脑版、复制微信程序启动路径、修改文本文件为bat文件等步骤，实现同时登录两个或多个微信的效果。相比于使用虚拟机的方法，本方法更简单易行，适用于任何电脑，并且不会消耗过多系统资源。详细步骤和原理解释请参考本文内容。 ... [详细]

蜡笔小新 2023-12-14 10:52:27
数组
Vue项目中结合Element UI解决连续上传多张图片及图片编辑问题

本文介绍了在Vue项目中如何结合Element UI解决连续上传多张图片及图片编辑的问题。作者强调了在编码前要明确需求和所需要的结果，并详细描述了自己的代码实现过程。 ... [详细]

蜡笔小新 2023-12-13 13:42:30
window
如何在Windows环境下配置php+apache环境

本文介绍了在Windows环境下如何配置php+apache环境，包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]

蜡笔小新 2023-12-13 10:39:24
process
使用集算器将日志文件结构化，轻松使用SQL查询

本文介绍了一种轻巧方便的工具——集算器，通过使用集算器可以将文本日志变成结构化数据，然后可以使用SQL式查询。集算器利用集算语言的优点，将日志内容结构化为数据表结构，SPL支持直接对结构化的文件进行SQL查询，不再需要安装配置第三方数据库软件。本文还详细介绍了具体的实施过程。 ... [详细]

蜡笔小新 2023-12-11 13:27:46
数组
Python实验报告文档中的文件和数据格式化操作

本文介绍了Python语言程序设计中文件和数据格式化的操作，包括使用np.savetext保存文本文件，对文本文件和二进制文件进行统一的操作步骤，以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]

蜡笔小新 2023-12-10 17:02:16
数组
JNI原理及常用方法概述

本文概述了JNI的原理以及常用方法。JNI提供了一种Java字节码调用C/C++的解决方案，但引用类型不能直接在Native层使用，需要进行类型转化。多维数组（包括二维数组）都是引用类型，需要使用jobjectArray类型来存取其值。此外，由于Java支持函数重载，根据函数名无法找到对应的JNI函数，因此介绍了JNI函数签名信息的解决方案。 ... [详细]

蜡笔小新 2023-12-09 17:55:40
request
如何实现织梦DedeCms全站伪静态

本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态，以提高管理和SEO效果。全站伪静态可以避免重复URL的问题，同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式，可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具，如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]

蜡笔小新 2023-12-14 19:45:47
数组
Perl的测试框架Test::Base简介及使用方法

本文介绍了Perl的测试框架Test::Base，它是一个数据驱动的测试框架，可以自动进行单元测试，省去手工编写测试程序的麻烦。与Test::More完全兼容，使用方法简单。以plural函数为例，展示了Test::Base的使用方法。 ... [详细]

蜡笔小新 2023-12-13 20:05:31
request
Python瓦片图下载、合并、绘图、标记的代码示例

本文提供了Python瓦片图下载、合并、绘图、标记的代码示例，包括下载代码、多线程下载、图像处理等功能。通过参考geoserver，使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法，供读者参考使用。 ... [详细]

蜡笔小新 2023-12-13 12:14:55
web
如何查询zone下的表的信息

本文介绍了如何通过TcaplusDB知识库查询zone下的表的信息。包括请求地址、GET请求参数说明、返回参数说明等内容。通过curl方法发起请求，并提供了请求示例。 ... [详细]

蜡笔小新 2023-12-12 08:26:32
window
解决github访问慢的问题的方法集锦

本文总结了国内用户在访问github网站时可能遇到的加载慢的问题，并提供了解决方法，其中包括修改hosts文件来加速访问。 ... [详细]

蜡笔小新 2023-12-11 20:38:46
window
修复安装win10失败并提示“磁盘布局不受UEFI固件支持”的方法

本文介绍了修复安装win10失败并提示“磁盘布局不受UEFI固件支持”的方法。首先解释了UEFI的概念和作用，然后提供了两种解决方法。第一种方法是在bios界面中将Boot Mode设置为Legacy Support，Boot Priority设置为Legacy First，并关闭UEFI。第二种方法是使用U盘启动盘进入PE系统，运行磁盘分区工具DiskGenius，将硬盘的分区表设置为gpt格式，并留出288MB的内存。最后，通过运行界面输入命令cmd来完成设置。 ... [详细]

蜡笔小新 2023-12-11 18:42:50
window
Composer依赖管理的重要性及使用方法

本文介绍了Composer依赖管理的重要性及使用方法。对于现代语言而言，包管理器是标配，而Composer作为PHP的包管理器，解决了PEAR的问题，并且使用简单，方便提交自己的包。文章还提到了使用Composer能够避免各种include的问题，避免命名空间冲突，并且能够方便地安装升级扩展包。 ... [详细]

蜡笔小新 2023-12-11 17:06:18

冬日暖光816

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章