作者:live科_722 | 来源:互联网 | 2023-08-20 15:10
一、Tesseract安装下载方式一:tesseract官方下载地址https:digi.bib.uni-mannheim.detesseract其中带有dev的是开发版
一、Tesseract安装
下载方式一:
tesseract官方下载地址 https://digi.bib.uni-mannheim.de/tesseract/
其中带有dev的是开发版,不带的是稳定版,可以选择稳定版下载。
下载方式二:
第一种方式如果没有进行科学上网,可能下不下来,这时候可以使用第二种方式。
1.进入 https://github.com/tesseract-ocr/tesseract找到如下图所示,点击
2.进入到 https://tesseract-ocr.github.io/tessdoc/Home.html,里面mac,linux,windows等版本都有,因为我是windows系统,所以找到如下图所示,点击
3.进入到 https://github.com/UB-Mannheim/tesseract/wiki,找到系统对应的版本,下载安装
安装完成后,将安装路径(如:C:/java/Tesseract-OCR)配置到环境变量
配置完成,后打开cmd命令窗口,输入
tesseract -v
如看到以下输出,即代表Tesseract配置完成:
注:如果使用python环境测试,需要做一点改变:
在pytesseract安装后,在python的Lib目录下site-packges下会生成一个pytesseract文件夹,文件夹中找到pytesseract.py,路径在:C:/JAVA/Python36/Lib/site-packages/pytesseract,打开pytesseract.py,找到如下两行:
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'
将tesseract_cmd = 'tesseract'修改为:tesseract_cmd = 'C:/JAVA/Tesseract-OCR/tesseract.exe'
代表将tesseract_cmd配置为你安装tesseract-ocr的绝对路径,再去运行python代码,就没问题了。
二、jTessBoxEditor下载
以下介绍是官方网站下载方式,鉴于较慢,我在百度网盘准备了一份,点击下载 提取码:nbc3
1.访问官方地址 http://vietocr.sourceforge.net/training.html,如下图所示,点击
2.进入到 https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/ 选择版本下载
zip结尾的,下载哪个版本都行。
注:jTessBoxEditor是依赖java环境的,如果没有安装jre无法运行
jre下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jre8-downloads-2133155.html
本章对jre安装和环境配置不做介绍,如不会安装请自行百度
本节结束,下节介绍使用工具进行样本训练。