当前位置: 开发笔记 > 开发工具 > 正文

基于tesseract-OCR进行中文识别

作者：迎风拂忆_768 | 来源：互联网 | 2023-06-30 22:42

1.环境准备1.1下载下载Tesseract-OCR安装包，地址为：https:digi.bib.uni-mannheim.detesseracttesseract-ocr-w

1. 环境准备

1.1 下载

下载Tesseract-OCR安装包，地址为：

https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w32-setup-v4.0.0-beta.1.20180608.exe

参考链接：https://github.com/tesseract-ocr/tesseract

1.2 安装

双击安装，语言库部分选择math，chinese simplified.

// Create Tesseract object

tesseract::TessBaseAPI *ocr = new tesseract::TessBaseAPI();

Initialize OCR engine to use English (eng) and The LSTM

OCR engine.

There are four OCR Engine Mode (oem) available

OEM_TESSERACT_ONLY Legacy engine only.

OEM_LSTM_ONLY Neural nets LSTM engine only.

OEM_TESSERACT_LSTM_COMBINED Legacy + LSTM engines.

OEM_DEFAULT Default, based on what is available.

ocr->Init(NULL, "chi_sim+eng+equ", tesseract::OEM_DEFAULT);

// Set Page segmentation mode to PSM_AUTO (3)

// Other important psm modes will be discussed in a future post.

ocr->SetPageSegMode(tesseract::PSM_AUTO);

// Open input image using OpenCV

Mat im = cv::imread(imPath, IMREAD_COLOR);

// Set image data

ocr->SetImage(im.data, im.cols, im.rows, 3, im.step);

// Run Tesseract OCR on image

outText = string(ocr->GetUTF8Text());

// print recognized text

cout <

// Destroy used object and release memory

ocr->End();

return EXIT_SUCCESS;

}

2.2 工程配置

该工程选用的是OpenCV2.4，Tesseract4.0，Leptonica-1.76

编译运行结果如下：

可见中文完全乱码

2.4 中文乱码

针对中文乱码情况，网上提供解决方案，UTF--->Unicode--->Ansi

在test.cpp中增加如下两个函数：

//utf-8转unicode

wchar_t * CIDcardRecogizeDlg::Utf_8ToUnicode(char* szU8)

{

//UTF8 to Unicode

//由于中文直接复制过来会成乱码，编译器有时会报错，故采用16进制形式

//预转换，得到所需空间的大小

int wcsLen = ::MultiByteToWideChar(CP_UTF8, NULL, szU8, strlen(szU8), NULL, 0);

//分配空间要给'\0'留个空间，MultiByteToWideChar不会给'\0'空间

wchar_t* wszString = new wchar_t[wcsLen + 1];

//转换

::MultiByteToWideChar(CP_UTF8, NULL, szU8, strlen(szU8), wszString, wcsLen);

//最后加上'\0'

wszString[wcsLen] = '\0';

return wszString;

}

//将宽字节wchar_t*转化为单字节char*

char* CIDcardRecogizeDlg::UnicodeToAnsi( const wchar_t* szStr )

{

int nLen = WideCharToMultiByte( CP_ACP, 0, szStr, -1, NULL, 0, NULL, NULL );

if (nLen == 0)

{

return NULL;

}

char* pResult = new char[nLen];

WideCharToMultiByte( CP_ACP, 0, szStr, -1, pResult, nLen, NULL, NULL );

return pResult;

}

并修改main函数：

char* test1 = ocr->GetUTF8Text();

wchar_t* tempchar = Utf_8ToUnicode(test1);

char* resulttemp = UnicodeToAnsi(tempchar);

// outText = string(ocr->GetUTF8Text());

// print recognized text

cout <

即可解决中文乱码问题，识别结果如下：

参考链接：https://blog.csdn.net/liulina603/article/details/45668307

推荐阅读

git
golang常用库：配置文件解析库/管理工具viper使用

golang常用库：配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库，是由大神SteveFrancia开发，他在google领导着golang的 ... [详细]

蜡笔小新 2024-12-28 13:47:52
git
深入理解LOAM：激光雷达里程计与建图算法

本文基于对相关论文和开源代码的研究，详细介绍了LOAM（激光雷达里程计与建图）的工作原理，并对其关键技术进行了分析。 ... [详细]

蜡笔小新 2024-12-28 11:38:00
ide
资源推荐 | TensorFlow官方中文教程助力英语非母语者学习

来源：机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南，帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]

蜡笔小新 2024-12-28 09:00:51
ide
解决 Python 项目中 setuptools_rust 模块缺失问题

本文介绍了在安装或运行 Python 项目时遇到的 'ModuleNotFoundError: No module named setuptools_rust' 错误，并提供了解决方案。 ... [详细]

蜡笔小新 2024-12-27 18:06:18
git
拖拽元素位置交换：使用 Sortable.js 实现

本文介绍如何使用 Sortable.js 库实现元素的拖拽和位置交换功能。Sortable.js 是一个轻量级、无依赖的 JavaScript 库，支持拖拽排序、动画效果和多种插件扩展。通过简单的配置和事件处理，可以轻松实现复杂的功能。 ... [详细]

蜡笔小新 2024-12-27 15:10:34
git
LeetCode 991：故障计算器的最优解法

探讨一个显示数字的故障计算器，它支持两种操作：将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]

蜡笔小新 2024-12-27 14:34:44
diff
扫描线三巨头 hdu1928hdu 1255 hdu 1542 [POJ 1151]

学习链接：http:blog.csdn.netlwt36articledetails48908031学习扫描线主要学习的是一种扫描的思想，后期可以求解很 ... [详细]

蜡笔小新 2024-12-26 20:04:36
git
Spring Boot 中使用 @PropertySource 读取自定义配置文件的最佳实践

本文详细介绍了如何在 Spring Boot 应用中通过 @PropertySource 注解读取非默认配置文件，包括配置文件的创建、映射类的设计以及确保 Spring 容器能够正确加载这些配置的方法。 ... [详细]

蜡笔小新 2024-12-26 19:35:47
git
HTML Attribute Naming Conventions for Fast Components

This document outlines the recommended naming conventions for HTML attributes in Fast Components, focusing on readability and consistency with existing standards. ... [详细]

蜡笔小新 2024-12-26 19:13:45
windows
告别传统文件传输，迎接新一代高效工具Croc

在现代网络环境中，两台计算机之间的文件传输需求日益增长。传统的FTP和SSH方式虽然有效，但其配置复杂、步骤繁琐，难以满足快速且安全的传输需求。本文将介绍一种基于Go语言开发的新一代文件传输工具——Croc，它不仅简化了操作流程，还提供了强大的加密和跨平台支持。 ... [详细]

蜡笔小新 2024-12-26 16:16:06
windows
解决微信电脑版无法刷朋友圈问题：使用安卓远程投屏方案

在工作期间想要浏览微信和朋友圈却不太方便？虽然微信电脑版目前不支持直接刷朋友圈，但通过远程投屏技术，可以轻松实现在电脑上操作安卓设备的功能。 ... [详细]

蜡笔小新 2024-12-26 15:23:19
git
从零开始构建完整手机站：Vue CLI 3 实战指南（第一部分）

本系列教程将引导您使用 Vue CLI 3 构建一个功能齐全的移动应用。我们将深入探讨项目中涉及的每一个知识点，并确保这些内容与实际工作中的需求紧密结合。 ... [详细]

蜡笔小新 2024-12-26 13:30:37
git
软件工程个人学习报告

本报告涵盖了个人博客账号和码云账号的注册过程，以及对网络工程专业学习的反思与展望。通过回顾初入大学时的专业选择，分析当前的专业知识和技能水平，并对未来的职业规划进行了详细讨论。 ... [详细]

蜡笔小新 2024-12-26 12:59:03
windows
Composer Registry Manager：PHP的源切换管理工具

本文介绍了一个用于Composer的源切换管理工具——Composer Registry Manager。该项目旨在简化Composer包源的管理和切换，避免与常见的CRM系统混淆，并提供了详细的安装和使用指南。 ... [详细]

蜡笔小新 2024-12-25 19:34:14
windows
基于KVM的SRIOV直通配置及性能测试

SRIOV介绍、VF直通配置，以及包转发率性能测试小慢哥的原创文章，欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]

蜡笔小新 2024-12-25 19:26:39

迎风拂忆_768

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章