利用PaddleSharp模块在C#中实现图像文字识别功能测试

作者：dghghjkk_952 | 来源：互联网 | 2024-10-30 15:53

PaddleSharp是PaddleInferenceCAPI的C#封装库，适用于Windows(x64)、NVIDIAGPU和Linux(Ubuntu20.04)等平台。本文详细介绍了如何使用PaddleSharp在C#环境中实现图像文字识别功能，并进行了全面的功能测试，验证了其在多种硬件配置下的稳定性和准确性。

PaddleSharp是PaddleInference C API的C#封装版本&＃xff0c;支持在 Windows(x64)、NVIDIA GPU和Linux(Ubuntu-20.04 x64)中使用。PaddleShare主要包括PaddleOCR 和PaddleDetection&＃xff0c;其中PaddleOCR 支持14种语言的文字&＃xff0c;支持识别多种旋转角度的文字&＃xff0c;PaddleDetection支持PPYolo检测模型和PicoDet模型&＃xff08;关于PaddleSharp的详细介绍见参考文献1&＃xff09;。
可以通过NuGet管理器下载PaddleSharp相关的包&＃xff0c;最开始以为包名是以PaddleSharp开头&＃xff0c;结果在NuGet管理器中什么都搜不到&＃xff0c;在GitHub的PaddleSharp主页中&＃xff0c;列出了PaddleSharp相关的包清单&＃xff08;如下图所示&＃xff09;&＃xff0c;其都以Sdcb开头&＃xff0c;这些包在NuGet管理器中都可以搜索安装。
在这里插入图片描述

本文主要测试用C#调用PaddleSharp的PaddleOCR进行图片文字识别&＃xff0c;参考文献2的PaddleOCR使用说明中列出了要安装的包清单&＃xff0c;在VS中安装以下包&＃xff08;最初不想装这么多&＃xff0c;就只安装了Sdcb.PaddleOCR&＃xff0c;虽然程序可以编译通过&＃xff0c;也可以运行&＃xff0c;但是识别图片文字过程中会一直提示缺少下拉包清单中的某些&＃xff0c;最终要想正常识别图片文字&＃xff0c;还是需要把下面这些包都装全&＃xff09;。

Sdcb.PaddleInference Sdcb.PaddleInference.runtime.win64.mkl Sdcb.PaddleOCR Sdcb.PaddleOCR.KnownModels OpenCvSharp4 OpenCvSharp4.runtime.win

参照参考文献2中的示例代码进行功能测试&＃xff08;详细代码请到文献中查看&＃xff0c;这里就不贴出来了&＃xff09;&＃xff0c;其代码顺序主要是加载模型->加载图片->识别文字->显示结果。这里主要说一下跟使用PaddleOCRSharp的不同点&＃xff0c;由于都是简单测试&＃xff0c;说的都是比较简单的。
PaddleOCRSharp和PaddleSharp都是其它语言编写的ocr功能的C#封装版本&＃xff0c;相比之下PaddleOCRSharp封装的更简单一些。通过NuGet安装PaddleOCRSharp&＃xff0c;会把依赖文件自动下载并关联到项目上&＃xff0c;而PaddleSharp需要手动安装所有需要的包。
PaddleOCRSharp执行所需的模型在安装包时同步下载并关联到项目上&＃xff0c;而PaddleSharp&＃xff0c;从测试代码来看&＃xff0c;其默认从C:\Users\HP\AppData\Roaming\paddleocr-models\ppocr-v2文件夹中读取所需的模型&＃xff0c;如果不存在&＃xff0c;则实时从网上下载的,OCRModel对象中记录了各类模型的下载路径&＃xff08;实际执行过程中&＃xff0c;由于下载速度一般&＃xff0c;直接用迅雷手动下载并复制到对应文件夹中&＃xff09;。

OCRModel model &＃61; KnownOCRModel.PPOcrV2; await model.EnsureAll();

在这里插入图片描述
还有就是识别图片文字时&＃xff0c;PaddleOCRSharp封装了一下&＃xff0c;只需在程序中指定图片路径、图片字节数组或Image对象即可&＃xff0c;而PaddleSharp识别图片的函数&＃xff0c;PaddleOcrAll.Run&＃xff0c;需要将图片转成指定的Mat对象。
PaddleSharp识别的结果包括两类&＃xff0c;PaddleOcrResult.Text中将识别出的所有文字合并为一个字符串&＃xff0c;PaddleOcrResult.Regions中保存识别出的每个文本块。
文本块类型为PaddleOcrResultRegion&＃xff0c;其中Rect&＃xff08;类型为RotatedRect&＃xff09;保存包含文本的矩形位置信息&＃xff08;该矩形可能是非水平或垂直的&＃xff09;。RotatedRect类的定义如下图所示&＃xff0c;其中BoundingRect函数返回包含旋转矩形的矩形。以下面的图片为例PaddleOcrResultRegion.Rect为红色矩形&＃xff0c;而BoundingRect&＃xff08;&＃xff09;返回的是紫色矩形。同时RotatedRect类的Points函数返回旋转矩形的四个角的点位置信息&＃xff0c;可以通过绘制线条方式绘制包含文本的旋转矩形&＃xff0c;这样简单一些。
在这里插入图片描述

最后列出测试图片的识别效果&＃xff08;使用参考文献中的示例代码&＃xff0c;文本块基本都圈出来了&＃xff0c;但其中的内容有部分没有正确识别&＃xff09;。

参考文献
[1]https://github.com/sdcb/PaddleSharp
[2]https://github.com/sdcb/PaddleSharp/blob/master/docs/ocr.md

测试图片来源
[1]https://baijiahao.baidu.com/s?id&＃61;1676249081188736513&wfr&＃61;spider&for&＃61;pc
[2]https://www.xjauto.net/html/cheping/202105/69508.html
[3]https://item.jd.com/10041422363991.html?openbpab&＃61;dontwriteCOOKIE&uabt&＃61;92_16_21&cu&＃61;true&utm_source&＃61;image.baidu.com&utm_medium&＃61;tuiguang&utm_campaign&＃61;t_1003608409_&utm_term&＃61;1a1dd3a2f0b24eaab2325b16b12d3d8d
[4]http://news.sohu.com/a/524033869_121124363

推荐阅读

require
Windows 7 中 GDI 渲染与 GPU 加速机制

近期尝试重构 GDI 并自定义图像处理函数时，发现自定义函数的图像复制性能显著低于 Windows 原生 GDI 函数。通过研究了解到，系统可能利用了 GPU 加速来提升这些函数的效率。 ... [详细]

蜡笔小新 2024-12-11 13:12:33
require
利用Java与Tesseract-OCR实现数字识别

本文深入探讨了如何利用Java语言结合Tesseract-OCR技术来实现图像中的数字识别功能，旨在为开发者提供详细的指导和实践案例。 ... [详细]

蜡笔小新 2024-12-12 10:47:15
install
新手指南：在Windows 10上搭建深度学习与PyTorch开发环境

本文详细记录了一名新手在Windows 10操作系统上搭建深度学习环境的过程，包括安装必要的软件和配置环境变量等步骤，旨在帮助同样初入该领域的读者避免常见的错误。 ... [详细]

蜡笔小新 2024-12-17 03:14:23
copy
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
callback
Windows服务与数据库交互问题解析

本文探讨了在Windows 10（64位）环境下开发的Windows服务，旨在定期向本地MS SQL Server (v.11)插入记录。尽管服务已成功安装并运行，但记录并未正确插入。我们将详细分析可能的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-28 10:30:14
install
PyCharm下载与安装指南

本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境（IDE），涵盖Windows、macOS和Linux系统，同时提供详细的安装步骤及配置建议。 ... [详细]

蜡笔小新 2024-12-28 09:42:41
go
资源推荐 | TensorFlow官方中文教程助力英语非母语者学习

来源：机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南，帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]

蜡笔小新 2024-12-28 09:00:51
go
c# – UWP：BrightnessOverride StartOverride逻辑

c# – UWP：BrightnessOverride StartOverride逻辑 ... [详细]

蜡笔小新 2024-12-27 16:56:40
less
利用Selenium与ChromeDriver实现豆瓣网页全屏截图

本文介绍了一种使用Selenium和ChromeDriver结合Python代码，轻松实现对豆瓣网站进行完整页面截图的方法。该方法不仅简单易行，而且解决了新版Selenium不再支持PhantomJS的问题。 ... [详细]

蜡笔小新 2024-12-22 15:17:55
include
在Win10上利用VS2015构建Caffe2环境

本文详细介绍如何在Windows 10操作系统上通过Visual Studio 2015编译Caffe2深度学习框架的过程。包括必要的软件安装、环境配置以及常见问题的解决方法。 ... [详细]

蜡笔小新 2024-12-15 18:03:52
search
黑客如何利用AI在暗网重建你的数字身份

随着技术的发展，黑客开始利用AI技术在暗网中创建用户的‘数字孪生’，这一现象引起了安全专家的高度关注。 ... [详细]

蜡笔小新 2024-12-12 17:45:26
callback
LightningChart WinForms 应用程序崩溃问题已解决

LightningChart 是一款高性能的数据可视化工具，专为处理大规模实时数据设计，支持从2D到高级3D图表，包括极坐标图、史密斯图等。最新版本解决了在特定情况下导致应用程序崩溃的问题。 ... [详细]

蜡笔小新 2024-12-10 18:57:13
go
图像分类算法的优化策略与实践

本文探讨了《Bag of Tricks for Image Classification with Convolutional Neural Networks》论文中的多项技术，旨在通过具体实例和实验验证，提高卷积神经网络在图像分类任务中的性能。文章详细介绍了从模型训练加速、网络结构调整到训练参数优化等多个方面的改进方法。 ... [详细]

蜡笔小新 2024-12-09 16:01:40
include
Linux MMC Framework解析：Host对象的核心要素

本文深入探讨了Linux MMC框架中的Host对象，详细介绍了其核心数据结构和API，旨在为理解和开发MMC设备驱动提供指导。 ... [详细]

蜡笔小新 2024-12-05 16:21:20
spring
Shiro功能拓展：登录失败重试次数限制

本文详细介绍了如何在Apache Shiro框架中实现对用户登录失败重试次数的限制，通过自定义密码匹配器来增强系统的安全性。该方法不仅能够有效防止暴力破解攻击，还能确保合法用户的账户安全。 ... [详细]

蜡笔小新 2024-12-03 21:39:23

dghghjkk_952

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章