当前位置: 开发笔记 > 编程语言 > 正文

ocr识别github源码

作者：小-捌_350 | 来源：互联网 | 2023-09-05 06:48

参考[1]https:github.comeragonruantext-detection-ctpn[2]https:github.comsenlinuccaffe_ocr

参考

[1] https://github.com/eragonruan/text-detection-ctpn

[2] https://github.com/senlinuc/caffe_ocr

[3] https://github.com/YCG09/chinese_ocr 感谢作者！

[4] https://github.com/xiaomaxiao/keras_ocr

认真看源码！

基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别

文本检测：CTPN
文本识别：DenseNet + CTC

环境部署

Bash
sh setup.sh
```
* 注：CPU环境执行前需注释掉for gpu部分，并解开for cpu部分的注释
Demo

将测试图片放入test_images目录，检测结果会保存到test_result中

``` Bash
python demo.py
```
一定在终端运行demo.py 代码，另外，因不能连接外网，所以在进行依赖时，需要用公司镜像完成安装。
释放占用的显存时，只需要kernel，restart重启即可。在jupyter notebook中加！命令，相当于终端执行的命令。
切换python环境 source activate base 即可切换到常用的，安装有许多依赖库的 anaconda2 python2环境。这样才能运行demo.py.

Demo

将测试图片放入test_images目录，检测结果会保存到test_result中

python demo.py

模型训练

CTPN训练

详见ctpn/README.md

DenseNet + CTC训练

1. 数据准备

数据集：https://pan.baidu.com/s/1QkI7kjah8SPHwOQ40rS1Pw (密码：lu7m)

共约364万张图片，按照99:1划分成训练集和验证集
数据利用中文语料库（新闻 + 文言文），通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成
包含汉字、英文字母、数字和标点共5990个字符
每个样本固定10个字符，字符随机截取自语料库中的句子
图片分辨率统一为280x32

图片解压后放置到train/images目录下，描述文件放到train目录下

2. 训练

cd train
python train.py

3. 结果

val acc	predict	model
0.983	8ms	18.9MB

GPU: GTX TITAN X
Keras Backend: Tensorflow

4. 生成自己的样本

可参考SynthText_Chinese_version，TextRecognitionDataGenerator和text_renderer

效果展示

推荐阅读

import
在Windows系统中安装TensorFlow GPU版的详细指南与常见问题解决

在Windows系统中安装TensorFlow GPU版是许多深度学习初学者面临的挑战。本文详细介绍了安装过程中的每一个步骤，并针对常见的问题提供了有效的解决方案。通过本文的指导，读者可以顺利地完成安装并避免常见的陷阱。 ... [详细]

蜡笔小新 2024-11-11 19:02:49
go
解决Only fullscreen opaque activities can request orientation错误的方法

本文介绍了在使用PictureSelectorLight第三方框架时遇到的Only fullscreen opaque activities can request orientation错误，并提供了一种有效的解决方案。 ... [详细]

蜡笔小新 2024-11-13 09:46:25
import
PyTorch常见预训练模型的下载链接及使用指南

本文提供了PyTorch框架中常用的预训练模型的下载链接及详细使用指南，涵盖ResNet、Inception、DenseNet、AlexNet、VGGNet等六大分类模型。每种模型的预训练参数均经过精心调优，适用于多种计算机视觉任务。文章不仅介绍了模型的下载方式，还详细说明了如何在实际项目中高效地加载和使用这些模型，为开发者提供全面的技术支持。 ... [详细]

蜡笔小新 2024-10-27 13:57:42
list
在Windows上使用Python 3.8.5编译支持CUDA 11和cuDNN 8.0.2的TensorFlow 2.3，并提供编译后的文件下载链接

本文详细介绍了在Windows操作系统上使用Python 3.8.5编译支持CUDA 11和cuDNN 8.0.2的TensorFlow 2.3的步骤。文章不仅提供了详细的编译指南，还分享了编译后的文件下载链接，方便用户快速获取所需资源。此外，文中还涵盖了常见的编译问题及其解决方案，确保用户能够顺利进行编译和安装。 ... [详细]

蜡笔小新 2024-10-24 13:06:46
import
如何在Linux系统中部署TensorFlow的详细指南

本文详细介绍了在Linux系统中部署TensorFlow的过程。作者基于北京大学曹建教授的MOOC课程进行学习，但由于课程内容较旧，环境配置方面遇到了不少挑战。经过多次尝试，最终成功解决了这些问题，并总结了一套详细的安装指南，帮助初学者快速上手TensorFlow。 ... [详细]

蜡笔小新 2024-10-24 13:06:19
go
PyThon_Swift 势必取代 Python？

篇首语：本文由编程笔记#小编为大家整理，主要介绍了Swift势必取代Python？相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2024-10-14 14:20:18
import
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
import
（7）Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息，包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容，然后将爬取的信息写入Exce ... [详细]

蜡笔小新 2024-11-13 11:35:24
string
微信公众号推送模板40036问题

返回码错误码描述说明40001invalidcredential不合法的调用凭证40002invalidgrant_type不合法的grant_type40003invalidop ... [详细]

蜡笔小新 2024-11-12 16:31:32
string
MySQL 5.7 学习指南：SQLyog 中的主键、列属性和数据类型

本文介绍了 MySQL 5.7 中主键（Primary Key）和自增（Auto-Increment）的概念，以及如何在 SQLyog 中设置这些属性。同时，还探讨了数据类型的分类和选择，以及列属性的设置方法。 ... [详细]

蜡笔小新 2024-11-12 15:57:04
go
window下的python安装插件

window下的python安装插件,Go语言社区,Golang程序员人脉社 ... [详细]

蜡笔小新 2024-11-12 15:14:05
go
利用TensorFlow.js在网页浏览器中实现高效的人脸识别JavaScript接口

作者|VincentMühle编译|姗姗出品|人工智能头条（公众号ID：AI_Thinker）【导读】随着深度学习方法的应用，浏览器调用人脸识别技术已经得到了更广泛的应用与提升。在 ... [详细]

蜡笔小新 2024-10-23 10:50:38
import
利用TensorFlow Object Detection API的maskrcnn模型训练自己的样本数据集

之前写过TensorFlowObjectDetectionAPI的部署方法，如何用样本标定工具标定自己的样本数据，以及用tensorflowkereas版本mask-rcnn进行训 ... [详细]

蜡笔小新 2024-10-19 13:17:00
go
TensorFlow安装,TensorFlow中文社区下载与安装

TensorFlow中文社区—下载与安装转自：http:www.tensorfly.cntfdocget_startedos_setup.html下载与安装你可以使用我们提供的二 ... [详细]

蜡笔小新 2024-10-18 16:18:09
go
[TensorFlow系列3]：初学者是选择Tensorflow2.x还是1.x? 2.x与1.x的主要区别？

作者主页(文火冰糖的硅基工坊)：https:blog.csdn.netHiWangWenBing本文网址：https:blog.csdn.netHiW ... [详细]

蜡笔小新 2024-10-13 14:00:03

小-捌_350

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章