首页
技术博客
PHP教程
数据库技术
前端开发
HTML5
Nginx
php论坛
新用户注册
|
会员登录
PHP教程
技术博客
编程问答
PNG素材
编程语言
前端技术
Android
PHP教程
HTML5教程
数据库
Linux技术
Nginx技术
PHP安全
WebSerer
职场攻略
JavaScript
开放平台
业界资讯
大话程序猿
登录
极速注册
取消
热门标签 | HotTags
svm
神经网络
pytorch
图像识别
算法
机器人
人工智能
tensorflow
数据挖掘
nlp
深度
自然语言处理
深度学习
自动驾驶
人脸识别
ocr
机器学习
当前位置:
开发笔记
>
人工智能
> 正文
提高OCR识别率的一些菜鸟方法
作者:窈窕眈眈 | 来源:互联网 | 2023-09-23 11:07
原稿的质量直接影响到最后OCR的正确率,因此先要适当调整原稿。对于低质量稿件,可考虑在扫描前用复印机先行复印并适当调节对比度和亮度,使背景变成白色,而文字色泽保持黑色即可。经过复印以后的报
原稿的质量直接影响到最后OCR的正确率,因此先要适当调整原稿。对于低质量稿件,可考虑在扫描前用复印机先行复印并适当调节对比度和亮度,使背景变成白色,而文字色泽保持黑色即可。经过复印以后的报纸,OCR的识别率有明显的提高。
扫描过程中一定要将原稿摆正,否则OCR软件将无法正确识别。如果无法将原稿摆正,可使用 “自动倾斜校正”或者“手动纠斜”功能纠正字体的倾斜。选择适当的扫描参数也很重要,一般OCR是原稿应扫描为“黑白二值”,扫描文字的亮度和对比度对文字的正确识别非常关键,我们可以通过“放大预览”对文稿中的几个文字进行取样扫描,从而对图像的亮度进行更为细致的调节,调节的工具是扫描仪工具内的“阀值”。
对于分辨率,原则上不求最“高”,只求最“佳”。若分辨率太高,扫描时间将会增加,图形所需的空间也会成倍地增长;若分辨率太低,识别率就不会很高。一般普通五号印刷体采用250~300dpi;若字号较大 (四号以上),用150~200dpi就足够了;如果是六号或七号等小字体,就要考虑使用400~600dpi。如果印刷字迹比较模糊,或笔划较多的识别文本,应适当提高扫描的分辨率。
扫描后,观察图像是否有污点现象,如有则使用图像处理软件将污点擦去。同时如果有图像存在,也会影响OCR的文字切分,可使用 “图像的块擦拭”工具将文档中的图像去除。此外,还应采用适当的辨识方式,注意稿件是横排还是竖排,可选择合适的编排格式按钮,以保持对应。如有必要还可进行版面分析,否则识别结果会有大量的空格,而OCR通常也将空白处作为识别对象。自动识别虽可很好地解决这一问题,但也常把不应分开的区域分开,造成识别结果的错误和颠倒。这时可结合自动分析与手工分析,将不恰当的版面分析删除。最后,再次适当地调节对比度和亮度,增加文字和背景的对比度,从而最终达到95%以的识别率。
ocr
写下你的评论吧 !
吐个槽吧,看都看了
会员登录
|
用户注册
推荐阅读
ocr
Patch ODA X8 : 19.9 到 19.11
PatchODAX8: ...
[详细]
蜡笔小新 2023-10-18 00:03:19
ocr
c# 联合halcon 基于相关性 模板匹配_HALCON形状匹配详解
点击上方“新机器视觉”,选择加”星标”或“置顶”重磅干货,第一时间送达很早就想总结一下前段时间学习HALCON的心得,但由于其他的事情总是抽不出时间。去年有过一段时间的集中学习,做 ...
[详细]
蜡笔小新 2023-10-17 18:47:00
ocr
windows 下git出现警告:warning: LF will be replaced by CRLF in test1.txt. The file will have its original
windows下git出现警告:warning:LFwillbereplacedbyCRLFintest1.txt.Thefilewillhaveitsorigina ...
[详细]
蜡笔小新 2023-10-15 13:55:58
ocr
[AWS DA] Database types & SSL
YoucanletAWStocreateaSSLcertificatesforyouandmanageforyoubyusingAWSCetrficateManager.Basic ...
[详细]
蜡笔小新 2023-10-15 13:39:11
ocr
Java中自动生成实体类
Q1:实体层(vo)packagecom;importjava.io.File;importjava.io.FileWriter;importjava.io.IOExcep ...
[详细]
蜡笔小新 2023-10-15 12:05:37
ocr
调用百度ocr的API,python简易版本
https:www.jianshu.compe10dc43c38d01.注册百度云注册账号https:cloud.baidu.com?fromconsole管理应用https:co ...
[详细]
蜡笔小新 2023-10-14 16:49:13
ocr
从Eclipse运行时不出现Java JFrame窗口 - Java JFrame Window not appearing when run from Eclipse
Averysimpleproblem.ItrytorunaverysimpledemotocreatedanddisplayaWindowFramefromEc ...
[详细]
蜡笔小新 2023-10-14 15:39:55
机器学习
北交桑基韬:“超”人的机器学习,非语义特征的得与失
点击蓝字关注我们AITIME欢迎每一位AI爱好者的加入!作者|桑基韬整理|维克多人工智能目前最大的“拦路虎”是不可信赖性,以深度学习为基础的算法 ...
[详细]
蜡笔小新 2023-10-14 13:04:50
ocr
使用扫描仪经验六则
1.获得尽量好的扫描效果为了获得较好的扫描效果,要求原稿平整无皱纹,需要扫描下来的地方最好没有斑痕。将原稿放置玻璃板上时,原稿的边缘要与玻璃板贴平,如果扫描后生成的图片文件要用于O ...
[详细]
蜡笔小新 2023-10-14 11:59:46
ocr
好用的文字识别软件有哪些?超实用的文字识别软件分享!
好用的文字识别软件有哪些?作为一个经常需要处理文字内容的职场人慧眼图像文字识别软件,一款好用的文字识别软件非常的重要,有了它,你就再也不用一个字一个字的手动输入 ...
[详细]
蜡笔小新 2023-10-13 20:05:00
ocr
c – 针对Tesseract和OpenCV的CMake
我是Linux编程的新手,我正在尝试使用Tesseract和OpenCV在Ubuntu12.10上创建一个OCR应用程序.到目前为止,我已经在linux上设置了tesseract和 ...
[详细]
蜡笔小新 2023-10-13 18:37:27
ocr
c语言调用链表,c语言链表的实现
本文目录一览:1、C语言创建链表,函数调用部分 ...
[详细]
蜡笔小新 2023-10-13 13:34:31
ocr
MacOCR文字识别工具:OCRKit Pro
OCRKitProforMac是一款功能强大的OCR文字识别工具,可以将你扫描或打印的文档转换为可搜索和可编辑的文本,提高了办公工作流程的效率。OCRK ...
[详细]
蜡笔小新 2023-10-13 13:19:12
ocr
什么是模型融合,stacking集成模型原理介绍
模型融合(集成)参考博客:KaggleEnsemblingGuide(https_mlwave.com模型集成是融合多个训练好的模型,基于某种方式实现测试数据的多模型融合,这 ...
[详细]
蜡笔小新 2023-10-13 12:57:34
ocr
苹果画画软件_想在iPad 上画画,推荐用这些软件
不废话,直接推荐:1.procreate最全面最厉害的ipad绘画软件。基本能满足你所有绘画要求。适合幼儿园至专业人士所有年龄阶段的画画爱好者。提示下& ...
[详细]
蜡笔小新 2023-10-13 12:42:39
窈窕眈眈
这个家伙很懒,什么也没留下!
Tags | 热门标签
svm
神经网络
pytorch
图像识别
算法
机器人
人工智能
tensorflow
数据挖掘
nlp
深度
自然语言处理
深度学习
自动驾驶
人脸识别
ocr
机器学习
RankList | 热门文章
1
springboot的java配置方式(实例讲解)
2
Spring 重定向(Redirect)指南及相关策略问题
3
使用Maven Archetype插件构建Maven工程原型模板的实例
4
使用JSCH框架通过跳转机访问其他节点的方法
5
自定义BufferedReader的实例
6
浅谈Servlet开发技术基础
7
Javacv使用ffmpeg实现音视频同步播放
8
Spring实例化bean的方式代码详解
9
spring定时任务执行两次及tomcat部署缓慢问题的解决方法
10
新版本IntelliJ IDEA 构建maven,并用Maven创建一个web项目(图文教程)
11
springboot 用监听器统计在线人数案例分析
12
Spring Boot 入门之消息中间件的使用
13
java中Swing五种常见的布局方式
14
谈谈我对Spring Bean 生命周期的理解
15
RHEL6.5下JDK1.8安装教程
PHP1.CN | 中国最专业的PHP中文社区 |
DevBox开发工具箱
|
json解析格式化
|
PHP资讯
|
PHP教程
|
数据库技术
|
服务器技术
|
前端开发技术
|
PHP框架
|
开发工具
|
在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |
京公网安备 11010802041100号
|
京ICP备19059560号-4
| PHP1.CN 第一PHP社区 版权所有