文字识别助力智能运营，加速金融业务流转效率

作者：奶油泡芙2覀21 | 来源：互联网 | 2023-09-09 02:07

智慧金融在金融服务的业务流程中不断深入，金融行业数字化建设的过程除了面向外部客户的服务与销售外，行业内部的支持性系统也在随之升级。智能合规、智能运营广泛

智慧金融在金融服务的业务流程中不断深入&＃xff0c;金融行业数字化建设的过程除了面向外部客户的服务与销售外&＃xff0c;行业内部的支持性系统也在随之升级。智能合规、智能运营广泛应用于企业内部财务管理系统、报销系统、核算系统以及审核系统等平台中&＃xff0c;促使数据沉淀&＃xff0c;加速流程效率&＃xff0c;实现数字化建设闭环。

在智能运营覆盖的各个场景中&＃xff0c;计算机视觉、自然语言处理、传统机器学习算法等人工智能技术充分应用。其中文字识别技术&＃xff08;OCR&＃xff09;作为计算机视觉的主要方向之一&＃xff0c;其识别对象包括扫描合同、印章、卡证、表格与票据信息结构化&＃xff0c;在业务办理、风险控制、内部数据库建设与信息支撑等场景中都扮演着重要角色。

图1 智能运营中的OCR应用

场景问题

在这些场景中&＃xff0c;图片数据一方面通过对纸质文档和票据的扫描来获取&＃xff0c;另一方面包含对证件拍照的方式获取。面临的场景难点和技术难点同时存在&＃xff1a;

难点一&＃xff1a;印章识别场景中的文字遮挡、模糊、弯曲程度高&＃xff0c;印章类型多&＃xff1b;
难点二&＃xff1a;扫描文档文字密集&＃xff0c;检测漏检与识别精度对后续关键信息提取系统影响大&＃xff1b;
难点三&＃xff1a;拍摄卡证图片时的透视变换、过曝过暗、有色阴影等问题&＃xff1b;
难点四&＃xff1a;表格种类繁多&＃xff0c;差异性大&＃xff0c;缺乏开源数据&＃xff0c;无标注工具&＃xff1b;
难点五&＃xff1a;基于图像处理和规则的表格识别难度大&＃xff0c;通用性差&＃xff1b;
难点六&＃xff1a;弯曲文本的端到端算法的精度问题与两阶段算法的速度问题需要权衡。

图2 表格识别中数据种类的多样性

解决方法

良好的算法模型是解决上述问题的首要因素&＃xff0c;这不仅要求算法模型对于某个类型的对象的识别精度能够满足业务需求&＃xff0c;还要其拥有良好的泛化能力。飞桨文字识别开发套件PaddleOCR针对自然场景下的OCR任务提供面向产业级的超轻量通用OCR系统PP-OCRv3&＃xff0c;经过海量数据训练&＃xff0c;达到产业级SOTA&＃xff0c;在工业制造、交通等行业中得到广泛验证。针对文档场景提供智能文档分析系统PP-Structurev2&＃xff0c;实现表格识别、关键信息提取、版面分析与恢复任务。

图3 PP-OCRv3应用效果

图4 PP-Structurev2文档分析流程图

场景应用

场景1

印章弯曲文本检测与识别

印章检测识别是定位合同文件和常用票据中印章位置&＃xff0c;提取识别印章内容的任务。可以用于检测合同文件和票据中是否有印章&＃xff0c;对比印章内容&＃xff0c;验证是否有业务风险。实际业务中通过人工审核对比的方式成本高&＃xff0c;效率低。为了降本增效&＃xff0c;提高生产效率&＃xff0c;基于PaddleDetection和PaddleOCR开发套件&＃xff0c;实现印章检测以及印章文字识别任务&＃xff0c;代替人工识别&＃xff0c;降低成本&＃xff0c;辅助印章比对验证业务&＃xff0c;提高验证效率&＃xff0c;降低财税及商务合同签订过程的业务风险。

图5 印章文本检测与识别

场景2

扫描版合同关键信息抽取

合同审核广泛应用于大中型企业、上市公司、证券、基金公司中&＃xff0c;是规避风险的重要任务。实际业务中人工进行纸质版合同审核成本高&＃xff0c;工作量大。针对以上场景PaddleOCR&＃43;PaddleNLP可以快速提取文本内容&＃xff0c;经过少量数据微调即可准确抽取关键信息&＃xff0c;高效完成合同内容对比、合规性检查、风险点识别等任务&＃xff0c;提高效率&＃xff0c;降低风险。

图6 扫描版合同关键信息抽取

场景3

通用卡证结构化信息提取

卡证识别的应用遍布于银行、保险、证券、信托等各种金融机构&＃xff0c;在业务办理和信息核验场景中需要识别身份证、银行卡、驾驶证、营业执照等。由于数据的采集来源多样&＃xff0c;存在各种噪声&＃xff0c;如图片方向混乱、反光、模糊、倾斜问题的干扰&＃xff0c;且一般需要对卡证信息进行结构化输出。针对上述问题&＃xff0c;基于PaddleClas与PaddleOCR完成卡证方向与类型分类&＃xff0c;多方案卡证检测对比与识别&＃xff0c;最终H-Means达到93%以上。

图7 通用卡证结构化信息提取

&＃xff08;个人信息为虚构&＃xff0c;仅用于展示说明使用&＃xff09;

场景4

中文表格识别与属性分析

中文表格识别在保险理赔、财报分析和信息录入等场景应用颇多&＃xff0c;实际业务中人工进行录入成本高&＃xff0c;同时&＃xff0c;开源中文表格数据集少也限制了中文表格识别模型的发展。针对以上情况&＃xff0c;通过采用数据标注、数据合成和微调等场景适配方法&＃xff0c;同时结合表格属性识别&＃xff0c;快速完成中文表格识别任务。

图8 中文表格识别与属性分析

关于

PaddleOCR

PaddleOCR除了提供产业级特色模型PP-OCR与PP-Structure以外&＃xff0c;打通从数据合成标注、模型训练到推理部署的应用全流程。提供22种训练部署方式&＃xff0c;半自动标注工具PPOCRLabel&＃xff0c;《动手学OCR》电子书以及丰富的场景应用和前沿算法&＃xff0c;通过全流程的开发体验助力产业界快速落地OCR应用。

图9 PaddleOCR全景图

注&＃xff1a;上述图片均来源于网络

课程预告

9月15日&＃xff08;周四&＃xff09;和9月20日&＃xff08;下周二&＃xff09;将由百度研发工程师联合外部合作伙伴带来金融行业智能运营主题课程分享&＃xff0c;名额有限&＃xff0c;感兴趣的朋友可扫码预约课程&＃xff1a;

相关地址

飞桨官网

https://www.paddlepaddle.org.cn

PaddleOCR项目地址

https://github.com/PaddlePaddle/PaddleOCR

https://gitee.com/PaddlePaddle/PaddleOCR

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

推荐阅读

text
【OCR学习笔记】What Is Wrong With Scene Text Recognition Model Comparisons Dataset and Model Analysis

文章目录摘要细节开源代码摘要提出了一个统一的四阶段STR框架。Transformation：TPS，归一化字符区域到预定义的矩形，校正图像。Featureextraction ... [详细]

蜡笔小新 2023-10-15 18:16:55
runtime
利用PaddleSharp模块在C#中实现图像文字识别功能测试

PaddleSharp 是 PaddleInferenceCAPI 的 C# 封装库，适用于 Windows (x64)、NVIDIA GPU 和 Linux (Ubuntu 20.04) 等平台。本文详细介绍了如何使用 PaddleSharp 在 C# 环境中实现图像文字识别功能，并进行了全面的功能测试，验证了其在多种硬件配置下的稳定性和准确性。 ... [详细]

蜡笔小新 2024-10-30 15:53:37
runtime
老电影和图片变清晰的秘密！分辨率提升400%的AI算法

老电影和图片变清晰的秘密！分辨率提升400%的AI算法-如上图，从100x133pix→400x532pix，除了肉眼可见的清晰，拥有可以将分辨率提升400%的技术到底意味着什么 ... [详细]

蜡笔小新 2023-10-13 13:06:20
go
华为200万年薪招聘AI应届生——有多少本事，给多少钱

据新浪科技报道，阿里AIlabs年薪百万美元引进两位科学家。除AI顶尖科学家外，华为也是为多位AI应届博士开出了200万的高价年薪。19年9月，各大互联招聘企业陆续发布2019年人 ... [详细]

蜡笔小新 2023-10-11 14:19:53
sum
计算机学报精选论文概览（2020-2022）

本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文，旨在为即将投稿的研究者提供参考。 ... [详细]

蜡笔小新 2024-11-20 11:08:21
go
[BZOJ2654] Tree 问题：二分查找与 Kruskal 算法结合的优化解决方案

题目《BZOJ2654: Tree》的时间限制为30秒，内存限制为512MB。该问题通过结合二分查找和Kruskal算法，提供了一种高效的优化解决方案。具体而言，利用二分查找缩小解的范围，再通过Kruskal算法构建最小生成树，从而在复杂度上实现了显著的优化。此方法不仅提高了算法的效率，还确保了在大规模数据集上的稳定性能。 ... [详细]

蜡笔小新 2024-11-11 18:19:28
post
如何在Oracle ASM_Diskgroup中重命名现有磁盘

如何在Oracle ASM_Diskgroup中重命名现有磁盘 ... [详细]

蜡笔小新 2024-11-01 12:48:31
post
步入人工智能新时代，这些关键知识点不容错过

步入人工智能新时代，掌握这些关键知识点至关重要。AI技术将成为人类的重要辅助工具，不仅能够扩展和增强人类的智能，还能帮助我们实现更加卓越的成就。新一代人工智能技术的发展将为各行各业带来深远的影响，推动社会进步与创新。 ... [详细]

蜡笔小新 2024-10-29 20:04:07
text
基于TextBoxes++与RetinaNet的高效开源OCR文本识别模型

本文介绍了一款高效的开源OCR文本识别模型，结合了TextBoxes++和RetinaNet的优势。该模型在文本检测方面表现出色，适用于多种场景。项目代码已托管至GitHub，方便研究人员和开发者使用和改进。 ... [详细]

蜡笔小新 2024-10-26 16:12:00
python
基于Python PaddleSpeech实现语音文字处理

基于Python PaddleSpeech实现语音文字处理-目录前言环境安装项目验证tts语音合成asr语音识别标点恢复总结前言这段时间一直在研究飞浆平台，最近试了试PaddleS ... [详细]

蜡笔小新 2024-09-24 17:30:27
io
百度AI Studio人流密度常规赛火热进行中，快来报名！

早晨七点半。北京初秋的凉风叫醒了住在望京西的你，睁开眼睛，一想到又要为人类的信息化事业贡献满满的正能量，你不禁哼唱起那句“早晨起来 ... [详细]

蜡笔小新 2023-10-12 18:57:29
python
python人物抠图算法_比PS还好用！Python 20行代码批量抠图

抠图前vsPython自动抠图后在日常的工作和生活中，我们经常会遇到需要抠图的场景，即便是只有一张图片需要抠，也会抠得我们不耐烦ÿ ... [详细]

蜡笔小新 2023-10-12 18:22:39
python
世界人工智能大赛OCR赛题方案！

Datawhale干货作者：阿水，北京航空航天大学，Datawhale成员本文以世界人工智能创新大赛（AIWIN）手写体OCR识别竞赛为实践背景，给出了OCR实践的常见思路和流 ... [详细]

蜡笔小新 2023-10-11 18:31:00
io
以赛促学，飞桨助力大学生智能车竞赛升级！

点击左上方蓝字关注我们第十六届智能汽车竞赛-百度人工智能创意赛道已经开启！比赛虽好，但同学们苦核心开发硬件久矣！百度飞桨作为大赛的赞助商之 ... [详细]

蜡笔小新 2023-10-11 13:22:52
io
学习提醒 | 如何训练RNN？解决梯度消失与梯度爆炸问题！

点击左上方蓝字关注我们今天就要进入RNN的终章，每日一问：它们如何运行？应用在哪里？你学完了吗？????顾名思 ... [详细]

蜡笔小新 2023-10-10 00:11:56

奶油泡芙2覀21

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章