热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

FocusEnhancedSceneTextRecognitionwithDeformableConvolutions//论文笔记

文章目录2.方法3.实验论文:https:arxiv.orgpdf1908.10998.pdf摘要2.方法采用CRNN作为基线网络,并在其中插入d

文章目录

    • 2.方法
    • 3. 实验



论文:
https://arxiv.org/pdf/1908.10998.pdf

摘要

2.方法

采用CRNN作为基线网络,并在其中插入deformable modules,插入的位置是在cnn的中间部分,作者说:浅层学到的是基本特征,深层特征图的尺寸太小(一般最后为H/4×W/32)学到的偏移可能不够精确,文字检测中一般将deformable 加到cnn的最后,但是文字检测图片的尺寸要大很多,加入了残差模块,和自适应的最大值池化
网络结构
在这里插入图片描述



3. 实验

训练数据为:

  1. MJSynth Dataset
  2. SynthText in the Wild Dataset
    测试数据有:

  • totaltext
  • IC13
  • IC15
  • SVT
  • IIIT5K
    图片resize到200×64,用CTC loss,SGD优化器,64的batchsize,lr=0.00005(好小)
    结果:
    在这里插入图片描述
    DConv+resblock相较于单独的DConv和resblock并没有提高多少。

DConv放置位置的影响
在这里插入图片描述
放到较深的层,最多用两层。


推荐阅读
author-avatar
仲颖凯翰奕颖
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有