热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

京东实习总结

研一上学期实在是太闲了,课少,自学能力又差,一学期下来感觉没学到什么东西。这学期索性就在京东找了个实习。到周五离职的时候,算了算,自己在京东呆了也有半年了。现在想想,这半年真是一晃就过了

       研一上学期实在是太闲了,课少,自学能力又差,一学期下来感觉没学到什么东西。这学期索性就在京东找了个实习。到周五离职的时候,算了算,自己在京东呆了也有半年了。现在想想,这半年真是一晃就过了。半年前自己不知道该干什么、学什么的小白,现在总算是找到了感兴趣的方向。

      这半年一直在做图像检测,更准确的说应该是文字检测。印象最深的事儿,想想有那么两件。

       之前对图像处理丁点不懂,只能从最基础的一点点开始学。第一个月基本都是在学习。这个项目文字检测的方法主要有FCN和MSER两种。Mentor的意思是想让我负责FCN检测文字这块。所以就开始看FCN的论文,跑通原有的FCN程序,逐步的理解代码。当然,所有的程序都是在Linux服务器上跑的,这让从没用过Linux的我确实头疼了一段时间。当时的项目还是身份证识别。之前由于没有人工的标注数据,所以就用CTPN的方法,标注了两万张身份证数据,训练FCN。CTPN检测横行文字效果还不错,但是检测旋转或者竖行文字奇差无比,而FCN就能克服文字行旋转的问题,这也是为什么选FCN的主要原因。我接手的时候人工标注的数据也陆续到位了,要做的就是用人工标注的新数据重新训练FCN检测模型。用前任的写网络结构,用前任写的代码,直接根据标注数据制作的图片标签,直接用FCN模型预测出的结果。

       现在想想第一个月做的事情真的好简单啊,真的没什么难度。可为什么自己刚开始学的时候那么头大、学的那么郁闷、还花费了那么久的时间呢?我觉得主要还是自己的学习方式不太对:对自己要做的事情没有明确的认识,在学习过程中没能跟mentor时时交流。刚开始的时候,mentor告诉了自己大致要做什么,大致的学习步骤。可是我却没能很快的对自己要做有个真正的明确认识。Mentor告诉我123,我就知道123,而不会对123之外的东西发问。当然mentor对某事表述123,这个123其实只能是大概的描述下,更详细的信息就需要我自己去询问他、自己去挖掘。因为他本身已经十分了解这个项目了,没讲到的456可能对要做的事儿影响不太大,但是这些细节最终会影响自己对事情的理解。或者他潜意识的默认为你能想到,可自己根本就没往这边思考。Mentor告诉我123,我知道123,这只能对事情有个大致、浅显的认识。自己对要做的事儿没有明确认识的根本原因,在于自己没有深入的理解和思考mentor所说的123.这是一个思考方式的错误。正确的思考方式应该是:mentor告诉你了123,应该想这个123是否有把事情清晰、明确的完整描述,如果是否的话,哪一部分不清晰,哪一部分不完整。其次思考mentor告诉你123是想让你做什么、完成什么工作,把自己理解的要做的事儿复述给mentor,看是否理解对了,不对的话哪里不对,及时纠正。再大致构思下做这件事情的步骤,可能会遇到哪些困难,将困难说出来。对自己是困难的事儿,对mentor可能只是小菜一碟,即使mentor不能直接解决,给出的建议或大致解决方向也很有参考价值,能大大节约自己私下搜索解决方案的时间。最后再思考mentor做这件事儿的原因是什么,就是把自己要做的事儿放到一个更大的环境里去理解。了解这件事儿在一个更大环境里的位置,明白它产生的原因,知道这件事情的上下游。这样一套思索的过程下来,才算是对事情有了很好认识。认识明确了做的时候才不会拖拖拉拉的。

       另一件是同步待标注数据的事儿。当时要做票据识别,没有现成的训练数据,所以跟业务方联系了,他们找了一批实习生用手机拍摄发票、火车票、打车票等票据。因为当时的标注平台功能还不是很完善,没有上传的功能,只能由我们研发这边用程序上传新拍的待标注图片。上传图片这种小活,自然就落在我的头上了。

我要做的就是把业务方帮忙拍摄的图片上传到云空间。具体步骤就是业务方会把拍摄的图片传到内网云盘中,然后发给我们组一个链接,我拿到链接后,从云盘上把图片下载下来,再用程序把图片传到云空间。听起来很简单的样子,没有任何的复杂操作。最初我们和业务方是建了一个群,有什么要求都在群里说,他们拍摄完的图片链接也发在群里。刚开始还好,后来拍摄的多了,群里的聊天也很频繁,链接很容易淹没在群聊中。其次业务方发链接的时间很不规律,有时候一天两次,有时候三四天的攒在一起发。而且有时,由于网络的问题,一整个压缩包下载到1G 多的时候会自动中断,更坑的是这个没下完的压缩包还可以正常打开,虽然可以检查大小看是不是有损的,但是文件一多,很容易就漏掉了。每次发的压缩包里文件夹命名很随意,搞不清楚哪个是什么票据。刚开始的几天真的很烦,天天要写程序,还要整理这些琐碎的图片。还有一次一不小心上传重了几百张,mentor语重心长的跟我说,小心点啊,标注一张发票成本要5块钱呢……嗯,我这手一抖损失了好几千。感觉那一个多星期好心情都全陷在图片中了。也反思过为什么会犯错,不过也只是认为自己工作不够细心,再用心点就不会犯这种简单的错误,从始至终也都没有怀疑是不是这个流程有什么问题。后来跟mentor抱怨,说整理图片太麻烦了。Mentor就说这么做不行,并发邮件跟业务方沟通(注意哦,不是在群里沟通,是邮件):建议业务方实习生拍摄照片后文件夹按一定规则命名,发链接的方式由群里改为邮件;邮件中每个压缩包的拍摄日期,每个压缩包包含哪几种票据,每种票据多少张;邮件抄送群里所有人。其实这样做并没有增加多少业务方的工作量,但是却大大减轻了我的工作。邮件的方式更有序,有迹可查;有序的命名规则,不需要我每次打开文件夹看了图片之后才知道这个文件夹里是什么票据。每次的拍摄日期和每种票据的数据,便于我检查下载的压缩包是否有损,也便于统计业务方上传的总数和我方的接收总数是否一致。其实这本是一件很小的事中的一个很小的改进,但是确这实我之前所不曾关注的。错误的根本原因是流程复杂、不规范。当发生错误时,我的第一反应是反思我自己:自己为什么会做错,自己如何才不能不做错。但是很明显这次的事情是一个协同配合才能完成的,是最开始流程就有问题。是,如果自己更细心、更认真,也能避免错误的发生,但是自己有付出更大的精力;如果改进流程的话,每个环节的人稍微多付出一点精力,就能使整个事情做的更好,这难道不是最好的解决方式吗?这件事给我最大的启示是,当出现问题时,是可以自我反思,但是还应该反思自我之外的流程、制度、环境是不是有问题,有些事情不是自己更仔细、更认真了就能有质的改进,需要参与的所有人协同并进才会更好。

       这算是对我的思维方式改变最大的两件小事了。

       技术方面,这半年算是图像处理、深度学习简单入门了。前期都是在学习、调模型参数,实际上并没有产生多大质的提升。自己也在看物体检测相关的论文,逐步了解检测领域的基本算法和前沿的通用算法,大致对这一块有了基本的认识。直到后来做营业执照识别的时候,才真正的稍有创新。营业执照文字多,特别是经营范围一块,文字周密,文字行间距小,预测的文字行基本都是粘连在一起。无论怎么调模型参数,都不太能直接分开,只能通过对预测结果的处理把粘连的文字行分隔开。这一部分,自己费了一些功夫。再到发票检测的时候,仅对预测结果进行处理又不可行了,这时开始在制作标签这块动心思,后来取得的效果还不错。实习期间还研究了直线检测和tiny-DNN框架,把前任固定大小的FCN检测模型改成任意大小的。虽然做的一切最终使用效果还行,但总觉得没有质的改变。质的改变是在于模型的改变或者模型结构的改变。自己现在会用FCN,也理解它的原理,却没有改进它的思路,也找不到更好的替代方法,这令我很不开心。究其原因,还是自己对物体检测、文字检测这块了解的不够深入。所以离职,回学校,好好研究下这块。

       这半年,学到很多,可是发现自己不知道的更多。

       研二这学期有这么几个想法:

       1.    把Deep learning 的英文版刷完

       2.    研究文字检测

       3.    研究文字识别。为自己的文字检测结果找个应用的地儿。

       4.    认真学习一下区块练技术

       5.    修身养性。补充补充人文历史的知识,多点人文关怀,让这学期的生活不那么枯燥。


 

 

 


推荐阅读
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 本文深入探讨了Linux系统中网卡绑定(bonding)的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡,实现网络冗余、带宽聚合和负载均衡,在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]
  • 掌握远程执行Linux脚本和命令的技巧
    本文将详细介绍如何利用Python的Paramiko库实现远程执行Linux脚本和命令,帮助读者快速掌握这一实用技能。通过具体的示例和详尽的解释,让初学者也能轻松上手。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 如何配置Unturned服务器及其消息设置
    本文详细介绍了Unturned服务器的配置方法和消息设置技巧,帮助用户了解并优化服务器管理。同时,提供了关于云服务资源操作记录、远程登录设置以及文件传输的相关补充信息。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • PHP 5.2.5 安装与配置指南
    本文详细介绍了 PHP 5.2.5 的安装和配置步骤,帮助开发者解决常见的环境配置问题,特别是上传图片时遇到的错误。通过本教程,您可以顺利搭建并优化 PHP 运行环境。 ... [详细]
  • 网络攻防实战:从HTTP到HTTPS的演变
    本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程,探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]
  • 邮件(带附件,模拟文件上传,跨服务器)发送核心代码1.测试邮件发送附件接口***测试邮件发送附件*@parammultipartFile*@return*@RequestMappi ... [详细]
  • 360SRC安全应急响应:从漏洞提交到修复的全过程
    本文详细介绍了360SRC平台处理一起关键安全事件的过程,涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例,展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]
  • 2023年京东Android面试真题解析与经验分享
    本文由一位拥有6年Android开发经验的工程师撰写,详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]
  • 本文介绍了如何使用PHP代码实现微信平台的媒体素材上传功能,详细解释了API接口的使用方法和注意事项,确保文件路径正确以避免常见的错误。 ... [详细]
  • 使用Vultr云服务器和Namesilo域名搭建个人网站
    本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站,包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南,帮助读者顺利完成建站过程。 ... [详细]
  • 在现代网络环境中,两台计算机之间的文件传输需求日益增长。传统的FTP和SSH方式虽然有效,但其配置复杂、步骤繁琐,难以满足快速且安全的传输需求。本文将介绍一种基于Go语言开发的新一代文件传输工具——Croc,它不仅简化了操作流程,还提供了强大的加密和跨平台支持。 ... [详细]
author-avatar
没有丝袜姑娘
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有