热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

基于CV、NLP和RA的图片分析分享平台

项目背景在机器学习、深度学习日益火热的今天,出现了各种各样的网络模型和应用。以前的图片处理都是基于连通域或者单个像素处理的技术,在提取信息能力和速度方

项目背景

在机器学习、深度学习日益火热的今天,出现了各种各样的网络模型和应用。以前的图片处理都是基于连通域或者单个像素处理的技术,在提取信息能力和速度方面远没有达到要求。目前最火热的深度学习研究领域包括计算机视觉、自然语言处理等,大数据领域比较火热的如推荐算法的研究等,本项目旨在综合三类研究领域的最新研究进展和成果,构建一个图片分析和分享的网站。主要功能包括以下但不限于:

l  提取图片中的文字

l  检测图片中的物体

l  根据图片生成一段根据这段话的描述,并提取其中的关键词

l  根据图片生成一首古诗(藏头诗)

l  根据图片生成一副对联

l  相似图片搜索

l  图片推荐

目前尚没有这样一个综合各类最新研究的系统,相比较那些需要很大注册用户量才有实用价值的社区系统或者共享平台,本项目的构建更有意义,因为它提供了图片分析处理功能,而这种功能并不依赖于用户群体。而且人们对于图片处理分析的功能需求也与日俱增,比如人们会希望机器可以自动识别并提取出图片中的文字信息(如扫描身份证),再比如人们会希望输入一张图片能得到类似的图片推荐。

技术创新

本项目的核心是模型、数据和算法,创新点在于综合利用了各领域的最新研究成果,通过自主训练模型实现算法,完成这样一个将科研成果转化为实用价值的网站。

工作内容

主要功能包括但不限于以下:

l  提取图片中的文字

l  检测图片中的物体

l  根据图片生成一段根据这段话的描述,并提取其中的关键词

l  根据图片生成一首古诗(藏头诗)

l  根据图片生成一副对联

l  相似图片搜索

l  图片推荐

技术路线

据目前了解,计算机视觉方面需要用到CTPN、SSD、VGGNET等网络模型,NLP方面需要LSTM、RNN等,推荐算法方面需要提取特征、结合协同过滤算法、基于内容的算法等推荐算法,构建网站方面需要前端HTML、CSS、JS等,后端需要django框架。

硬件方面需要一台高性能服务器。


实施方案

CV、NLP、网站、推荐系统并行开发进行。前期工作是做调研,如阅读CVPR会议文献等了解其中的最新的研究进展,使用tensorflow或者caffe等框架实现模型并训练模型。最后把网站与模型相结合。

===================================2018/4/6===================================

AUTHOR: CYM

TOPIC:目标检测模型

CV领域目标检测的发展历程如图:

一开始非常抢眼的RCNN系列,到后来的SSD、YOLO。

RCNN系列需要经过两个步骤,第一步是区域提名,也就是生成预选框,第二步是细化分类。也正因为要两步走,所以在实时性上比不过端到端的SSD、YOLO模型。

而目前的SSD、YOLO等mAP指标已经可以甚至超过了FasterRCNN了。

YOLO目前又推出了v3版本,据说性能和精度上超过了v2。暂不在考虑范围内。

那么YOLOV2和SSD的效果比较如何呢?

值得一提的是,Pascal Voc的是20分类,cocodataset的是80分类,而YOLOV2,又名YOLO9000,可以识别9000种物体。

拟试运行然后比较效果。

待续。


推荐阅读
  • 「爆干7天7夜」入门AI人工智能学习路线一条龙,真的不能再透彻了
    前言应广大粉丝要求,今天迪迦来和大家讲解一下如何去入门人工智能,也算是迪迦对自己学习人工智能这么多年的一个总结吧,本条学习路线并不会那么 ... [详细]
  • 干货 | 携程AI推理性能的自动化优化实践
    作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品,其中性能优化组为AI模型提供全方位的优化方案,提升推理性能降低成本࿰ ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 推荐系统遇上深度学习(十七)详解推荐系统中的常用评测指标
    原创:石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值, ... [详细]
  • 前言:拿到一个案例,去分析:它该是做分类还是做回归,哪部分该做分类,哪部分该做回归,哪部分该做优化,它们的目标值分别是什么。再挑影响因素,哪些和分类有关的影响因素,哪些和回归有关的 ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • 提升Python编程效率的十点建议
    本文介绍了提升Python编程效率的十点建议,包括不使用分号、选择合适的代码编辑器、遵循Python代码规范等。这些建议可以帮助开发者节省时间,提高编程效率。同时,还提供了相关参考链接供读者深入学习。 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • 《数据结构》学习笔记3——串匹配算法性能评估
    本文主要讨论串匹配算法的性能评估,包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库,可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n),通过随机取出长度为m的子串作为模式P,在文本T中进行匹配,统计平均复杂度。对于成功和失败的匹配分别进行测试,分析其平均复杂度。详情请参考相关学习资源。 ... [详细]
  • Window10+anaconda+python3.5.4+ tensorflow1.5+ keras(GPU版本)安装教程 ... [详细]
  • 学习一门编程语言,除了语法,最重要的是学习解决问题。很多时候单凭自己的能力确实无法做到完美解决,所以无论是搜索引擎、社区、文档还是博客&# ... [详细]
  • 2017亚马逊人工智能奖公布:他们的AI有什么不同?
    事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器 ... [详细]
  • Two Sigma人均22万英镑~
    近期原创文章: ... [详细]
author-avatar
MCphp
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有