热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

谷歌照片识别系统可确定照片拍摄地点

谷歌的两名工程师开发出一款名为PlaNet的照片识别系统,这个系统可以通过分析照片上的像素确定照片的拍摄地点。人们通常很难仅凭肉眼观察照片上的景物判断出照片的拍摄地点。例如,这张

  谷歌的两名工程师开发出一款名为PlaNet的照片识别系统,这个系统可以通过分析照片上的像素确定照片的拍摄地点。

  人们通常很难仅凭肉眼观察照片上的景物判断出照片的拍摄地点。例如,这张照片上有着白色的沙滩,人们可能会以为这是在加勒比海的岸边拍摄的,但实际上这张照片是在马尔代夫拍摄的。

  很多人需要通过地标性景物比如自由女神像或者马丘比丘才能判断照片的拍摄地点,但是谷歌的PlaNet系统就不存在这个问题。虽然它还处于早期开发阶段,但是它的识别能力已经相当强了。

  托比亚斯·韦安德(Tobias Weyand)和詹姆斯·菲尔宾(James Philbin)是谷歌的两名软件工程师,他们与开发员伊利娅·科斯特里科夫(Ilya Kostrikov)一同建立了PlaNet系统。韦安德对《麻省理工科技评论》说:“我们认为PlaNet比人有优势,因为它见过的地方比任何人去过的地方都要多,而且还能识别出不同地方的景色的细微差别,即便是最喜欢旅游、去过很多地方的人也很难看出那些细微差别。”

  韦安德领导的开发团队将全世界划分成一个网格,这个网格由26000个不同大小的方块组成,各个方块的大小由该地点拍摄的照片的数量决定。每一个方块都代表着一个具体的地理区域。

  然后开发团队利用从互联网上的搜集到的各地区的照片建立了一个数据库,然后整理和归入对应的网格方块中。整个系统一共使用了1.26亿张照片。

  开发团队以人脑为模型建立了一个强大计算机系统,并从数据库中提取了9100万张照片来建立核心网络。他们希望最终能够达到这样一种效果:将一张照片输入这个核心网络,马上就能得到照片的拍摄地点或者至少得到最有可能的拍摄地点的列表。

  这个计算机系统会将照片与这个核心网络中的照片进行比对,然后得出初步的识别结果,之后再利用数据库中剩余的3400万张照片对识别结果进行验证,得到最终的识别结果。

  为了测试PlaNet,谷歌开发团队从网络照片库Flickr中提取了230万张带有地理标记的照片,然后让PlaNet对它们进行识别。

  韦安德领导的研发团队在学术报告中写道:“PlaNet能够以街道级精度确定3.6%的照片的拍摄地点,如果从城市级精度来说,识别率为10.1%。”

  这样的结果并不理想,但是PlaNet的表现还是超过了常人。

  平均而言,PlaNet判断的拍摄地点与照片实际拍摄地点的平均差距在1131.7公里以内,而10名见多识广的旅行家判断的结果与实际结果之间的平均差距在2320.75公里以内。

  韦安德的团队写道:“总的来说,PlaNet在50轮人机比试中赢了28轮,平均误差为1131.7公里;人的平均误差为2320.75公里。这场小规模的测试表明,PlaNet在识别街景照片拍摄地点的能力上面已经超过了常人。”


推荐阅读
  • PHP玩家基地系统毕业设计(附源码、运行环境)的用户登录界面、游戏管理和玩家作品管理
    本文介绍了一个PHP玩家基地系统的毕业设计,包括用户登录界面、游戏管理和玩家作品管理等功能。附带源码和运行环境,并提供免费赠送本源代码和数据库的方式,请私信获取详细信息。摘要共计约XXX字。 ... [详细]
  • 基于PgpoolII的PostgreSQL集群安装与配置教程
    本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件,提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能,可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤,并提供了相关的官方参考地址。 ... [详细]
  • 基于layUI的图片上传前预览功能的2种实现方式
    本文介绍了基于layUI的图片上传前预览功能的两种实现方式:一种是使用blob+FileReader,另一种是使用layUI自带的参数。通过选择文件后点击文件名,在页面中间弹窗内预览图片。其中,layUI自带的参数实现了图片预览功能。该功能依赖于layUI的上传模块,并使用了blob和FileReader来读取本地文件并获取图像的base64编码。点击文件名时会执行See()函数。摘要长度为169字。 ... [详细]
  • 本文介绍了如何使用Power Design(PD)和SQL Server进行数据库反向工程的方法。通过创建数据源、选择要反向工程的数据表,PD可以生成物理模型,进而生成所需的概念模型。该方法适用于SQL Server数据库,对于其他数据库是否适用尚不确定。详细步骤和操作说明可参考本文内容。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • PHP设置MySQL字符集的方法及使用mysqli_set_charset函数
    本文介绍了PHP设置MySQL字符集的方法,详细介绍了使用mysqli_set_charset函数来规定与数据库服务器进行数据传送时要使用的字符集。通过示例代码演示了如何设置默认客户端字符集。 ... [详细]
  • 本文是一位90后程序员分享的职业发展经验,从年薪3w到30w的薪资增长过程。文章回顾了自己的青春时光,包括与朋友一起玩DOTA的回忆,并附上了一段纪念DOTA青春的视频链接。作者还提到了一些与程序员相关的名词和团队,如Pis、蛛丝马迹、B神、LGD、EHOME等。通过分享自己的经验,作者希望能够给其他程序员提供一些职业发展的思路和启示。 ... [详细]
  • HDU 2372 El Dorado(DP)的最长上升子序列长度求解方法
    本文介绍了解决HDU 2372 El Dorado问题的一种动态规划方法,通过循环k的方式求解最长上升子序列的长度。具体实现过程包括初始化dp数组、读取数列、计算最长上升子序列长度等步骤。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文讨论了Alink回归预测的不完善问题,指出目前主要针对Python做案例,对其他语言支持不足。同时介绍了pom.xml文件的基本结构和使用方法,以及Maven的相关知识。最后,对Alink回归预测的未来发展提出了期待。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 本文介绍了在Hibernate配置lazy=false时无法加载数据的问题,通过采用OpenSessionInView模式和修改数据库服务器版本解决了该问题。详细描述了问题的出现和解决过程,包括运行环境和数据库的配置信息。 ... [详细]
  • qt学习(六)数据库注册用户的实现方法
    本文介绍了在qt学习中实现数据库注册用户的方法,包括登录按钮按下后出现注册页面、账号可用性判断、密码格式判断、邮箱格式判断等步骤。具体实现过程包括UI设计、数据库的创建和各个模块调用数据内容。 ... [详细]
  • Oracle Database 10g许可授予信息及高级功能详解
    本文介绍了Oracle Database 10g许可授予信息及其中的高级功能,包括数据库优化数据包、SQL访问指导、SQL优化指导、SQL优化集和重组对象。同时提供了详细说明,指导用户在Oracle Database 10g中如何使用这些功能。 ... [详细]
author-avatar
手机用户2502917943
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有