热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【计算机视觉的修炼秘笈】深度好文,持续更新

前言:这里我整理的一份人工智能200G学习资料大礼包,内含(Python快速入门、深度学习入门、深度学习必备框架TensorFlow、py

前言:

这里我整理的一份人工智能200G学习资料大礼包内含(Python快速入门、深度学习入门、深度学习必备框架TensorFlow、pytorch、计算机视觉OpenCV、NLP自然语言处理等视频课程、学习笔记或源码等)对于想学习人工智能或者转行到AI行业的,大学生都非常实用,免费提供!扫码加VX就能领取! 

 下面是正文:


计算机视觉是从图像和视频中提出数值或符号信息的计算系统,更形象一点说,计算机视觉是让计算机具备像人类一样的眼睛,看到图像,并理解图像。加州大学洛杉矶分校统计学和计算机科学教授教授朱松纯曾表示“人的大脑皮层的活动大约70%是在处理视觉相关信息。视觉就相当于人脑的大门。如果不能处理视觉信息的话,整个人工智能系统是个空架子,只能做符号推理,没法研究真实世界的人工智能。

一起来看看这些计算机视觉领域的修炼秘笈吧!下一个计算机视觉高手也许就是你哦!

一、综合篇

1. Computer Vision: A Modern Approach

作者:David A. Forsyth,‎ Jean Ponce

出版时间:2003(第一版),2011(第二版)

适合人群:初级到中级学者

推荐指数:★★★★★

 

主要内容:本书包含了计算机视觉领域众多问题:成像、面向单张图像的早期视觉、面向多张图像的早期视觉、中层视觉问题、高层视觉问题,也包括了相关的视觉应用,如基于图像的建模与绘制、以人为中心的视觉问题、图像搜索,最后,作者也简要讲述了视觉算法相关的优化技术。

推荐理由:本书既有对计算机视觉问题的系统的讲解,又有对相关问题的详细的讲述。通过本书,读者能够实现计算机视觉应用。本教材成书较早(第一版:2003,第二版:2011),但内容全面广泛,可作为高年级本科生或研究生的教材或参考书,也可作为计算机视觉工程人员的参考书。本书也适合作为计算机视觉相关领域,包括多媒体搜索、计算机图像学、机器人、图像处理、以及成像等领域的研究人员参考书。

图书主页:http://luthuli.cs.uiuc.edu/~daf/book/book.html

2. Computer Vision: Algorithms and Applications

作者:Richard Szeliski

出版时间:2010

适合人群:初级到中级学者

推荐指数:★★★★★

 

本书内容:本教材包含用于分析理解图像的各种各样的技术,同时也讲述了具有挑战性的现实世界的视觉问题,比如医学图像,以及适合于个人相册的图像编辑技术等。具体课题包括:成像,图像处理,特征检测、匹配与分割,基于特征的对齐,基于运动的结构重建,图像粘贴,计算摄影学,立体对齐,三维重建,基于图像的绘制和识别等等。作者也提供了计算机视觉算法涉及到的线性代数、数值优化技术、贝叶斯建模与推理。

推荐理由:本书是作者多年从事计算机视觉教学与研究的成果,按照课程项目的方式组织。可供高年级本科生和研究生计算机视觉课程的教材。

图书主页:http://szeliski.org/Book/

二、几何篇

1. Multiple View Geometry in Computer Vision

作者:Richard Hartley, Andrew Zisserman

出版时间:2000 (第一版),2004(第二版)

适合人群:初级到中级学者

推荐指数:★★★★★

 

 

本书内容:理解真实世界的三维结构是计算机视觉领域的一个基本问题。本书内容包括三维几何与重建所需要的计算相关的几何原则及物体的代数表达。本书以统一框架的形式给出了场景重建的理论与实现细节。同时作者也提供了详尽的背景知识、应用和实现算法的解释。

推荐理由:本教材系统是多视角几何经典教材,既包含经典的方法,又包括现代的方法。本书写作清晰明了,又不失连贯性。本书可作为计算机视觉和计算机图形学等课程高年级本科生和研究生教材,对于自动驾驶、机器人、AR/VR、无人机、地理测绘等领域研究人员和技术人员是重要的参考书。

图书主页:http://www.robots.ox.ac.uk/~vgg/hzbook/

2. An Invitation to 3-D Vision: From Images to Geometric Models

作者:Yi Ma, Stefano Soatto,‎ Jana Kosecká,‎ S. Shankar Sastry

出版时间:2005

适合人群:初级到中级学者

推荐指数:★★★★★

 主要内容:本书着重讲述了计算机视觉中的重要问题:利用线性代数和矩阵理论从一系列二维图像中重建三维结构和运动。本书的特点是一套基于多幅图像的研究几何和重建几何模型的统一框架,也包括了图像形成、基本的图像处理方法以及特征提取等内容,同时也给出实现视觉算法及系统的操作指南。

推荐理由:本书适合于计算机视觉、应用数学、计算机图形学,及机器人等方向的高年级本科生、研究生以及研究人员。同时作者也提供了算法实现的程序,对于自动驾驶、机器人、AR/VR、无人机、地理测绘等领域研究人员和技术人员是重要的参考书。

图书主页:http://vision.ucla.edu/MASKS/

3. 计算机视觉: 计算理论与算法基础

作者:马颂德,张正友

出版时间:1998 (第一版),2003(第二版)

适合人群:初级到中级

推荐指数:★★★★★

 

主要内容:计算机视觉从信息处理的层次研究视觉信息的认知过程,以及视觉信息处理的计算理论、表达与计算方法。本书系统地介绍了计算机视觉的重要理论与算法,包括图像特征提取、摄像机定标、立体视觉、运动视觉(或称序列图像分析)、由图像灰度恢复三维物体形状的方法、物体建模与识别方法以及距离图像分析方法等。

推荐理由:本书主要涵盖了计算机视觉领域早期视觉的问题,对相关问题的研究背景和实现方法做了详细阐述。可作为高年级本科生或研究生的教材或参考书,也可供自动驾驶,AR/VR,无人机,地理测绘等领域研究人员和技术人员参考。

三、机器学习篇

1. Computer Vision: Models, Learning, and Inference

作者:Simon J.D. Prince

出版时间:2012

适合人群:初级到中级学者

推荐指数:★★★★★

 主要内容:本书介绍了解决计算机视觉问题的概率模型学习与推理的方法,讲述了如何利用训练数据建立观察图像和要估计的内容的联系,例如估计三维结构。本书包括概率基础知识、概率图模型、图分割方法、多视觉几何、相机标定、人脸识别、目标跟踪等等。书中共介绍了70多种算法。

推荐理由:本书可以看成计算机视觉与机器学习结合的果实,提供了应用于计算机视觉研究的机器学习(深度学习除外)基本知识,描述简明直观。本教材可作为高年级本科生以及研究生计算机视觉教材,也适合于计算机视觉从业人员。

图书主页:http://www.computervisionmodels.com/

2. Pattern Recognition and Machine Learning

作者:Christopher Bishop

出版时间:2006

适合人群:初级到中级学者

推荐指数:★★★★★

 

主要内容:本书是第一本从贝叶斯的角度讲述模式识别,用图模型的方式描述离散概率分布的书籍。内容包括:线性回归模型、线性分类模型、神经网络、核方法、稀疏核方法、图模型、混合模型与期望最大化算法、近似推理、采样方法、连续隐变量模型等。

推荐理由:本书主要讲述应用于模式识别问题的机器学习方法,也包括视觉识别问题,适合作为高年级本科生及研究生的教材,也是计算机视觉领域研究人员及从业人员学习机器学习的参考书。

图书主页:https://www.microsoft.com/en-us/research/people/cmbishop/#!prml-book?from=https%3A%2F%2Fresearch.microsoft.com%2F%7Ecmbishop%2FPRML%2Findex.htm

3. Deep Learning

作者:Ian Goodfellow and Yoshua Bengio and Aaron Courville

出版时间:2016

适合人群:初级、中级到高级学者

推荐指数:★★★★☆

 

主要内容:本书包括三大部分,第一部分介绍了基本的数学工具和机器学习概念,第二部分描述了最著名的深度学习算法,第三部分列举了深度学习研究前沿的想法及问题。

推荐理由:本书不是专门为计算机视觉而写的深度学习教材,但是包含了成书之前计算机视觉领域发明的深度学习技术,可作为计算机视觉领域的高年级本科生及研究生的教材,也可作为计算机视觉研究人员和从业人员参考书。

图书主页:http://www.deeplearningbook.org/

4. Generalized Principal Component Analysis

作者:RenéVidal,‎ Yi Ma,‎ Shankar Sastry

出版时间:2016

适合人群:中级到高级学者

推荐指数:★★★★★

 

 

主要内容:本书介绍了关于从一个或多个子空间或流形产生出来的,可能含有噪声、大误差或者异常的高维数据建模的数学理论和计算工作的最新进展,涵盖了用于子空间估计和分割的最新的代数的、几何的、统计的计算方法,并且给出了若干在图像处理、图像视频分割、人脸识别与聚类等问题的有趣应用。

推荐理由:本教材可做为计算机视觉以及图像和信号处理、数据科学、机器学习、系统理论等领域的研究生和起步的研究者。本书包含了大量的图解说明、例子、以及练习习题,同时涵盖了本教材涉及到的统计、优化、代数几何等方面的基本概念和原理。

图书主页:http://perception.csl.illinois.edu/gpca/

四、经典读物篇

Vision: A Computational Investigation into the Human Representation and Processing of Visual Information

作者:David Marr

出版时间:1982

适合人群:中级及高级学者

推荐指数:★★★★★

 

主要内容:本书提供了理解视觉感知的框架,也涉及了大量研究和理解大脑及其功能的问题。在Marr的框架里,视觉过程建立了一套表达方法:开始于图像描述,终结于在周围环境中的三维物体描述。他提出了在神经科学和认知科学领域具有重大影响力的多层次分析方法论:计算层次、算法层次、硬件算法层次。

推荐理由:本书系统的描述了Marr的对于视觉感知的理解的框架。本书自出版以来,影响一代大脑及认知科学家。时至今日,这本书依然是致力于大脑和认知科学、计算机视觉领域特别是视觉感知的研究人员的参考书。

怎么样,找到适合自己的书了吗?2018年不妨先给自己定个小计划:读完3本计算机视觉的经典书目!

你还有哪些喜欢的计算机视觉领域的书呢?

 

 

 这里我整理的一份人工智能200G学习资料大礼包内含(Python快速入门、深度学习入门、深度学习必备框架TensorFlow、pytorch、计算机视觉OpenCV、NLP自然语言处理等视频课程、学习笔记或源码等)对于想学习人工智能或者转行到AI行业的,大学生都非常实用,免费提供!扫码加VX就能领取! 

 

 


推荐阅读
  • 《数据结构》学习笔记3——串匹配算法性能评估
    本文主要讨论串匹配算法的性能评估,包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库,可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n),通过随机取出长度为m的子串作为模式P,在文本T中进行匹配,统计平均复杂度。对于成功和失败的匹配分别进行测试,分析其平均复杂度。详情请参考相关学习资源。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 学习SLAM的女生,很酷
    本文介绍了学习SLAM的女生的故事,她们选择SLAM作为研究方向,面临各种学习挑战,但坚持不懈,最终获得成功。文章鼓励未来想走科研道路的女生勇敢追求自己的梦想,同时提到了一位正在英国攻读硕士学位的女生与SLAM结缘的经历。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • Nginx使用(server参数配置)
    本文介绍了Nginx的使用,重点讲解了server参数配置,包括端口号、主机名、根目录等内容。同时,还介绍了Nginx的反向代理功能。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • CF:3D City Model(小思维)问题解析和代码实现
    本文通过解析CF:3D City Model问题,介绍了问题的背景和要求,并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景,每个网格单元可以作为建筑的基础,建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路,并给出了相应的代码实现供读者参考。 ... [详细]
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析
    本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程,并分析了其所需的资源容量。通过解决错误提示和调整内存大小,成功存储了波形数据。然后,讨论了储存环逐束团信号的意义,以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大,每天需要近250G,一年需要90T。然而,储存环逐束团信号具有重要意义,可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]
  • Webpack5内置处理图片资源的配置方法
    本文介绍了在Webpack5中处理图片资源的配置方法。在Webpack4中,我们需要使用file-loader和url-loader来处理图片资源,但是在Webpack5中,这两个Loader的功能已经被内置到Webpack中,我们只需要简单配置即可实现图片资源的处理。本文还介绍了一些常用的配置方法,如匹配不同类型的图片文件、设置输出路径等。通过本文的学习,读者可以快速掌握Webpack5处理图片资源的方法。 ... [详细]
  • Windows下配置PHP5.6的方法及注意事项
    本文介绍了在Windows系统下配置PHP5.6的步骤及注意事项,包括下载PHP5.6、解压并配置IIS、添加模块映射、测试等。同时提供了一些常见问题的解决方法,如下载缺失的msvcr110.dll文件等。通过本文的指导,读者可以轻松地在Windows系统下配置PHP5.6,并解决一些常见的配置问题。 ... [详细]
  • 本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法,并给出了问题的解析和解决方法。详细介绍了问题的背景和规则,并给出了相应的算法解析和实现步骤。通过本文的解析,读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]
  • 动态规划算法的基本步骤及最长递增子序列问题详解
    本文详细介绍了动态规划算法的基本步骤,包括划分阶段、选择状态、决策和状态转移方程,并以最长递增子序列问题为例进行了详细解析。动态规划算法的有效性依赖于问题本身所具有的最优子结构性质和子问题重叠性质。通过将子问题的解保存在一个表中,在以后尽可能多地利用这些子问题的解,从而提高算法的效率。 ... [详细]
author-avatar
LF猫咪
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有