【计算机视觉的修炼秘笈】深度好文，持续更新

作者：LF猫咪 | 来源：互联网 | 2023-08-31 18:36

前言：这里我整理的一份人工智能200G学习资料大礼包，内含（Python快速入门、深度学习入门、深度学习必备框架TensorFlow、py

前言：

这里我整理的一份人工智能200G学习资料大礼包，内含（Python快速入门、深度学习入门、深度学习必备框架TensorFlow、pytorch、计算机视觉OpenCV、NLP自然语言处理等视频课程、学习笔记或源码等）对于想学习人工智能或者转行到AI行业的，大学生都非常实用，免费提供！扫码加VX就能领取！

下面是正文：

计算机视觉是从图像和视频中提出数值或符号信息的计算系统，更形象一点说，计算机视觉是让计算机具备像人类一样的眼睛，看到图像，并理解图像。加州大学洛杉矶分校统计学和计算机科学教授教授朱松纯曾表示“人的大脑皮层的活动大约70%是在处理视觉相关信息。视觉就相当于人脑的大门。如果不能处理视觉信息的话，整个人工智能系统是个空架子，只能做符号推理，没法研究真实世界的人工智能。”

一起来看看这些计算机视觉领域的修炼秘笈吧！下一个计算机视觉高手也许就是你哦！

一、综合篇

1. Computer Vision: A Modern Approach

作者：David A. Forsyth,‎ Jean Ponce

出版时间：2003（第一版），2011（第二版）

适合人群：初级到中级学者

推荐指数：★★★★★

主要内容：本书包含了计算机视觉领域众多问题：成像、面向单张图像的早期视觉、面向多张图像的早期视觉、中层视觉问题、高层视觉问题，也包括了相关的视觉应用，如基于图像的建模与绘制、以人为中心的视觉问题、图像搜索，最后，作者也简要讲述了视觉算法相关的优化技术。

推荐理由：本书既有对计算机视觉问题的系统的讲解，又有对相关问题的详细的讲述。通过本书，读者能够实现计算机视觉应用。本教材成书较早（第一版：2003，第二版：2011），但内容全面广泛，可作为高年级本科生或研究生的教材或参考书，也可作为计算机视觉工程人员的参考书。本书也适合作为计算机视觉相关领域，包括多媒体搜索、计算机图像学、机器人、图像处理、以及成像等领域的研究人员参考书。

图书主页：http://luthuli.cs.uiuc.edu/~daf/book/book.html

2. Computer Vision: Algorithms and Applications

作者：Richard Szeliski

出版时间：2010

适合人群：初级到中级学者

推荐指数：★★★★★

本书内容：本教材包含用于分析理解图像的各种各样的技术，同时也讲述了具有挑战性的现实世界的视觉问题，比如医学图像，以及适合于个人相册的图像编辑技术等。具体课题包括：成像，图像处理，特征检测、匹配与分割，基于特征的对齐，基于运动的结构重建，图像粘贴，计算摄影学，立体对齐，三维重建，基于图像的绘制和识别等等。作者也提供了计算机视觉算法涉及到的线性代数、数值优化技术、贝叶斯建模与推理。

推荐理由：本书是作者多年从事计算机视觉教学与研究的成果，按照课程项目的方式组织。可供高年级本科生和研究生计算机视觉课程的教材。

图书主页：http://szeliski.org/Book/

二、几何篇

1. Multiple View Geometry in Computer Vision

作者：Richard Hartley, Andrew Zisserman

出版时间：2000 （第一版），2004（第二版）

适合人群：初级到中级学者

推荐指数：★★★★★

本书内容：理解真实世界的三维结构是计算机视觉领域的一个基本问题。本书内容包括三维几何与重建所需要的计算相关的几何原则及物体的代数表达。本书以统一框架的形式给出了场景重建的理论与实现细节。同时作者也提供了详尽的背景知识、应用和实现算法的解释。

推荐理由：本教材系统是多视角几何经典教材，既包含经典的方法，又包括现代的方法。本书写作清晰明了，又不失连贯性。本书可作为计算机视觉和计算机图形学等课程高年级本科生和研究生教材，对于自动驾驶、机器人、AR/VR、无人机、地理测绘等领域研究人员和技术人员是重要的参考书。

图书主页：http://www.robots.ox.ac.uk/~vgg/hzbook/

2. An Invitation to 3-D Vision: From Images to Geometric Models

作者：Yi Ma, Stefano Soatto,‎ Jana Kosecká,‎ S. Shankar Sastry

出版时间：2005

适合人群：初级到中级学者

推荐指数：★★★★★

主要内容：本书着重讲述了计算机视觉中的重要问题：利用线性代数和矩阵理论从一系列二维图像中重建三维结构和运动。本书的特点是一套基于多幅图像的研究几何和重建几何模型的统一框架，也包括了图像形成、基本的图像处理方法以及特征提取等内容，同时也给出实现视觉算法及系统的操作指南。

推荐理由：本书适合于计算机视觉、应用数学、计算机图形学，及机器人等方向的高年级本科生、研究生以及研究人员。同时作者也提供了算法实现的程序，对于自动驾驶、机器人、AR/VR、无人机、地理测绘等领域研究人员和技术人员是重要的参考书。

图书主页：http://vision.ucla.edu/MASKS/

3. 计算机视觉：计算理论与算法基础

作者：马颂德，张正友

出版时间：1998 （第一版），2003（第二版）

适合人群：初级到中级

推荐指数：★★★★★

主要内容：计算机视觉从信息处理的层次研究视觉信息的认知过程，以及视觉信息处理的计算理论、表达与计算方法。本书系统地介绍了计算机视觉的重要理论与算法，包括图像特征提取、摄像机定标、立体视觉、运动视觉(或称序列图像分析)、由图像灰度恢复三维物体形状的方法、物体建模与识别方法以及距离图像分析方法等。

推荐理由：本书主要涵盖了计算机视觉领域早期视觉的问题，对相关问题的研究背景和实现方法做了详细阐述。可作为高年级本科生或研究生的教材或参考书，也可供自动驾驶，AR/VR，无人机，地理测绘等领域研究人员和技术人员参考。

三、机器学习篇

1. Computer Vision: Models, Learning, and Inference

作者：Simon J.D. Prince

出版时间：2012

适合人群：初级到中级学者

推荐指数：★★★★★

主要内容：本书介绍了解决计算机视觉问题的概率模型学习与推理的方法，讲述了如何利用训练数据建立观察图像和要估计的内容的联系，例如估计三维结构。本书包括概率基础知识、概率图模型、图分割方法、多视觉几何、相机标定、人脸识别、目标跟踪等等。书中共介绍了70多种算法。

推荐理由：本书可以看成计算机视觉与机器学习结合的果实，提供了应用于计算机视觉研究的机器学习（深度学习除外）基本知识，描述简明直观。本教材可作为高年级本科生以及研究生计算机视觉教材，也适合于计算机视觉从业人员。

图书主页：http://www.computervisionmodels.com/

2. Pattern Recognition and Machine Learning

作者：Christopher Bishop

出版时间：2006

适合人群：初级到中级学者

推荐指数：★★★★★

主要内容：本书是第一本从贝叶斯的角度讲述模式识别，用图模型的方式描述离散概率分布的书籍。内容包括：线性回归模型、线性分类模型、神经网络、核方法、稀疏核方法、图模型、混合模型与期望最大化算法、近似推理、采样方法、连续隐变量模型等。

推荐理由：本书主要讲述应用于模式识别问题的机器学习方法，也包括视觉识别问题，适合作为高年级本科生及研究生的教材，也是计算机视觉领域研究人员及从业人员学习机器学习的参考书。

图书主页：https://www.microsoft.com/en-us/research/people/cmbishop/#!prml-book?from=https%3A%2F%2Fresearch.microsoft.com%2F%7Ecmbishop%2FPRML%2Findex.htm

3. Deep Learning

作者：Ian Goodfellow and Yoshua Bengio and Aaron Courville

出版时间：2016

适合人群：初级、中级到高级学者

推荐指数：★★★★☆

主要内容：本书包括三大部分，第一部分介绍了基本的数学工具和机器学习概念，第二部分描述了最著名的深度学习算法，第三部分列举了深度学习研究前沿的想法及问题。

推荐理由：本书不是专门为计算机视觉而写的深度学习教材，但是包含了成书之前计算机视觉领域发明的深度学习技术，可作为计算机视觉领域的高年级本科生及研究生的教材，也可作为计算机视觉研究人员和从业人员参考书。

图书主页：http://www.deeplearningbook.org/

4. Generalized Principal Component Analysis

作者：RenéVidal,‎ Yi Ma,‎ Shankar Sastry

出版时间：2016

适合人群：中级到高级学者

推荐指数：★★★★★

主要内容：本书介绍了关于从一个或多个子空间或流形产生出来的，可能含有噪声、大误差或者异常的高维数据建模的数学理论和计算工作的最新进展，涵盖了用于子空间估计和分割的最新的代数的、几何的、统计的计算方法，并且给出了若干在图像处理、图像视频分割、人脸识别与聚类等问题的有趣应用。

推荐理由：本教材可做为计算机视觉以及图像和信号处理、数据科学、机器学习、系统理论等领域的研究生和起步的研究者。本书包含了大量的图解说明、例子、以及练习习题，同时涵盖了本教材涉及到的统计、优化、代数几何等方面的基本概念和原理。

图书主页：http://perception.csl.illinois.edu/gpca/

四、经典读物篇

Vision: A Computational Investigation into the Human Representation and Processing of Visual Information

作者：David Marr

出版时间：1982

适合人群：中级及高级学者

推荐指数：★★★★★

主要内容：本书提供了理解视觉感知的框架，也涉及了大量研究和理解大脑及其功能的问题。在Marr的框架里，视觉过程建立了一套表达方法：开始于图像描述，终结于在周围环境中的三维物体描述。他提出了在神经科学和认知科学领域具有重大影响力的多层次分析方法论：计算层次、算法层次、硬件算法层次。

推荐理由：本书系统的描述了Marr的对于视觉感知的理解的框架。本书自出版以来，影响一代大脑及认知科学家。时至今日，这本书依然是致力于大脑和认知科学、计算机视觉领域特别是视觉感知的研究人员的参考书。

怎么样，找到适合自己的书了吗？2018年不妨先给自己定个小计划：读完3本计算机视觉的经典书目！

你还有哪些喜欢的计算机视觉领域的书呢？

这里我整理的一份人工智能200G学习资料大礼包，内含（Python快速入门、深度学习入门、深度学习必备框架TensorFlow、pytorch、计算机视觉OpenCV、NLP自然语言处理等视频课程、学习笔记或源码等）对于想学习人工智能或者转行到AI行业的，大学生都非常实用，免费提供！扫码加VX就能领取！

推荐阅读

js
全栈工程师在当今技术领域的角色与价值探析

当前，众多初创企业对全栈工程师的需求日益增长，但市场中却存在大量所谓的“伪全栈工程师”，尤其是那些仅掌握了Node.js技能的前端开发人员。本文旨在深入探讨全栈工程师在现代技术生态中的真实角色与价值，澄清对这一角色的误解，并强调真正的全栈工程师应具备全面的技术栈和综合解决问题的能力。 ... [详细]

蜡笔小新 2024-10-31 10:28:12
io
2019年斯坦福大学CS224n课程笔记：深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析

本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理（NLP）领域的应用，重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析，深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]

蜡笔小新 2024-10-29 10:37:07
io
2018年热门趋势：轻松几步构建高效智能聊天机器人

2018年，构建高效智能聊天机器人的简易步骤成为行业焦点。作为AI领域的关键应用，聊天机器人不仅被视为企业市场智能化转型的重要工具，也是技术变现的主要途径之一。随着自然语言处理技术的不断进步，越来越多的企业开始重视并投资于这一领域，以期通过聊天机器人提升客户服务体验和运营效率。 ... [详细]

蜡笔小新 2024-10-28 12:59:49
io
python绘制拟合回归散点图_机器学习之利用Python进行简单线性回归分析

前言：在利用机器学习方法进行数据分析时经常要了解变量的相关性，有时还需要对变量进行回归分析。本文首先对人工智能机器学习深度学习、相关分析因果分析回归分析 ... [详细]

蜡笔小新 2024-10-15 16:59:18
io
中文分词_中文分词技术小结几大分词引擎的介绍与比较

篇首语：本文由编程笔记#小编为大家整理，主要介绍了中文分词技术小结几大分词引擎的介绍与比较相关的知识，希望对你有一定的参考价值。笔者想说：觉得英文与中文分词有很大的区别， ... [详细]

蜡笔小新 2024-10-13 12:29:25
io
当人工智能（AI）撞上供应链

了解供应链简单来说，供应链涉及一系列旨在向最终用户提供产品或服务的步骤。企业组织及其供应商之间始终存在一个网络，来生产特定产品并将其交付给最终用户。该网络包括不同的活动、人员、实体 ... [详细]

蜡笔小新 2024-10-11 18:25:31
io
Python和AI大解密！

作为一种编程语言，Python比C＃，Java，C和C++更具吸引力。它被称为“胶水语言”，它也被喜欢它的程序员誉为“美丽”的编程语言。从云计算，客户端到物联网终端，Pytho ... [详细]

蜡笔小新 2024-10-08 15:58:59
object
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
js
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
js
如何有效防御网络攻击，确保软件系统安全稳定运行？

如何有效防御网络攻击，确保软件系统安全稳定运行？ ... [详细]

蜡笔小新 2024-11-05 21:32:50
js
步入人工智能新时代，这些关键知识点不容错过

步入人工智能新时代，掌握这些关键知识点至关重要。AI技术将成为人类的重要辅助工具，不仅能够扩展和增强人类的智能，还能帮助我们实现更加卓越的成就。新一代人工智能技术的发展将为各行各业带来深远的影响，推动社会进步与创新。 ... [详细]

蜡笔小新 2024-10-29 20:04:07
io
不用蘑菇，不拾金币，我通过强化学习成功通关29关马里奥，创造全新纪录

《超级马里奥兄弟》由任天堂于1985年首次发布，是一款经典的横版过关游戏，至今已在多个平台上售出超过5亿套。该游戏不仅勾起了许多玩家的童年回忆，也成为强化学习领域的热门研究对象。近日，通过先进的强化学习技术，研究人员成功让AI通关了29关，创造了新的纪录。这一成就不仅展示了强化学习在游戏领域的潜力，也为未来的人工智能应用提供了宝贵的经验。 ... [详细]

蜡笔小新 2024-10-28 10:11:47
io
容联云亮相世界人工智能大会发布容犀机器人助力产业数字化转型

2021世界人工智能大会（“WAIC2021”）近日在上海开启，今年大会主题是“智联世界，众智成城”，容联云作 ... [详细]

蜡笔小新 2024-10-17 10:52:39
tree
如何在jieba分词中加自定义词典_常见中文分词包比较

1jiebajieba.cut方法接受三个输入参数:需要分词的字符串；cut_all参数用来控制是否采用全模式；HMM参数用来控制是否使用HMM模型ji ... [详细]

蜡笔小新 2024-10-11 12:27:39
js
高清图解：神经网络、机器学习、数据科学一网打尽

|导|读BY：AI-Beetle完全图解人工智能、NLP、机器学习、深度学习、大数据！这份备忘单涵盖了上述领域几乎全部的知识点，并使用信息图、脑图等多种可视化方式呈现，设计精美，实 ... [详细]

蜡笔小新 2024-10-09 13:33:56

LF猫咪

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章