热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

「认识AI:人工智能如何赋能商业」【06】感知机的兴衰

数据与智能,一个有温度、有价值、

 | Harper

 | gongyouliu

 | auroral-L


知机的兴衰

AI前面已经给大家介绍过了机器学习的兴起与人工神经网络的应用。


我们都会想知道为什么机器学习花了这么长时间才流行起来。毕竟,Arthur Samuel在1959年就创建了他的革命性跳棋程序。机器学习将成为人工智能中最重要的工具,它被科技浪潮裹挟着往前推进。

 

但是事实是,机器学习在其他创新(比如符号方法)的光芒下退居到次要位置。直到20世纪80年代末到90年代初,研究人员才开始重新思考机器学习。


机器学习的起起落落和再次崛起,这说明只有很少的研究人员将精力投人到这个领域的研究中。


1958年康奈尔大学的Frank Rosenblatt教授创建了人工神经网络的早期版本。他没有使用节点和神经元,而是使用感知机,将它们连接在一起,创造出一种复杂的机器智能形式。


Rosenblatt认为这些感知机是通向人工智能最有希望的途径。他发明了一种叫马克1号感知机的机器。它把成千上万的感知机连接成一个神经网络。它有一个小型摄像机,设计用来学习如何分辨两幅图像之间的差异。不幸的是,即便是经过数千次的尝试,马克1号感知机也很难分辨出哪怕是最基本的图像。


当Rosenblatt正在研究他的马克1号感知机时,麻省理工学院的MarvinMinsky教授正在努力研究一种符号方法。然后Minsky和Rosenblatt就哪种方法是人工智能的最佳途径展开了激烈的辩论。1969年,Minsky与人合著了一本名为Perceptions: An Introduction to computation geometry的书。在书中,他坚决反对Rosenblatt 在人工智能中使用感知机的方法,并证明了它无法很好地处理一些简单的逻辑函数。遗憾的是,这本书出版了几年之后,Rosenblatt因事故去世,没有了他对感知机的持续研究,这个研究项目的大部分经费就被取消了。然后感知机与神经网络的研究也一直停滞不前。

 

马克一号感知机没有成功的一个原因是它没有包含隐藏层,而隐藏层是使人工神经网络能够解决挑战性问题的关键组件。由于没有隐藏层,马克一号感知机只能解决线性问题。从问题到解决方案必须借助一条直线来实现。

 

而隐藏层使得网络能够处理非线性问题,比如说,如果你想识别不同种类的小狗,可以将问题层层分解,每一层处理不同的问题。比如第一层识别鼻子,第二层识别眼睛之类的。一层都可以将小狗分类问题分解成属于某个品种的概率问题。


这种多层神经网络的一个主要挑战是,很难让每一层把它学到的知识传递给下一层。20世纪80年代中期,卡内基-梅隆大间学色Geoff Hinton教授找到了训练多层神经网络的有效方法。他使用了一种新的方法训练隐藏层,可以累积更多的信息并传递到下一层。这一方法使得他的人工神经网络能够应对更复杂的挑战、然而,这些早期的人工神经网络能力仍然很有限,它们的速度很慢,必须反复检查同一个问题,才能更好地解决该问题。


后来,在20世纪90年代,Hinton开始从事一个新的领域:深度学习, 这是一种在输入层和输出具层之间包含更多隐藏层的神经网络学习方法。增加的层为人工神经网络提供了更强大的学习能力。深度学习的先驱们还开发了新的方法来促进学习,例如反向传播,这种方法可以让节点之间更快地传递信息。

 

深度学习网络也使用聚类来辅助识别模式。聚类使网络创建不同的类别,最终具备将新信息分类到这些类别的能力。例如,假设你想使用一个深度学习网络来区分猫和其他动物,你可以把100万张各种动物的照片加载到网络中,网络会把它们聚集成不同的组,在同一组的动物具备相似的特性。然后,每当你将一张照片加载到网络中时,它都会将该照片添加到相关组中。


AI




推荐阅读
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • 英特尔推出第三代至强可扩展处理器及傲腾持久内存,AI性能显著提升
    英特尔在数据创新峰会上发布了第三代至强可扩展处理器和第二代傲腾持久内存,全面增强AI能力和系统性能。 ... [详细]
  • 本文介绍如何使用OpenCV和线性支持向量机(SVM)模型来开发一个简单的人脸识别系统,特别关注在只有一个用户数据集时的处理方法。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 计算机学报精选论文概览(2020-2022)
    本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文,旨在为即将投稿的研究者提供参考。 ... [详细]
  • 机器学习(ML)三之多层感知机
    深度学习主要关注多层模型,现在以多层感知机(multilayerperceptron,MLP)为例,介绍多层神经网络的概念。隐藏层多层感知机在单层神经网络的基础上引入了一到多个隐藏 ... [详细]
  • 【转】强大的矩阵奇异值分解(SVD)及其应用
    在工程实践中,经常要对大矩阵进行计算,除了使用分布式处理方法以外,就是通过理论方法,对矩阵降维。一下文章,我在 ... [详细]
  • 自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析
    目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]
  • 本文介绍了如何使用 Google Colab 的免费 GPU 资源进行深度学习应用开发。Google Colab 是一个无需配置即可使用的云端 Jupyter 笔记本环境,支持多种深度学习框架,并且提供免费的 GPU 计算资源。 ... [详细]
  • 目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]
  • 本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节,作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识,为后续的机器学习应用打下坚实的基础。 ... [详细]
  • 非计算机专业的朋友如何拿下多个Offer
    大家好,我是归辰。秋招结束后,我已顺利入职,并应公子龙的邀请,分享一些秋招面试的心得体会,希望能帮助到学弟学妹们,让他们在未来的面试中更加顺利。 ... [详细]
author-avatar
孜雪颖2000
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有