热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

机器学习西瓜书笔记,师德师风学习读书笔记

从特殊的训练样例中归纳出一般函数式机器学习的中心问题。1、简介许多机器学习问题涉及到从特殊训练样例中得到一般概念。比如日常生活中学习到的一些概念和类别包括:鸟类、汽

         从特殊的训练样例中归纳出一般函数式机器学习的中心问题。为了获得一个合适的假设,需要在假设空间上搜索以便得到结果,而假设空间本身形成一种自然的结构——即一般到特殊的特殊偏序结构。

 1、简介          许多机器学习问题涉及到从特殊训练样例中得到一般概念。比如日常生活中学习到的一些概念和类别包括:鸟类、汽车、勤奋的学习等。如果给定一样例集合以及每个样例是否属于某一概念的标注,怎样自动推断出该概念的一般定义,这一问题称为概念学习(concept learning)。
          概念学习的 定义:概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数。  2、概念学习任务           考虑一个例子,本例的目标概念是:”A进行水上运动的日子“。表1描述了一系列日子的样例,每个样例表示为属性的集合,属性EnjoySport表示这一天A是否乐于进行水上运动。这个任务的目的是基于某天的各属性推测出该天EnjoySport的值。                     先考虑一个较为简单的形式,即实例的各属性约束的合取式。令每个假设是一个具有6种约束的向量,这些约束指定了属性Sky,AirTemp,……,Forecast的值。每个属性可取值为: 由”?“表示本属性任意可接受的值;明确指定的属性值(如Warm);由”∅“表示不接受任何值。         如果某些实例x满足假设h的所有约束,那么h将x分类为正例(h(x) = 1)。假设A只在寒冷和潮湿的日子进行水上运动(并且与其他属性无关),这样的假设可以表示为:
       
       总之,EnjoySport这个概念学习任务需要学习的是使EnjoySport = yes的日子,并将其表示为属性约束的合取式。任何概念学习任务能被描述为:实例的集合、实例集合上的目标函数、候选假设的集合以及训练样例的集合。       术语解释:       X:实例集合       c:待学习的概念或目标概念,实例集X上的任意布尔函数,即c:X->{0,1}              一旦给定目标概念c 训练样例集,学习器面临的问题就是假设或估计c。使用H来表示所有可能假设的集合,H中每个假设h表示X上定义的布尔函数,即h:X->{0,1}。机器学习的目标是寻找一个假设h,使对于X中的所有x,h(x)=c(x)。
      归纳学习假设:任一假设如果在足够大的训练样例集中很好地逼近目标函数,它也能在未见实例中很好的逼近目标函数。       归纳学习假设是一个基本假定,以后还会有分析……
 3、基于搜索的概念学习         如果把学习看做是一个搜索问题,那么很自然,对于学习算法的研究需要考察假设空间搜索的不同策略。特别是引起我们兴趣的算法能有效地搜索非常大的或无限大的假设空间,以便找到最佳拟合训练数据的假设。         概念学习都有一种很有效的结构:假设的一般到特殊序关系,利用这种自然结构,就不需要明确列出所有的假设,就可以在无限的假设空间中进行彻底的搜索。          比如假设h1,h2,如果任何能够被h1分为正例的实例都会被h2划分为正例,因此,我们说h2比h1更一般。                    定义:令h_j和h_k为在X上定义的布尔函数,称  h_j  more_general_than_or_equal_to  h_k(记作h_j >=g h_k)当且仅当(∀x∈X)[(h_k (x)=1)→(h_j (x)=1)] >=g 是自反、反对称和传递的,即对于3个假设,可能有h2>=g h1,h2>=g h3,但是在h1和h3之间,可能就没有>=g关系了,如下图: >=g给任意概念学习提供了一种有效的结构。 4、FIND-S:寻找极大特殊假设                     FIND-S算法的重要特点是:对以属性约束的合取式描述的假设空间,FIND-S保证输出为H中与正例一致的最特殊的假设,不过FIND-S算法有很多的不足,比如选择的假设是一个最特殊的,没有广泛性,简单说来就是正例的合取式,如果碰到错误的训练实例,假设就会出错。
5、变形空间和候选消除算法          候选消除算法寻找与训练样例一致的所有假设。          定义1:一个假设h与训练样例集合D一致,当且仅当对D中每一个样例都有h(x)  =  c(x)。Consistent(h,D)  <=> (∀∈D)h(x)= c(x)          定义2:关于假设空间H和训练样例集D的变型空间,标记为,                   5.1 列表后消除算法
         
         5.2  简洁表示变型空间
         变型空间中一些极大特殊和极大一般成员形成了一般和特殊边界的集合,这些边界在整个偏序结构中划分出变型空间。
         定义:关于假设空间H和训练数据D的一般边界G,是在H中与D相一致的极大一般成员的集合。

          定义:关于假设空间H和训练数据D的特殊边界G,是在H中与D相一致的极大特殊成员的集合。
          只要集合G和S被良好地定义好了,它们就完全规定了变型空间,其组成是:G中包含的假设,S中包含的假设以及G和S之间偏序结构所规定的假设。
         5.3  候选消除学习算法         
         6、归纳偏置        在给定正确的训练样例并且保证初始假设空间包含目标概念时,候选消除算法可以收敛到目标概念,如果目标概念不在假设空间怎么办?
           学习器如果不对目标概念的形式做预先的假定,它从根本上就无法对未见实例进行分类。归纳学习需要某种形式的预先假定,这种假定被称作归纳偏置。
            定义:考虑对于实例集合X的概念学习算法L。令c为X上定义的任一概念,并令D_c = {}为c的任一训练样例集合。令L(x_i,D_c)表示经过数据D_c的训练后L赋予实例x_i的分类。L的归纳偏置是最小断言集合B,它使任意目标概念c和相应的训练样例D_c满足:
            候选消除算法的归纳偏置:目标概念c包含在给定的假设空间H中。                          总之,归纳偏置就是一个假定,在这个假定之上,我们的学习算法能够很好地得到目标函数。
7、小结 概念学习可看作是搜索预定义潜在假设空间的过程;假设的一般到特殊偏序结构可以定义在任何概念学习问题中,它提供了一种有用的结构以便于假设空间的搜索;归纳学习算法能够对未见数据进行分类,是因为它们在选择一致的假设过程中隐含的归纳偏置。

(本文参考Mitchell的《机器学习》第二章,是为读书笔记)





推荐阅读
  • 对象存储与块存储、文件存储等对比
    看到一篇文档,讲对象存储,好奇,搜索文章,摘抄,学习记录!背景:传统存储在面对海量非结构化数据时,在存储、分享与容灾上面临很大的挑战,主要表现在以下几个方面:传统存储并非为非结 ... [详细]
  • 春季职场跃迁指南:如何高效利用金三银四跳槽季
    随着每年的‘金三银四’跳槽高峰期的到来,许多职场人士都开始考虑是否应该寻找新的职业机会。本文将探讨如何制定有效的职业规划、撰写吸引人的简历以及掌握面试技巧,助您在这关键时期成功实现职场跃迁。 ... [详细]
  • 【转】强大的矩阵奇异值分解(SVD)及其应用
    在工程实践中,经常要对大矩阵进行计算,除了使用分布式处理方法以外,就是通过理论方法,对矩阵降维。一下文章,我在 ... [详细]
  • 本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节,作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识,为后续的机器学习应用打下坚实的基础。 ... [详细]
  • 本文介绍如何使用OpenCV和线性支持向量机(SVM)模型来开发一个简单的人脸识别系统,特别关注在只有一个用户数据集时的处理方法。 ... [详细]
  • 本文分享了作者在使用LaTeX过程中的几点心得,涵盖了从文档编辑、代码高亮、图形绘制到3D模型展示等多个方面的内容。适合希望深入了解LaTeX高级功能的用户。 ... [详细]
  • 本文提供了一个详尽的前端开发资源列表,涵盖了从基础入门到高级应用的各个方面,包括HTML5、CSS3、JavaScript框架及库、移动开发、API接口、工具与插件等。 ... [详细]
  • 【MySQL】frm文件解析
    官网说明:http:dev.mysql.comdocinternalsenfrm-file-format.htmlfrm是MySQL表结构定义文件,通常frm文件是不会损坏的,但是如果 ... [详细]
  • 本文回顾了作者在求职阿里和腾讯实习生过程中,从最初的迷茫到最后成功获得Offer的心路历程。文中不仅分享了个人的面试经历,还提供了宝贵的面试准备建议和技巧。 ... [详细]
  • 本文深入探讨了Linux内核中进程地址空间的设计与实现,包括虚拟地址空间的概念、内存描述符`mm_struct`的作用、内核线程与用户进程的区别、进程地址空间的分配方法、虚拟内存区域(VMA)的结构以及地址空间与页表之间的映射机制。 ... [详细]
  • Ubuntu系统下的GIF动画录制解决方案
    在撰写文章或教程时,GIF动态图能够有效地传达信息。对于Windows用户而言,ScreenToGif是一款非常实用的工具。而在Ubuntu系统中,用户同样拥有多种选择来创建GIF动画,本文将重点介绍两款录屏工具——Byzanz和Peek。 ... [详细]
  • 深入解析Dubbo:使用与源码分析
    本文详细介绍了Dubbo的使用方法和源码分析,涵盖其架构设计、核心特性和调用流程。 ... [详细]
  • 本文详细介绍了如何在Linux系统中使用nslookup命令查询DNS服务器地址,这对于Linux服务器的运维管理是非常重要的基础知识。 ... [详细]
  • Java作为全球最流行的编程语言之一,应用广泛。本文将详细介绍Java开发的相关岗位及其具体职责,帮助读者更好地了解这一领域的职业发展路径。 ... [详细]
  • 本文详细介绍了如何在Linux系统(以CentOS为例)上彻底卸载Zimbra邮件系统,包括停止服务、删除文件和用户等步骤。 ... [详细]
author-avatar
POPO炮炮_797
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有