热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

吴恩达机器学习笔记1初识机器学习

本章节主要介绍了监督学习和无监督学习的概念与举例,适合小白入门机器学习。1.监督学习监督学习指的就是我们给学习算法一个数据集。这个数据集由“正确答案”组成。房价问题首先给了一系列房

本章节主要介绍了监督学习和无监督学习的概念与举例,适合小白入门机器学习。

1. 监督学习

监督学习指的就是我们给学习算法一个数据集。这个数据集由“正确答案”组成。

房价问题

首先给了一系列房子的数据,然后给定数据集中每个样本实际的售价,然后运用学习算法,算出更多的正确答案。这是一个回归问题,回归是指预测连续值的属性。可以用一条直线、二次函数或二阶多项式拟合数据做出预测。
吴恩达机器学习笔记1 初识机器学习

肿瘤问题

假设想通过查看病历来推测乳腺癌良性与否,例如这组数据:横轴表示肿瘤的大小,纵轴上1表示恶性肿瘤,0表示不是恶性肿瘤。这是一个分类问题,分类是预测离散值的输出,输出可以是多个值。比如说可能有三种乳腺癌,则要预测离散输出0、1、2、3。
吴恩达机器学习笔记1 初识机器学习

在其他机器学习问题中,我们通常有更多的特征。例如肿瘤问题中常采用肿块密度,肿瘤细胞尺寸的一致性和形状的一致性等等这些特征。
吴恩达机器学习笔记1 初识机器学习

当存在无限多种特征时,如何选择预测模型?这将在后面的课程中进行介绍。

2. 无监督学习

无监督学习的数据集没有任何标签,就是给算法一个数据集,但不知道哪些样本是什么类型也不知道有哪些类型,并希望算法从数据中找出某种结构。例如自动将数据分为两个不同的簇,即聚类算法。

应用

  • 组织大型计算机集群。解决什么样的机器易于协同地工作,能让数据中心工作得更高效。
  • 社交网络的分析。自动地给出朋友的分组,识别出同属一个圈子的朋友。
  • 市场分割。许多公司有大型的数据库,存储消费者信息。检索这些顾客数据集,自动找出不同的市场分割,并自动地把顾客划分到不同的细分市场中,实现在不同的细分市场中进行自动高效的销售。

鸡尾酒宴问题

两个人在同时讲话,两个不同位置的麦克风分别录下了这些重叠的声音。通过无监督学习算法找出数据的结构,可以分离出两个音频源。一行代码就可以完成这个算法:

[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x’);
svd是奇异值分解。

下一章将介绍单变量线性回归。


推荐阅读
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 2020年第十一届蓝桥杯决赛JAVA B G题“皮亚诺曲线距离“的个人题解目录
    本文是2020年第十一届蓝桥杯决赛JAVA B G题“皮亚诺曲线距离“的个人题解目录。文章介绍了皮亚诺曲线的概念和特点,并提供了计算皮亚诺曲线上两点距离的方法。通过给定的两个点的坐标,可以计算出它们之间沿着皮亚诺曲线走的最短距离。本文还提供了个人题解的目录,供读者参考。 ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了logistic回归(线性和非线性)相关的知识,包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 本文详细介绍了SQL日志收缩的方法,包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时,还介绍了截断日志的原理和注意事项,包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法,可以有效减小逻辑日志的大小,提高数据库的性能。 ... [详细]
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • PHP设置MySQL字符集的方法及使用mysqli_set_charset函数
    本文介绍了PHP设置MySQL字符集的方法,详细介绍了使用mysqli_set_charset函数来规定与数据库服务器进行数据传送时要使用的字符集。通过示例代码演示了如何设置默认客户端字符集。 ... [详细]
  • HDU 2372 El Dorado(DP)的最长上升子序列长度求解方法
    本文介绍了解决HDU 2372 El Dorado问题的一种动态规划方法,通过循环k的方式求解最长上升子序列的长度。具体实现过程包括初始化dp数组、读取数列、计算最长上升子序列长度等步骤。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 本文由编程笔记小编整理,介绍了PHP中的MySQL函数库及其常用函数,包括mysql_connect、mysql_error、mysql_select_db、mysql_query、mysql_affected_row、mysql_close等。希望对读者有一定的参考价值。 ... [详细]
  • Oracle分析函数first_value()和last_value()的用法及原理
    本文介绍了Oracle分析函数first_value()和last_value()的用法和原理,以及在查询销售记录日期和部门中的应用。通过示例和解释,详细说明了first_value()和last_value()的功能和不同之处。同时,对于last_value()的结果出现不一样的情况进行了解释,并提供了理解last_value()默认统计范围的方法。该文对于使用Oracle分析函数的开发人员和数据库管理员具有参考价值。 ... [详细]
  • 解决Cydia数据库错误:could not open file /var/lib/dpkg/status 的方法
    本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件,以及ifunbox工具和终端命令,可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中,并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]
author-avatar
juxiu小妹_895
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有