热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

机器学习之特征组合:多非线性规律进行编码

在图1和图2中,我们做出如下假设:1.蓝点代表生病的树.2.橙点代表健康的树.图1.这是线性问题吗?您可以画一条线将生病的树与健康的树清晰的分开吗?当然可以.这是个线性问题.这条线






在 图 1 和图 2 中, 我们做出如下假设:
1.蓝点代表生病的树.
2.橙点代表健康的树.


图 1.这是线性问题吗 ?

您可以画一条线将生病的树与健康的树清晰的分开吗 ? 当然可以.这是个线性问题.这条线并不完美.有一两棵生病的树可能位于“健康”一侧, 但您画的这条线可以很好的做出预测.
现在, 我们看看下图:


图 2 .这是线性问题吗 ?

您可以画一条直线将生病的树与健康的树清晰的分开吗 ?
不, 您做不到.这是个非线性问题.您画的任何一条线都不能很好的预测树的健康状况.


图 3. 一条线无法分开两条数据

要解决图 2 所示的非线性问题, 可以创建一个特征组合.特征组合是指将两个或者多个输入特征相乘来对特征空间中的非线性规律进行编码的合成特征. “cross” ( 组合 ) 这一术语来自 cross product ( 向量积 ) .我们通过将 x1 与 x2 组合来创建一个名为 x3 的特征组合:
x3 = x1x2
我们像处理任何其他特征一样来处理这个新建的 x3 的特征组合.线型公式变为:
y = b + w1x1 + w2x2 + w3x3
线性算法可以算出 w3 的权重, 就想算出 w1 和 w2 的权重一样.换言之, 虽然 w3 表示非线性信息, 但您不需要改变线性模型的训练方式来确定 w3 的值.


特征组合的种类

我们可以创建很多不同种类的特征组合.例如:


  1. [A x B] : 将两个特征的之相乘形成的特征组合.
  2. [A x B x C x D x E] : 将五个特征的值相乘形成的特征组合.
  3. [A x A] : 对单个特征的值求平方形成的特征组合.
    通过采用随机梯度下降法, 可以有效地训练线性模型.因此, 在使用线性扩展的线性模型时辅以特征组合一直都是训练大规模数据集的有效方法.



机器学习


推荐阅读
  • Python入门后,想要从事自由职业可以做哪方面工作?1.爬虫很多人入门Python的必修课之一就是web开发和爬虫。但是这两项想要赚钱的话 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 本文介绍了Python爬虫技术基础篇面向对象高级编程(中)中的多重继承概念。通过继承,子类可以扩展父类的功能。文章以动物类层次的设计为例,讨论了按照不同分类方式设计类层次的复杂性和多重继承的优势。最后给出了哺乳动物和鸟类的设计示例,以及能跑、能飞、宠物类和非宠物类的增加对类数量的影响。 ... [详细]
  • 如何使用代理服务器进行网页抓取?
    本文介绍了如何使用代理服务器进行网页抓取,并探讨了数据驱动对竞争优势的重要性。通过网页抓取,企业可以快速获取并分析大量与需求相关的数据,从而制定营销战略。同时,网页抓取还可以帮助电子商务公司在竞争对手的网站上下载数百页的有用数据,提高销售增长和毛利率。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • Python 可视化 | Seaborn5 分钟入门 (六)——heatmap 热力图
    微信公众号:「Python读财」如有问题或建议,请公众号留言Seaborn是基于matplotlib的Python可视化库。它提供了一个高级界面来绘制有吸引力的统计图形。Seabo ... [详细]
  • 本人学习笔记,知识点均摘自于网络,用于学习和交流(如未注明出处,请提醒,将及时更正,谢谢)OS:我学习是为了上 ... [详细]
  • plt python 画直线_机器学习干货,一步一步通过Python实现梯度下降的学习
    GradientDescent-梯度下降梯度下降法(英语:Gradientdescent)是一个一阶最优化算法,通常也称为最速下降法。要使用梯度下降法找 ... [详细]
  • 写在前面最近在学习爬虫,在熟悉了Python语言和BeautifulSoup4后打算下个爬虫框架试试。没想到啊,这坑太深了。。。看了看相关介绍后选择了Scrapy框架,然后兴高采烈的 ... [详细]
  • Python Flask学习之安装SQL,python3,Pycharm(网上下载安装即可)
    1,下载时更改pypi源。可以额外安装虚拟化环境:pipinstall-ihttp:pypi.douban.comsimple--trusted-hos ... [详细]
  • windows创建虚拟环境我这里演示例子是在c盘根目录建立一个py3目录微软cmd,进入到这个py3目录创建虚拟环境python-mevnv.激活虚拟环境继续在windowscmd ... [详细]
author-avatar
爱夏花儿_915
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有