热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

白话机器学习算法(二十一)logistic回归

http:blog.csdn.netwangxin110000articledetails38112519我们知道最简单的线性回归yf(x)wxb,表示

http://blog.csdn.net/wangxin110000/article/details/38112519


我们知道最简单的线性回归 y=f(x)=wx+b,表示随着x的变化,y会随着变化,而且是确定的,即一对一的映射,x到y的映射

现在有一组<性别&#xff0c;是否有胡须>&#xff0c;我们实际上不好确定的说&#xff0c;男生就一定长胡须&#xff0c;女生就一定不长胡须&#xff0c;最好的办法是&#xff0c;知道了性别是男生后&#xff0c;我们可以认为&#xff0c;长胡须的概率比较大。反正如果知道了女生&#xff0c;那么长胡须的概率比较小。这样子的模型才适合真实情况。

我们希望一个概率模型&#xff0c;这个模型就是logistic回归模型&#xff0c;我们假定一个这样的概率模型&#xff0c;

p(y&#61;1|x)&#61;1/(1&#43;exp(f(x)))

f(x)&#61;wx&#43;b

这个模型是分两步的&#xff0c;

首先x到f&#xff08;x&#xff09;的映射&#xff0c;然后f&#xff08;x&#xff09;到p(y&#61;1|x)

给定训练数据集&#xff0c;我们可以实际得到p(y&#61;1|x)的统计值&#xff0c;这个跟贝叶斯里面是一样的&#xff0c;

对于如下的式子

p(y&#61;1|x)&#61;1/(1&#43;exp(f(x)))

问题就转化成知道左边&#xff0c;知道右边方程的形式&#xff0c;也知道x&#xff0c;就是不知道w和b&#xff0c;就变成了一个参数估计的问题了&#xff0c;怎么求呢&#xff1f;问题就变成了一个最小二乘法估计的问题。

 

前面的描述一定有一个问题&#xff0c;就是这个模型好像是凭空得来的&#xff0c;是不是所有的数据都可以用这个方法去拟合&#xff0c;去计算&#xff1f;

当然不是所有&#xff0c;但是现实生活中的大部分可以&#xff0c;logistic经过三个过程&#xff0c;平缓&#xff0c;快速&#xff0c;平缓&#xff0c;这种模型在经济上&#xff0c;是非常常见的&#xff0c;另外举个关于人的幸福感随着收入&#xff0c;家庭和睦&#xff0c;父母健康程度&#xff0c;朋友数目&#xff0c;等等这些因素变化的例子&#xff0c;研究表明&#xff0c;尽管后面因素的增加&#xff0c;会增加幸福感&#xff0c;但是不是纯线性递增&#xff0c;增长有慢有缓。

 

另外一个逻辑回归的自变量是整个实数域&#xff0c;因变量是离散的&#xff0c;这点与分类有所区别。基本上对于属性连续型我们可以用回归&#xff0c;属性离散的可以用分类。



数据挖掘&#xff0c;机器学习的算法非常多&#xff0c;但是不是拿来就用&#xff0c;应该首先了解算法的特性&#xff0c;使用范围&#xff0c;再看数据来源&#xff0c;什么特点&#xff0c;这个算法是否符合这种数据&#xff0c;再决定使用哪种模型

比如聚类算法数十中&#xff0c;基于图的&#xff0c;基于概率的&#xff0c;基于神经网络模型的&#xff0c;等等&#xff0c;但是有的算法适合小数据&#xff0c;有的要求计算矩阵特征值&#xff0c;有的是多次迭代&#xff0c;不同的算法有不同的应用范围&#xff0c;原理不同&#xff0c;精确度也不同&#xff0c;计算复杂度也不同&#xff0c;对于数十上百万的样本集合&#xff0c;其实可选的模型并不多&#xff0c;这就要对数据了解&#xff0c;对模型了解.

 


推荐阅读
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 理工科男女不容错过的神奇资源网站
    十一长假即将结束,你的假期学习计划进展如何?无论你是在家中、思念家乡,还是身处异国他乡,理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档,能够帮助你在假期中高效学习和提升专业技能。 ... [详细]
  • AI TIME联合2021世界人工智能大会,共探图神经网络与认知智能前沿话题
    AI TIME携手2021世界人工智能大会,共同探讨图神经网络与认知智能的最新进展。自2018年在上海首次举办以来,WAIC已成为全球AI领域的年度盛会,吸引了众多专家学者和行业领袖参与。本次大会将聚焦图神经网络在复杂系统建模、知识图谱构建及认知智能应用等方面的技术突破和未来趋势。 ... [详细]
  • 机器学习算法:SVM(支持向量机)
    SVM算法(SupportVectorMachine,支持向量机)的核心思想有2点:1、如果数据线性可分,那么基于最大间隔的方式来确定超平面,以确保全局最优, ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 如何撰写数据分析师(包括转行者)的面试简历?
    CDA数据分析师团队出品,作者:徐杨老师,编辑:Mika。本文将帮助您了解如何撰写一份高质量的数据分析师简历,特别是对于转行者。 ... [详细]
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性,但Python作为一种通用编程语言,适用于更广泛的领域,包括Web开发、自动化脚本和机器学习等。对于初学者而言,Python的学习曲线更为平缓,上手更加容易。此外,Python拥有庞大的社区支持和丰富的第三方库,使其在实际应用中更具灵活性和扩展性。 ... [详细]
  • 超分辨率技术的全球研究进展与应用现状综述
    本文综述了图像超分辨率(Super-Resolution, SR)技术在全球范围内的最新研究进展及其应用现状。超分辨率技术旨在从单幅或多幅低分辨率(Low-Resolution, LR)图像中恢复出高质量的高分辨率(High-Resolution, HR)图像。该技术在遥感、医疗成像、视频处理等多个领域展现出广泛的应用前景。文章详细分析了当前主流的超分辨率算法,包括基于传统方法和深度学习的方法,并探讨了其在实际应用中的优缺点及未来发展方向。 ... [详细]
  • 专业人士如何做自媒体 ... [详细]
  • 业务团队与独立团队在数据分析领域的效能对比:谁更胜一筹?
    业务团队与独立团队在数据分析领域的效能对比:谁更胜一筹? ... [详细]
  • 探索聚类分析中的K-Means与DBSCAN算法及其应用
    聚类分析是一种用于解决样本或特征分类问题的统计分析方法,也是数据挖掘领域的重要算法之一。本文主要探讨了K-Means和DBSCAN两种聚类算法的原理及其应用场景。K-Means算法通过迭代优化簇中心来实现数据点的划分,适用于球形分布的数据集;而DBSCAN算法则基于密度进行聚类,能够有效识别任意形状的簇,并且对噪声数据具有较好的鲁棒性。通过对这两种算法的对比分析,本文旨在为实际应用中选择合适的聚类方法提供参考。 ... [详细]
  • 射频领域的博士学位在信号处理算法方面具有广阔的职业前景,尤其是在射频技术的应用中。例如,加入华为的射频基站部门,从事数字预失真等关键技术的研发工作。在此过程中,需要注意持续跟踪最新的学术和技术进展,保持对行业动态的敏感性,并不断提升自身的实践能力和创新能力。此外,除了技术层面,还应关注行业的整体发展趋势,以便更好地规划职业生涯。 ... [详细]
author-avatar
岁月掌心_447
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有