热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

为什么机器学习中常常假设数据是独立同分布的?

独立、相关的关系:独立,两个事件的发生没有任何关系相关,一般指线性相关,不相关指不线性相关,但或许满足非线性相关 同分布:意味着X1和X2具有相同的分布形状和相同的分布参数,对离散

独立、相关的关系:

独立,两个事件的发生没有任何关系

相关,一般指线性相关,不相关指不线性相关,但或许满足非线性相关

 

同分布:

意味着X1和X2具有相同的分布形状和相同的分布参数,对离散随机变量具有相同的分布律,对连续随机变量具有相同的概率密度函数,有着相同的分布函数,相同的期望、方差。

独立同分布(iid)

在不少问题中要求样本(数据)采样自同一个分布是因为希望用训练数据集训练得到的模型可以合理用于测试集,使用同分布假设能够使得这个做法解释得通。

(机器学习就是利用当前获取到的信息(或数据)进行训练学习,用以对未来的数据进行预测、模拟。因此需要我们使用的历史数据具有总体的代表性。)

 


推荐阅读
author-avatar
小虎
每一天,不管用什么方式,我都要变得越来越好!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有