热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

高维列联表

目录一、数据构造二、具体分析三、高维列联表的压缩降维处理四、高维列联表的分层五、局部表与边缘表5.1优势比六、高维列联表的条件独立性检验6.1条件独立性检验举例6

目录

一、数据构造 

二、具体分析

三、高维列联表的压缩/降维处理

四、高维列联表的分层

五、局部表与边缘表 

5.1优势比

六、高维列联表的条件独立性检验 

6.1条件独立性检验举例

6.2辛普森悖论产生的主要原因

​6.3具体分析

七、高维列联表的优比

八、不完备高维列联表




一、数据构造 


二、具体分析

上表为三维2x2x2列联表。其中,“年龄(<40 or 40-59)”为层属性,“呼吸情况(正常 or 不正常)” 为行属性,“吸烟情况(不吸烟 or 吸烟)”为列属性。每一层中,都是一个二维列联表。


三、高维列联表的压缩/降维处理

通过把不同年龄的数据合并,可以将三维列联表压缩成二维列联表。(也可以合并“呼吸情况”的数据,得到“年龄与吸烟情况”的二维表/合并“吸烟情况”的数据,得到“年龄与呼吸情况”的二维表) ,称为边缘表,边缘表即指“忽略”/“边缘化”某个属性后得到的列联表。


四、高维列联表的分层

与压缩降维相反,可以把三维表中的每一层的二维表提取出来加以研究,这时称为局部表

上述三维2×2×2列联表,可以通过按年龄分层,别离出两张二维列联表,即两个局部表。 局部表中的关联性称为条件关联性,即某个属性给定(被控制)时,另外两个属性之间的关系。

局部表的条件关联性可能和边缘表中的关联性有较大差异,甚至是自相矛盾〔辛普森悖论〕。 正是边缘表与局部表分析的条件发生变化,所以把压缩与分层结合起来分析是完全必要的。

分层与压缩相类似地,都可以按照不同的属性压缩或者分层,一般地,按属性A分层,可以分成r个二维c×t列联表;按属性B分层,可以得到c个二维r×t列联表;按属性C分层,可以得到t个二维r×c列联表。

压缩与分层都是针对高维列联表的分析方法,是从不同角度和途径对不同属性之间的关系进展分析的需要。 基于辛普森悖论的存在,压缩与分层经常结合起来使用


五、局部表与边缘表 


5.1优势比

优势比:两个发生比相比;

优势比(Odds Ratios)_weixin_34205826的博客-CSDN博客

 从四格表可知,优势比可以用来度量属性之间的关联性;

根据局部表计算的优势比,称为条件优势; 根据边缘表计算的优势比,称为边缘优势比

与前面所述的局部表与边缘表的关系相一致,条件优势比与边缘优势比是不同的,有时二者会给出完全相反的结论;

⚠️当局部表中两个属性变量条件独立时,所有的条件优势比都等于1;但根据边缘表计算的边缘优势比可能并不等于1,即条件独立不代表边缘独立


六、高维列联表的条件独立性检验 

自由度 :逻辑回归 自由度_回归自由度的官方定义_weixin_26746401的博客-CSDN博客

一般地,按属性A分层,可以分成r个二维c×t列联表;按属性B分层,可以得到c个二维r×t列联表;按属性C分层,可以得到t个二维r×c列联表。


6.1条件独立性检验举例

P值小于0.05则说明有差异存在 ;


6.2辛普森悖论产生的主要原因

(1)在计算总的录取比例时,尽管各个专业的男女生录取比例没有显著差异,但是男生和女生所采用的权重相差较大。

(2)其中,在计算男生录取比例时,录取比例高的专业权重大,录取比例低的专业权重小,导致男生总的录取比例偏高; 在计算女生录取比例时,录取比例高的专业权重小,而录取比例低的专业权重大,从而使总的录取比例偏小。

(3)因此,经过检验,不能说该校有偏爱男生的倾向。

三维列联表除面临前述的条件独立性检验外,还会遇到另外两种独立性检验问题。


以上三种情况下的独立性检验问题之间有以下关系:其中,由左到右是包含和推出的关系,所描述的模型也由简单到复杂。

 为此,可以在处理三维列联表时,按照以上顺序进展检验。如果前面的检验没有被拒绝,就可以不用再进展后面的检验。


6.3具体分析

对于第一种情况下,原假设为:p_{ijk}=p_{i++}p_{+j+}p_{++k}

 

 


七、高维列联表的优比

期望频数除用来描述列联表的独立性、相关性外,还可以描述优势比。 优势比不仅可以用于四格表,还可推广到一般的二维列联表。 可以取二维表的两行两列来构造一个四格表计算优比,三维列联表可以按某一属性分层后形成二维列联表再进行优比分析。

对于属性A,B,C相互独立时,不管按哪个属性分层,各层二维表的优比总等于1

对于A与(B,C)相互独立时,按属性A分层后第i层二维c×t列联表的优比与i无关,故各层B与C的相合程度一样;无论按B,或C分层,这些二维列联表上的优比总等于1

对于A给定后B和C条件独立时,按A分层的二维列联表上的优比总等于1;且按B分层各层A与C相合程度一样,按C分层各层A与B相合程度一样。

对于齐次关联模型,各层二维列联表的优比都与在第几层没有关系。


八、不完备高维列联表

对不完备高维列联表独立性的定义与完备列联表的情形类似,不同的仅仅是定义在非空格上;

以上独立性之间的关系也与完备列联表类似;

独立性外,不完备列联表还有拟相关问题,也与完备列联表类似;与独立性、相关性有关的检验统计量与完备列联表相类似,不同的是自由度,有的需要相应减去空格数m,有的要具体问题具体分析。


推荐阅读
  • 深入解析JVM垃圾收集器
    本文基于《深入理解Java虚拟机:JVM高级特性与最佳实践》第二版,详细探讨了JVM中不同类型的垃圾收集器及其工作原理。通过介绍各种垃圾收集器的特性和应用场景,帮助读者更好地理解和优化JVM内存管理。 ... [详细]
  • 非公版RTX 3080显卡的革新与亮点
    本文深入探讨了图形显卡的进化历程,重点介绍了非公版RTX 3080显卡的技术特点和创新设计。 ... [详细]
  • 使用Python在SAE上开发新浪微博应用的初步探索
    最近重新审视了新浪云平台(SAE)提供的服务,发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用,并分享开发过程中的关键步骤。 ... [详细]
  • 帝国CMS多图上传插件详解及使用指南
    本文介绍了一款用于帝国CMS的多图上传插件,该插件通过Flash技术实现批量图片上传功能,显著提升了多图上传效率。文章详细说明了插件的安装、配置和使用方法。 ... [详细]
  • PHP 5.5.0rc1 发布:深入解析 Zend OPcache
    2013年5月9日,PHP官方发布了PHP 5.5.0rc1和PHP 5.4.15正式版,这两个版本均支持64位环境。本文将详细介绍Zend OPcache的功能及其在Windows环境下的配置与测试。 ... [详细]
  • Win11扩展卷无法使用?解决扩展卷灰色问题的指南
    本文详细介绍了在Windows 11中遇到扩展卷灰色无法使用时的解决方案,帮助用户快速恢复磁盘扩展功能。 ... [详细]
  • 本题通过将每个矩形视为一个节点,根据其相对位置构建拓扑图,并利用深度优先搜索(DFS)或状态压缩动态规划(DP)求解最小涂色次数。本文详细解析了该问题的建模思路与算法实现。 ... [详细]
  • 最近团队在部署DLP,作为一个技术人员对于黑盒看不到的地方还是充满了好奇心。多次咨询乙方人员DLP的算法原理是什么,他们都以商业秘密为由避而不谈,不得已只能自己查资料学习,于是有了下面的浅见。身为甲方,虽然不需要开发DLP产品,但是也有必要弄明白DLP基本的原理。俗话说工欲善其事必先利其器,只有在懂这个工具的原理之后才能更加灵活地使用这个工具,即使出现意外情况也能快速排错,越接近底层,越接近真相。根据DLP的实际用途,本文将DLP检测分为2部分,泄露关键字检测和近似重复文档检测。 ... [详细]
  • 深入理解Redis的数据结构与对象系统
    本文详细探讨了Redis中的数据结构和对象系统的实现,包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型,以及它们所使用的底层数据结构。通过分析源码和相关文献,帮助读者更好地理解Redis的设计原理。 ... [详细]
  • 脑机接口(BCI)技术正逐步将科幻变为现实,从帮助听障人士恢复听力到使瘫痪者重新站立,甚至可能将多年的学习过程压缩至瞬间。本文探讨了这一前沿技术的现状、挑战及其未来前景。 ... [详细]
  • 探索12个能显著提升iPhone使用体验的隐藏技巧,掌握这些功能后,你会发现生活更加便捷高效。 ... [详细]
  • 网易严选Java开发面试:MySQL索引深度解析
    本文详细记录了网易严选Java开发岗位的面试经验,特别针对MySQL索引相关的技术问题进行了深入探讨。通过本文,读者可以了解面试官常问的索引问题及其背后的原理。 ... [详细]
  • 卷积神经网络(CNN)基础理论与架构解析
    本文介绍了卷积神经网络(CNN)的基本概念、常见结构及其各层的功能。重点讨论了LeNet-5、AlexNet、ZFNet、VGGNet和ResNet等经典模型,并详细解释了输入层、卷积层、激活层、池化层和全连接层的工作原理及优化方法。 ... [详细]
  • 本文深入探讨了 Redis 的两种持久化方式——RDB 快照和 AOF 日志。详细介绍了它们的工作原理、配置方法以及各自的优缺点,帮助读者根据具体需求选择合适的持久化方案。 ... [详细]
  • 本文详细介绍了在企业级项目中如何优化 Webpack 配置,特别是在 React 移动端项目中的最佳实践。涵盖资源压缩、代码分割、构建范围缩小、缓存机制以及性能优化等多个方面。 ... [详细]
author-avatar
凡妮04
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有