热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

因果推断综述ASurveyonCausalInference

最近读到一篇讲述很全面的综述文献-《ASurveyonCausalInference》,对于接触因果推断不久的同学而言是特别详细的介绍和科普。文献很长,

最近读到一篇讲述很全面的综述文献-《A Survey on Causal Inference》,对于接触因果推断不久的同学而言是特别详细的介绍和科普。文献很长,我会分成几部分介绍。

目录

摘要

第一部分:简介

第二部分:因果推断基础知识

第三部分:基于三种假设的因果推断方法

第四部分:实验

第五部分:应用

 

摘要




 

几十年来,因果推理是一个跨许多领域的关键研究主题,如统计、计算机科学、教育、公共政策和经济学。与随机对照试验相比,研究方向由于可用数据量大且预算要求低,如今,从观测数据中估计因果效应已成为一种吸引人的方法。与迅速发展的机器学习领域相结合,各种从观测数据中估计因果效应的方法如雨后春笋般涌现。

文章在著名的因果推理框架-潜在因果框架下全面的回顾了因果推理方法。根据是否需要潜在因果框架下的三个假设,分为两类。

对于每一个类别,都和传统的统计方法和近年来的机器学习方法进行了讨论和比较。文章还介绍了这些方法的合理应用,包括在广告、推荐、医药等方面的应用。

此外,还总结了常用的基准数据集和开源代码,方便研究者和实践者探索、评价和应用因果推理方法。

 


 


第一部分:简介

在日常语言中,相关性和因果关系通常可以互换使用,尽管它们有不同的解释。相关表示一种一般关系:当两个变量呈现增加或减少趋势时,它们是相关的。因果关系也被称为原因和结果,原因部分地导致结果,而结果部分地依赖于原因。

因果推理是根据某一结果发生的条件对某一因果关系作出结论的过程。因果推理与关联推理的主要区别在于前者分析的是当原因发生变化时,结果变量的响应。

众所周知,“相关性并不意味着因果关系。”例如,一项研究表明,通常吃早餐的女孩比不吃早餐的女孩体重轻,从而得出吃早餐有助于减肥的结论。

但事实上,这两件事可能只是有关联,而不是因果关系。也许每天吃早餐的女孩有更好的生活方式,比如经常锻炼,有规律的睡眠,还有健康的饮食,最终让她们变得更轻。

在这种情况下,拥有更好的生活方式是吃早餐和减肥的共同原因,因此我们也可以把它看作是吃早餐和减肥之间因果关系的混淆物。

在许多情况下,一种行为显然会引起另一种行为;然而,也有很多情况是我们很难梳理和确定的关系。因此,学习因果关系是一个具有挑战性的问题。

推断因果关系最有效的方法是进行随机对照试验,将参与者随机分配到治疗组或对照组。在进行随机化研究时,控制组和治疗组之间唯一的预期差异是所研究的结果变量。

然而,在现实中,随机对照试验总是耗时和昂贵的,因此,研究不能涉及很多对象,这可能不能代表治疗/干预最终的目标人群

另一个问题是,随机对照试验只关注样本的平均值,并不能解释其机制或适用于个体受试者。

此外,在大多数随机对照试验中也需要考虑伦理问题,这在很大程度上限制了它的应用。因此,相比随机对照试验,观察数据是一个诱人的捷径。

观察数据是由研究人员在没有任何干扰的情况下简单地观察受试者而获得的。这意味着,研究人员无法控制治疗方法和研究对象,他们只是观察研究对象,并根据他们的观察记录数据。从观测数据中,我们可以发现他们的行为、结果和关于发生了什么事情的信息,但不能找出他们为什么采取特定行动的机制。

对于观测数据,核心问题是如何得到反事实的结果。例如,我们想回答这个问题“如果这个病人接受了不同的药物治疗,他会有不同的结果吗?”回答这样的反事实问题是具有挑战性的,原因有两个:

 

第一,我们只观察事实结果,而不会观察如果他们选择不同的治疗方案可能会发生的反事实结果。

第二个是治疗通常不是随机分配的观察性数据,这可能导致治疗人群与一般人群显著不同。

为了解决从观察数据中进行因果推理的这些问题,研究人员开发了各种框架,包括潜在结果框架和结构因果模型。潜在结果框架也被称为内曼-鲁宾潜在结果或鲁宾因果模型。

在我们上面提到的例子中,一个女孩如果每天正常吃早餐,她的体重会是特定的,而如果她不正常吃早餐,她的体重会是不同的。来衡量一个女孩正常吃早餐的因果关系,我们需要比较同一个人在两种情况下的结果。显然,同时看到这两种潜在结果是不可能的,其中一种潜在结果总是丢失。潜在结果框架旨在评估这些潜在结果,然后计算治疗效果。

因此,治疗效果估计是潜在结果框架下因果推理的核心问题之一。

因果推理中另一个有影响力的框架是结构推理因果模型(SCM),它包括因果图和结构方程。

结构因果模型描述了一个系统的因果机制,其中一组变量和它们之间的因果关系是由一组联立的结构方程建模的。



因果推理与机器学习领域有着密切的关系。

近年来,机器学习领域的蓬勃发展促进了因果推理领域的发展。强大的机器学习方法,如决策树,集成方法,深度神经网络,用于更准确地估计潜在的结果。

除了对结果估计模型的改进外,机器学习方法也为处理混杂因素提供了一个新的方面。受益于最近的深度代表性学习方法,如生成对抗神经网络,混杂变量是通过学习所有协变量的平衡表示调整,因此,条件的学习表示,处理分配是独立于混杂变量。在机器学习中,数据越多越好。

然而,在因果推理中,仅靠更多的数据是不够的。拥有更多的数据只能帮助得到更精确的估计,但它不能确保这些估计是正确和公正的。机器学习方法促进了因果推理的发展,同时因果推理也帮助了机器学习方法。单纯追求预测精度对于现代机器学习研究来说是不够的,正确性和可解释性也是机器学习方法的目标。因果推理开始起作用改进机器学习,如推荐系统或强化学习。



在这篇文章中,提供了一个在潜在结果框架下的因果推理方法的全面介绍


  1. 首先介绍潜在结果框架的基本概念以及来识别因果效应的三个关键假设。
  2. 之后,各种因果推理方法都有详细讨论这三种假设,包括重新加权方法、分层方法、基于匹配的方法、基于树的方法、基于表示的方法、基于多任务学习的方法和元学习方法。
  3. 此外,还介绍了释放上述三个假设的因果估计方法,以满足不同情况下的需求。
  4. 在介绍了各种因果效应估计方法之后,以广告区域、推荐区域、医药区域和强化学习区域为代表,讨论了这些方法在现实世界中应用的例子。

据作者介绍,这是第一篇在潜在结果框架下对因果推理方法进行全面讲述的论文。也有一些综述讨论了一类因果效应估计方法,如基于匹配方法的综述,基于树和基于集合的方法的综述,以及动态处理机制的回顾。对于结构因果模型,建议参考综述或书。本文也将简要讨论两个因果关系框架之间的关系和区别。还有一项关于从观察数据学习因果关系的文献,其内容包括从观察数据推断因果图、结构因果模型、潜在结果框架以及它们与机器学习的联系。

与上述文献相比,本文主要关注潜在结果框架的理论背景、统计领域和机器学习领域的代表性方法以及该框架与机器学习领域如何相互增强。



综上所述,此次综述的贡献如下:


  • 新分类法: 根据是否需要潜在结果框架的三个假设,将各种因果推理方法分为两大类。根据处理混杂变量的方法,将需要三个假设的类别进一步分为七个子类别。
  • 全面回顾:提供了一个在潜在结果框架下的因果推理方法的全面综述。在每一类中,对代表性的方法进行了详细的描述,并对两种方法进行了联系和比较,最后给出了总体的总结。
  • 丰富的资源:在这个综述中,列出了最先进的方法、基准数据集、开源代码和代表性的应用程序。

本文的其余部分组织如下。

在第2节中,介绍了潜在结果框架的背景,包括基本定义、假设和基本问题及其一般解决方案。

第3节给出了在三种假设条件下的计算方法。

然后,在第4节,我们讨论了一些假设不满足时的问题,并描述了释放这些假设的方法。

接下来,我们在第5节提供实验指南。

随后,在第6节中,因果推理的典型应用将被说明。

最后,第7节对全文进行了总结。

 


推荐阅读
  • 机器学习核心概念与技术
    本文系统梳理了机器学习的关键知识点,涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容,并深入探讨了各算法的原理和应用场景。 ... [详细]
  • 尽管深度学习带来了广泛的应用前景,其训练通常需要强大的计算资源。然而,并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下(如ARM CPU)高效运行深度神经网络,特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]
  • 2017年人工智能领域的十大里程碑事件回顾
    随着2018年的临近,我们一同回顾过去一年中人工智能领域的重要进展。这一年,无论是政策层面的支持,还是技术上的突破,都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • 卷积神经网络(CNN)基础理论与架构解析
    本文介绍了卷积神经网络(CNN)的基本概念、常见结构及其各层的功能。重点讨论了LeNet-5、AlexNet、ZFNet、VGGNet和ResNet等经典模型,并详细解释了输入层、卷积层、激活层、池化层和全连接层的工作原理及优化方法。 ... [详细]
  • 探索电路与系统的起源与发展
    本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
  • 智能车间调度研究进展
    本文综述了基于强化学习的智能车间调度策略,探讨了车间调度问题在资源有限条件下的优化方法。通过数学规划、智能算法和强化学习等手段,解决了作业车间、流水车间和加工车间中的静态与动态调度挑战。重点讨论了不同场景下的求解方法及其应用前景。 ... [详细]
  • Coursera ML 机器学习
    2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]
  • 随着生活节奏的加快和压力的增加,越来越多的人感到不快乐。本文探讨了现代社会中导致人们幸福感下降的各种因素,并提供了一些改善建议。 ... [详细]
  • 深入浅出TensorFlow数据读写机制
    本文详细介绍TensorFlow中的数据读写操作,包括TFRecord文件的创建与读取,以及数据集(dataset)的相关概念和使用方法。 ... [详细]
  • 本文深入探讨了CART(分类与回归树)的基本原理及其在随机森林中的应用。重点介绍了CART的分裂准则、防止过拟合的方法、处理样本不平衡的策略以及其在回归问题中的应用。此外,还详细解释了随机森林的构建过程、样本均衡处理、OOB估计及特征重要性的计算。 ... [详细]
  • 本文探讨了亚马逊Go如何通过技术创新推动零售业的发展,以及面临的市场和隐私挑战。同时,介绍了亚马逊最新的‘刷手支付’技术及其潜在影响。 ... [详细]
  • 信用评分卡的Python实现与评估
    本文介绍如何使用Python构建和评估信用评分卡模型,涵盖数据预处理、模型训练及验证指标选择。附带详细代码示例和视频教程链接。 ... [详细]
  • 推荐几款高效测量图片像素的工具
    本文介绍了几款适用于Web前端开发的工具,这些工具可以帮助用户在图片上绘制线条并精确测量其像素长度。对于需要进行图像处理或设计工作的开发者来说非常实用。 ... [详细]
author-avatar
serafina捡到一枚人鱼
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有