热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Nature上的GNN论文合集

几篇发表在Nature上的GNN论文。我们周围的很多信息都可以用图表来表示。一个例子是城市道路网络,其中交叉口是节点,道路是链接。另一个是调控网络&#x

几篇发表在Nature上的GNN论文。

1a80044aadd0d94b4ca76d03959c119c.png

我们周围的很多信息都可以用图表来表示。一个例子是城市道路网络,其中交叉口是节点,道路是链接。另一个是调控网络,它描述了不同基因如何相互作用以增强或抑制某些细胞功能。图神经网络(GNN)可以处理基于图的信息以进行预测。在在 2022 年 3 月 23 日的《Nature Machine Intelligence》的一篇论文中,Xue Jiawei 团队基于全球 30 个城市的城市道路网络拓扑特征,使用 GNN 研究和预测社会经济特征。

2074b1f5b20d6596b2ee50be1b9508b8.png

论文链接:https://www.nature.com/articles/s42256-022-00462-y

十多年前,GNN 作为一种处理复杂数据的方法出现了,这些数据最好表示为对象之间的许多链接和依赖关系的图。卷积神经网络(CNN)擅长处理图像、文本或视频等数据。这些可以被认为是简单的图形或固定大小和形状的序列。

但我们周围的大部分数据都采用更复杂的不规则大小和形状的图形形式,例如社交网络、道路网络、基因组数据或分子相互作用。CNN 难以处理这种形式的数据,而这正是 GNN 的用武之地。它们学习对图中每个节点的局部环境信息进行编码。GNN 可以在整个图的级别上执行预测或分类任务,也可以针对每个节点或边执行预测或分类任务。

基于图的深度学习在许多领域都取得了成功,从推荐系统到交通时间预测。但 GNN 也已被证明可用于科学应用,例如基因组学、分子设计、药物开发和物理模拟。在 Schulte-Sasse 团队最近的一篇论文中可以找到一个有前景的基因组学示例。

6cacd9182ebb4a86a3d8cd6dd351633b.png

论文链接:https://www.nature.com/articles/s42256-021-00325-y

在过去的二十年里,高通量测序技术与表观遗传和转录组分子数据相结合,为基因组学提供了丰富的信息,其中一些可以被挖掘来识别致癌基因。

近年来,癌症基因如何导致细胞生长的图景变得更加复杂:癌症可以通过DNA序列水平上基因突变以外的多种途径发生,表观遗传机制或调控区域中间接激活或沉默其他基因的非编码突变也可以发挥作用。多组学数据集可以阐明这些过程。

数据可以建模为生物网络或图形,其中节点代表基因,链接代表基因-基因相互作用。研究人员使用了一种高级类型的 GNN——图卷积网络——它可以根据节点特征向量和网络拓扑对网络中未标记的节点进行分类。通过他们的方法,利用多维多组学节点特征以及蛋白质-蛋白质相互作用网络的拓扑特征,不仅可以识别高度突变的癌症基因,还可以识别包含其他类型改变的基因,或与其他癌症基因相互作用的基因。该研究将来自 16 种癌症类型的基因组数据输入该方法,确定了 165 个可能导致癌症的新候选基因。

Schulte-Sasse 团队使用的机器学习方法——带有图卷积网络的半监督分类——由 Kipf 和 Welling 于 2017 年的一篇开创性论文中被引入。

46ca2cf67b13531df9ebfae8512fd9a7.png

论文链接:https://arxiv.org/abs/1609.02907

在过去的 5 年里,它刺激了基于图的机器学习的许多进步。Haghir Chehreghani 在 2022 年 3 月 23 日的《Nature Machine Intelligence》发表的一篇新闻与观点文章重点介绍了这篇论文,并讨论了该方法的效率、可解释性和可扩展性。

805b56459a2f7ebf1ce66308617f16ad.png

论文链接:https://www.nature.com/articles/s42256-022-00466-8

分子预测和药物发现是基于图的方法的另一个领域。几十年来,该领域以各种创造性的方式使用机器学习,与表示分子的不同方法相关联。一种方法是将分子表示为线性字符串(也称为「简化的分子输入行输入系统」或「SMILES」),这适用于自然语言处理中的深度学习方法。

或者说,为了保留分子的拓扑信息,可以将它们表示为图,以原子为节点,以键为链接。Wang Yuyang 团队最近的一篇论文。描述了一种基于自我监督 GNN 的方法,以解决与潜在生物活性分子的巨大空间(被认为是 10^60 级)相比,分子标记数据相对稀缺的问题。研究人员的框架在一个包含大约 1000 万个分子的大型未标记数据集上进行了训练,并学习了可用于区分化学性质的分子表示。

5f7988681561036556fb3ac4bb5635a5.png

论文链接:https://www.nature.com/articles/s42256-022-00447-x

考虑到具有相同拓扑结构的分子的不同异构体可能具有不同的化学性质,可以添加到分子图形表示中的另一个组件是它们的几何结构。Fang xiaomin 团队最近的一篇论文。描述了如何在几何增强的 GNN 方法中对分子的拓扑结构和几何结构进行编码可以改进分子特性预测。

ffe5f36cd9f9804f89786fd881d30fa0.png

论文链接:https://www.nature.com/articles/s42256-021-00438-4

正如 Chehreghani 所强调的,仍然需要为 GNN 开发一个更好的理论框架,并更好地理解它们的局限性。鉴于越来越多的复杂、高度连接的数据,更基础的理解将刺激 GNN 在许多领域的进一步令人兴奋的应用。

该社论以「The graph connection」为题,于 2022 年 3 月 23 日发布在《Nature Machine Intelligence》。

7c68e606e285748631615eb012608d83.png

参考内容:https://www.nature.com/articles/s42256-022-00476-6

推荐阅读:

我的2022届互联网校招分享

我的2021总结

浅谈算法岗和开发岗的区别

互联网校招研发薪资汇总

对于时间序列,你所能做的一切.

什么是时空序列问题?这类问题主要应用了哪些模型?主要应用在哪些领域?

公众号:AI蜗牛车

保持谦逊、保持自律、保持进步

5586fb54eefc5896db3105a567a5a38f.png

发送【蜗牛】获取一份《手把手AI项目》(AI蜗牛车著)

发送【1222】获取一份不错的leetcode刷题笔记

发送【AI四大名著】获取四本经典AI电子书



推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 闭包一直是Java社区中争论不断的话题,很多语言都支持闭包这个语言特性,闭包定义了一个依赖于外部环境的自由变量的函数,这个函数能够访问外部环境的变量。本文以JavaScript的一个闭包为例,介绍了闭包的定义和特性。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • TPL实现Task.WhileAll扩展方法
    文章翻译整理自NikolaMalovic两篇博文:Task.WhileAllAwaitabletaskprogressreporting当Task.WhenAll遇见 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 本文介绍了九度OnlineJudge中的1002题目“Grading”的解决方法。该题目要求设计一个公平的评分过程,将每个考题分配给3个独立的专家,如果他们的评分不一致,则需要请一位裁判做出最终决定。文章详细描述了评分规则,并给出了解决该问题的程序。 ... [详细]
  • JavaScript设计模式之策略模式(Strategy Pattern)的优势及应用
    本文介绍了JavaScript设计模式之策略模式(Strategy Pattern)的定义和优势,策略模式可以避免代码中的多重判断条件,体现了开放-封闭原则。同时,策略模式的应用可以使系统的算法重复利用,避免复制粘贴。然而,策略模式也会增加策略类的数量,违反最少知识原则,需要了解各种策略类才能更好地应用于业务中。本文还以员工年终奖的计算为例,说明了策略模式的应用场景和实现方式。 ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • ShiftLeft:将静态防护与运行时防护结合的持续性安全防护解决方案
    ShiftLeft公司是一家致力于将应用的静态防护和运行时防护与应用开发自动化工作流相结合以提升软件开发生命周期中的安全性的公司。传统的安全防护方式存在误报率高、人工成本高、耗时长等问题,而ShiftLeft提供的持续性安全防护解决方案能够解决这些问题。通过将下一代静态代码分析与应用开发自动化工作流中涉及的安全工具相结合,ShiftLeft帮助企业实现DevSecOps的安全部分,提供高效、准确的安全能力。 ... [详细]
  • 应用场景当遇到数据分类,聚类,预测等场景问题,普通的SQL方法无法解决,需要借助算法这件武器,比如聚类算法,分类算法,预测算法等等,但是手动去研究一个算法比较吃力,有没有那种工具, ... [详细]
  • SQL Server 2008 到底需要使用哪些端口?
    SQLServer2008到底需要使用哪些端口?-下面就来介绍下SQLServer2008中使用的端口有哪些:  首先,最常用最常见的就是1433端口。这个是数据库引擎的端口,如果 ... [详细]
author-avatar
他乡绿树_762
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有