热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

百度螺旋桨PaddleHelix论道“AI+生物计算”,加速推进多维价值释放

在数字化浪潮中,AI正在成为生物医药行业高质量发展的重要推动力。3月23日,百度深圳研发中心自然语言处理部技术总监、螺旋桨PaddleHelix生物计算

41d93292d173e9e6aafd22f885c6499e.gif

在数字化浪潮中,AI正在成为生物医药行业高质量发展的重要推动力。3月23日,百度深圳研发中心自然语言处理部技术总监、螺旋桨 PaddleHelix 生物计算平台负责人何径舟在机器之心AI科技年会AI for Science 论坛上发表了《飞桨螺旋桨PaddleHelix赋能生物医药:AI技术在药物研发领域的探索和应用》主题演讲,介绍了螺旋桨PaddleHelix在生物医药领域的布局与技术进展,以及在应用落地方面的成果。

d0a39f827384cc2ffa001b30e7c1346d.png

传统药研瓶颈待解

预训练或成行业探索新方向

目前,伴随全球生物医药市场规模持续上涨,新药研发的投入产出比却持续下滑,药物研发面临的长周期、高投入、高风险等问题凸显。传统药物研发在尝试了生物实验、传统机器学习等方法后,面对大量无标注的数据,高要求的泛化能力,以及生物计算领域的特性,终于迈向拥有自监督和多任务学习融合能力,又考虑生物领域研究对象特性的预训练模型。

反观以化合物、DNA与RNA、蛋白质为主要研究对象的生物计算,何径舟表示,在此之前,预训练模型在NLP、CV、跨模态等AI领域已相继展现出通用的AI能力、优秀的图像分类效果,以及强大的生成能力,构建基于预训练技术的分子表征模型、蛋白表征模型、组学表征模型,使之成为生物计算的底座,将有助于解决传统机器学习应用在生物领域的问题。

预训练模型发力

释放多维技术优势

基于预训练技术,螺旋桨PaddleHelix已经在化合物表征和蛋白质表征等研究方向上取得重大进展。

在化合物领域,螺旋桨 PaddleHelix 团队揭示了一种基于三维空间结构信息的化合物建模方法,即“几何构象增强 AI 算法”(Geometry Enhanced Molecular Representation Learning,GEM 模型),首次在全球范围内将化合物的几何结构信息引入自监督学习和分子表示模型,并在下游十多项的属性预测任务中取得 SOTA,成为百度在 AI 赋能药物研发领域对外公开的又一项重磅成果。

业界之前的预训练方法没有考虑化合物的三维空间结构,而空间结构对于化合物性质至关重要。凭借化合物表征模型GEM在基于空间结构的图神经网络和多个几何级别的自监督学习任务上的技术创新,该研究于今年2月登上了国际顶级学术期刊《Nature》子刊《Nature Machine Intelligence》。

在蛋白质领域,蛋白的建模技术能够有效表征蛋白,对预测蛋白结构和预测蛋白-蛋白相互作用(PPI)来说至关重要 。螺旋桨PaddleHelix团队以“蛋白PPI表征模型S2F”为例分享了相关进展。蛋白-蛋白相互作用问题与蛋白的结构和功能密切相关,单独使用蛋白质序列很难描述蛋白质的结构和功能。螺旋桨创新性地提出,通过构建多模态的蛋白预训练技术,应用在PPI任务上。该模型在跨物种蛋白PPI、抗体-抗原亲和力预测、SARS-CoV-2的抗体中和预测,以及突变驱动的蛋白结合亲和力变化的预测上,取得SOTA结果,相比于其他蛋白质表示模型有5%-10%的提升。

在本次科技年会上,螺旋桨PaddleHelix团队还透露,螺旋桨基于飞桨框架,联合国内多家超算中心,在国产的软硬件上,完整适配并跑通了AlphaFold2的训练和推理代码,实现千万级别的蛋白质initial training训练时间从AlphaFold2的7天压缩到2.6天。相关代码也将于3月底在螺旋桨PaddleHelix平台开源,为国内相关科研工作者提供更多的选择。

AI+生物计算成果涌动

螺旋桨全面赋能生物医药产业

除了技术上的不断创新,螺旋桨PaddleHelix在药物研发等应用场景领域取得了多项落地进展,全面赋能生物医药产业。

在药物研发领域,基于螺旋桨打造的“ADMET成药性预测模型”已经在biotech公司实际业务管线中完成商业化落地;药物虚拟筛选pipeline在first in class的合作管线中应用,并成功筛选到活性在微摩尔级别的苗头化合物。相关的算法模型也被收录在KDD 2021和BIBM 2021等会议上。

在蛋白领域,螺旋桨PaddleHelix团队运用多模态的蛋白PPI表征模型S2F,联合合作伙伴,共同推进在新冠变异病毒奥密克戎上的研究。通过百度的算法,预测新冠变异病毒奥密克戎的线性抗原表位,帮助合作伙伴研发变异毒株奥密克戎的疫苗,还能快速应对潜在的新型变异,后续也有望携手合作伙伴,在罕见病、癌症、免疫与代谢等疾病领域开创创新药物研发方案。

5efe863b005de56f70ca1b1255512e68.png

据悉,螺旋桨PaddleHelix是基于百度飞桨深度学习框架打造,通过螺旋桨生物计算开源工具集,搭建了生物计算和服务平台,为药物研发、疫苗设计和精准医疗三大场景提供强有力的支撑,同时也为生物信息学、计算机交叉学科背景的学习者、研究者和合作伙伴提供了AI算法模型,赋能生物医药产业。

百度在生物医药方面形成的核心能力已在GitHub开源,提供包括虚拟筛选、ADMET、DTI、PPI、蛋白结构预测等9大能力模块,为生物医药行业内的研究人员提供专业服务。

未来,螺旋桨PaddleHelix生物计算平台,将继续秉持开源开放的态度,期望与更多学术界和生物医药产业伙伴合作,加速AI与生物计算的融合创新,共同推动生物医药行业高质量发展。

GitHub地址:

https://github.com/PaddlePaddle/PaddleHelix

计算平台地址:https://paddlehelix.baidu.com

合作发邮件至:baidubio_cooperate@baidu.com

相关阅读

  • “几何构象增强AI算法”,百度生物计算最新研究成果登上《Nature》子刊
  • 进军生物计算!百度发布飞桨螺旋桨PaddleHelix
  • 螺旋桨RNA结构预测竞赛隆重登场,世界顶级算法助你赢取10万现金奖
  • RNA结构预测竞赛圆满落幕,且看冠军团队飞桨论道(上篇)
  • RNA结构预测竞赛圆满落幕,且看前三名团队飞桨论道(下篇)
  • RNA结构预测竞赛圆满落幕,优胜选手花式解题思路齐奉上

开奖预告

3月18日-4月1日期间

『分享最多』『阅读最多』榜单前5名活跃粉丝可获飞桨定制程序员盲盒一个

获奖名单将于4月3日公布~

454725e22030f9ab9b76aa880763d808.png

1d548937dcc33679ccc2ed3c41dc052e.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

6392f154a0482a767e66e30c9280eb27.png


推荐阅读
  • 抠图前vsPython自动抠图后在日常的工作和生活中,我们经常会遇到需要抠图的场景,即便是只有一张图片需要抠,也会抠得我们不耐烦ÿ ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 早晨七点半。北京初秋的凉风叫醒了住在望京西的你,睁开眼睛,一想到又要为人类的信息化事业贡献满满的正能量,你不禁哼唱起那句“早晨起来 ... [详细]
  • 世界人工智能大赛OCR赛题方案!
     Datawhale干货 作者:阿水,北京航空航天大学,Datawhale成员本文以世界人工智能创新大赛(AIWIN)手写体OCR识别竞赛为实践背景,给出了OCR实践的常见思路和流 ... [详细]
  • 学习提醒 | 如何训练RNN?解决梯度消失与梯度爆炸问题!
    点击左上方蓝字关注我们今天就要进入RNN的终章,每日一问:它们如何运行?应用在哪里?你学完了吗?????顾名思 ... [详细]
  • 提升Python编程效率的十点建议
    本文介绍了提升Python编程效率的十点建议,包括不使用分号、选择合适的代码编辑器、遵循Python代码规范等。这些建议可以帮助开发者节省时间,提高编程效率。同时,还提供了相关参考链接供读者深入学习。 ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了logistic回归(线性和非线性)相关的知识,包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • 本文介绍了九度OnlineJudge中的1002题目“Grading”的解决方法。该题目要求设计一个公平的评分过程,将每个考题分配给3个独立的专家,如果他们的评分不一致,则需要请一位裁判做出最终决定。文章详细描述了评分规则,并给出了解决该问题的程序。 ... [详细]
  • 本文介绍了P1651题目的描述和要求,以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术,将问题转化为求解差值的问题,并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • Jupyter 使用Anaconda 虚拟环境内核
    Anaconda虚拟环境中使用JupyterNotebook安装好Anaconda之后,进入AnacondaPrompt,创建虚拟环境, ... [详细]
  • 以赛促学,飞桨助力大学生智能车竞赛升级!
    点击左上方蓝字关注我们第十六届智能汽车竞赛-百度人工智能创意赛道已经开启!比赛虽好,但同学们苦核心开发硬件久矣!百度飞桨作为大赛的赞助商之 ... [详细]
  • 词表|句子_自然语言处理(NLP)基于序列到序列的中英机器翻译
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了自然语言处理(NLP)基于序列到序列的中-英机器翻译相关的知识,希望对你有一定的参考价值。【自然语言处理&#x ... [详细]
  • 产业智能化升级的浪潮并没有因为疫情等原因停滞不前,作为带来人工智能应用井喷式发展的深度学习技术在近几年也可谓是“时代宠儿”,想要尝试应用深度学习技术解决 ... [详细]
author-avatar
手机用户2502863161
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有