热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Nature发文——使用机器学习来预测自闭症基因

Nature杂志论文——使用机器学习来预测自闭症基因普林斯顿大学最新一项研究发现了一些新的与自闭症相关的候选基因。虽然研究人员估计存在有数百个与自闭症相关的基因,但实际上只有一小部

Nature杂志论文——使用机器学习来预测自闭症基因

普林斯顿大学最新一项研究发现了一些新的与自闭症相关的候选基因。

虽然研究人员估计存在有数百个与自闭症相关的基因,但实际上只有一小部分有明确的实验证据证明其与自闭症有关。8月1日发表在自然杂志上的一项研究旨在改变这种现状,他们通过使用大数据机器学习的方法来进行一个有关泛自闭症障碍(ASD)的全基因组预测。该研究的第一作者Arjun Krishnan告诉我们他们的结果将如何帮助泛自闭症障碍(ASD)的早期诊断和治疗。

Nature发文——使用机器学习来预测自闭症基因

Q:你能简单总结下你的研究吗?

Arjun Krishnan:泛自闭症障碍(ASD)具有很强的遗传基础,预计有400-1000相关基因,但是目前只有约65种自闭症基因被发现。由于泛自闭症障碍(ASD)十分复杂,光排序或仅仅进行基因研究是相当不够的,不足以揭示自闭症的遗传基础。因此,我们决定采取一种补充数据驱动的方法来解决这一问题。我们使用的方法是基于对先前已知自闭症基因的学习模式与人脑中特定基因网络之间是如何联系的,我们用这些模式来识别新的自闭症基因。

最重要的结果是对基因组中自闭症相关的基因做了一个全面的补充预测。在研究的其他部分中,利用这些基因组泛自闭症障碍ASD候选基因和大脑网络,我们已经确定大脑发育的阶段和区域,以及自闭症患者身上可能会被破坏的特定细胞功能。我们还建立了一个交互网站,任何生物医学研究人员或临床医生都可以访问和查阅使用我们的研究结果。 Nature发文——使用机器学习来预测自闭症基因

Q:你的研究结果意义是什么?

Arjun Krishnan:我们预测了数百个“新的”候选基因,这些都是在以前的自闭症相关遗传研究从来没有被确定或者涉及的。对于遗传学家来说,这意味着他们可以使用我们的预测来直接进行测序研究,更快、更便宜的发现自闭症相关基因。研究人员可以利用它们来区分和解释有关研究ASD全基因组测序的结果。最后,生物医学研究人员可以使用这些数据以及相关分析,全力研究新的自闭症基因以及它的相关功能、发育和在结构上的影响。

Q:你能向我们解释下是如何将机器学习方法应用到这项研究上吗?

Arjun Krishnan:这项技术基本上类似于Facebook使用的“社交网络”方法,人们在社会背景下是互相关联的,Facebook首先通在社交网络中寻找你的朋友,建议你将一位中学同学“添加为好友”,然后通过你们在社交网络中的共同好友进行推荐。

我们建立了一个特定的大脑基因网络,它是一个关于基因如何在大脑中依靠对方正常运转的地图。利用这个网络,我们采用类似的理念来预测新的ASD基因——首先,我们在大脑网络中发现与已经ASD基因相关的同伴,然后确定网络中与这些协作基因相关的其他基因。

这个设想和其他一些设想一起,形成了一个我们进行系统预测的机器学习框架。

Q:你们实现这些成果用了哪些方法?

Arjun Krishnan:我们用来做ASD基因预测的是一种机器学习方法,它能学习如何识别在基因网络与其他基因关联的自闭症基因,然后使用这些模式来预测新的ASD基因。我们使用的基因网络表明基因是如何一起在大脑中以细胞发挥作用的,或直观地说是一副大脑分子水平的功能图。

我们从所有可能的来源收集了与自闭症相关的基因,包括那些有直接证据或者间接证明的,同时对每个基因的证据是否可靠进行跟踪。然后我们建立了一个基于网络证据加权疾病基因分类器,学习在大脑网络中已知ASD基因的连接模式(考虑到每个基因的证据级别),然后使用数据驱动模式来预测基因组中的每一个基因潜在的与ASD的相关性。

 Nature发文——使用机器学习来预测自闭症基因

Q:这种方式与以前的基因预测方法有什么不同呢?

Arjun Krishnan:我们的研究对传统的基因预测方法有两个主要的贡献,首先是我们使用了一个基因组规模的组织特异性网络。人类疾病的起源和表现在人体中特定的组织和细胞类型,例如高血压—肾脏,或自闭症—大脑。因此,要准确地描述哪些基因与自闭症类似的疾病相关,我们需要了解和预测这些基因在大脑中发生了什么,而不是在大脑以外其他人体部分。我们通过在人类基因组中使用特定的大脑网络基因实现了这个结果,基于成千上万的基因组实验融合成了特定的大脑信号。

第二个贡献是使用证据加权进行分类,我们在多个来源精心策划了一组与ASD相关的基因,并追踪这些来源是否可靠,使用他们的证据层级为我们的机器学习作出新的预测方法。这种方式作出的预测比基于高置信基因的预测要准确的多。

Q:你的研究对于泛自闭症障碍(ASD)来说意味着什么?

Arjun Krishnan:目前非常需要一个基因或分子测试来对ASD进行诊断,在脑发育早期尽可能地基于ASD患者的基因组成对其进行药物或其他干预治疗。通过对这些候选基因的实验帮助研究人员有效地缩小ASD的遗传基础和遗传筛选,我们的研究结果使他们离这些目标更近了一些。

Q:你认为机器学习在医学研究中最大的潜力是什么?

Arjun Krishnan:我所看到的机器学习的最大潜力是用其处理这个问题——针对个人的基因组成准确预测其健康和疾病的状态。我们的工作是在重大疾病这一方面迈出的巨大一步,帮助找出基因的“特性”可能定义的疾病,希望它可以用来对疾病进行预测。重要的是在追求这一目标的过程中,不单纯是在机器学习或者生物医学研究领域中进行独立研究,更要考虑这两个领域如何能协同合作一起发挥巨大的潜力。

Q:下一步打算如何进行研究?

Arjun Krishnan:下一步我们正在思考的如何将我们的预测结果应用到自闭症患者的全基因组测序研究上,这令我们十分激动。对全基因组测序研究需要面对相当复杂的情况,我们的预测结果可以帮助研究人员集中在一个变量上,落在其附近或接近的基因我们就可以将其识别为与ASD基因高度相关的选项。

PS : 本文由雷锋网(公众号:雷锋网)独家编译,未经许可拒绝转载!

via ResearchGate

雷锋网原创文章,未经授权禁止转载。详情见转载须知。


Nature发文——使用机器学习来预测自闭症基因


推荐阅读
  • TypeScript 实战分享:Google 工程师深度解析 TypeScript 开发经验与心得
    TypeScript 实战分享:Google 工程师深度解析 TypeScript 开发经验与心得 ... [详细]
  • R语言中向量(Vector)数据类型的元素索引与访问:利用中括号[]和赋值操作符在向量末尾追加数据以扩展其长度
    在R语言中,向量(Vector)数据类型的元素可以通过中括号 `[]` 进行索引和访问。此外,利用中括号和赋值操作符,可以在向量的末尾追加新数据,从而动态地扩展向量的长度。这种方法不仅简洁高效,还能灵活地管理向量中的数据。 ... [详细]
  • 在《Cocos2d-x学习笔记:基础概念解析与内存管理机制深入探讨》中,详细介绍了Cocos2d-x的基础概念,并深入分析了其内存管理机制。特别是针对Boost库引入的智能指针管理方法进行了详细的讲解,例如在处理鱼的运动过程中,可以通过编写自定义函数来动态计算角度变化,利用CallFunc回调机制实现高效的游戏逻辑控制。此外,文章还探讨了如何通过智能指针优化资源管理和避免内存泄漏,为开发者提供了实用的编程技巧和最佳实践。 ... [详细]
  • 最新消息显示,苹果即将发布的新一代iOS系统可能将集成先进的3D地图功能。这一创新技术由C3 Technologies公司开发,曾在今年3月被TechCrunch报道。用户可以通过该功能获得更加真实和沉浸式的地图体验,包括详细的建筑物模型和街景视图。视频演示展示了其卓越的视觉效果和交互性。 ... [详细]
  • 解决针织难题:R语言编程技巧与常见错误分析 ... [详细]
  • Python内置模块详解:正则表达式re模块的应用与解析
    正则表达式是一种强大的文本处理工具,通过特定的字符序列来定义搜索模式。本文详细介绍了Python内置的`re`模块,探讨了其在字符串匹配、验证和提取中的应用。例如,可以通过正则表达式验证电子邮件地址、电话号码、QQ号、密码、URL和IP地址等。此外,文章还深入解析了`re`模块的各种函数和方法,提供了丰富的示例代码,帮助读者更好地理解和使用这一工具。 ... [详细]
  • Android中将独立SO库封装进JAR包并实现SO库的加载与调用
    在Android开发中,将独立的SO库封装进JAR包并实现其加载与调用是一个常见的需求。本文详细介绍了如何将SO库嵌入到JAR包中,并确保在外部应用调用该JAR包时能够正确加载和使用这些SO库。通过这种方式,开发者可以更方便地管理和分发包含原生代码的库文件,提高开发效率和代码复用性。文章还探讨了常见的问题及其解决方案,帮助开发者避免在实际应用中遇到的坑。 ... [详细]
  • a16z深入解析:代币设计的常见误区、优化策略及未来趋势分析
    a16z深入解析:代币设计的常见误区、优化策略及未来趋势分析 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 本文深入解析了 FCEUX 源码,并详细介绍了两种制作 DEB 包的方法及其技术细节。首先,DEB 包通常由两部分组成:控制信息(位于 DEBIAN 目录)和安装内容(模拟目录)。通过解压现有的 DEB 包,可以查看其内部结构,进而理解其工作原理。具体操作包括将安装内容释放到指定目录中,以便进行进一步的修改和定制。此外,文章还探讨了如何修改现有的 DEB 包,以满足特定需求,提供了实用的步骤和技巧。 ... [详细]
  • 为了评估精心优化的模型与策略在实际环境中的表现,Google对其实验框架进行了全面升级,旨在实现更高效、更精准和更快速的在线测试。新的框架支持更多的实验场景,提供更好的数据洞察,并显著缩短了实验周期,从而加速产品迭代和优化过程。 ... [详细]
  • 传奇手游智能辅助脚本能够显著提升玩家的游戏体验,通过自动打怪功能实现高效升级。该脚本利用先进的算法和技术,确保在游戏过程中自动完成战斗任务,帮助玩家节省大量时间和精力。此外,脚本还具备智能路径规划和资源管理功能,进一步优化游戏进程,使玩家能够更加轻松地达到目标等级。 ... [详细]
  • 字节跳动深圳研发中心安全业务团队正在火热招募人才! ... [详细]
  • 华为推出的HMS Core不仅标志着其与全球开发者共同提升用户体验的决心,还展示了其在技术创新方面的强大实力。该平台涵盖了超过20项核心服务,构建了一个全面且高效的服务生态系统,旨在为全球用户提供更加优质、便捷的数字体验。 ... [详细]
  • Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性,但Python作为一种通用编程语言,适用于更广泛的领域,包括Web开发、自动化脚本和机器学习等。对于初学者而言,Python的学习曲线更为平缓,上手更加容易。此外,Python拥有庞大的社区支持和丰富的第三方库,使其在实际应用中更具灵活性和扩展性。 ... [详细]
author-avatar
The-6ixth-Floor乐队
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有