热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

天池大数据竞赛第一名,上海交通大学人工智能实验室如何用AI定位肺结节

癌症,犹如黑暗中的魔鬼,带给人们恐惧与绝望。而肺癌,在我国作为发病率、死亡率最高的一类癌症,伤害着无数家庭。在我国每年都有近60万人死于肺癌。然而,癌症的死亡率与首次发现癌症的



癌症,犹如黑暗中的魔鬼,带给人们恐惧与绝望。而肺癌,在我国作为发病率、死亡率最高的一类癌症,伤害着无数家庭。在我国每年都有近60万人死于肺癌。然而,癌症的死亡率与首次发现癌症的时期紧密相关,早期肺结节筛查可以为无数人免去痛苦与折磨。上海交通大学人工智能实验室徐奕教授、倪冰冰教授、杨小康教授、朱禹萌同学等人与点内科技合作,利用深度学习搭建的肺结节自动定位筛查系统,能够有效检测肺CT影像中包含微小结节、磨玻璃等各类结节,并降低假阳性误诊的发生,实现“早发现,早诊断,早治疗,早痊愈”的愿望。该算法获得了天池大数据比赛的第一名,这个比赛吸引了全国两千多支参赛团队,总奖池高达百万,面向全社会各大医院、高校、公司、研究所参加。


团队利用计算机视觉领域卷积神经网络技术来解决肺结节检测问题,并在多个层面上进行创新。1)结合物体检测与分割算法提取候选结节,产生高召回率候选结节池。2)使用假阳性衰减网络,并采取多尺度集成学习的网络模型提高检测精度,衰减假阳性比例。3)在数据的处理上,采取生成对抗网络进行了数据增广,提高了训练的有效性。



算法框架如图

数据预处理


通过旋转平移等几何变换针对有限数量的正样本做数据多样性增广,类似于医生通过不同的视角、不同的上下文去分析结节区域,并利用生成对抗网络(GAN),从随机噪声中产生新的结节正样本,学习生成新形态的结节样本,深度增广数据的多样性,提升模型泛化能力。

 

结节预检测


建立3D-Unet网络结构,该分割网络主要功能是提取疑似候选结节,最大化敏感度,降低漏检率。 其网络输入三个维度的数据特征,可从多个Z轴维度”观察“,正如医生结合多个平面观察结节,从而充分学习肺内部正常纹理和非正常纹理的区别,捕捉到结节多样性特征,比如毛玻璃结节密度比周围略高、呈云雾状性,纯实性结节实性密度较高,类似单独分离的蛋黄等。


结节精检测


结节精检测采用三种模型分别预测候选结节概率,并根据模型间权重比例给出最终概率的方法。主要优势在于,负样本经历由易至难的学习过程,分割网络和后续假阳性衰减网络相辅相成。多结构类型的模型Ensemble,且单一网络性能良好,类似于多个医生独立阅片的过程,综合给出阅片结果。



结果


这一算法在阿里云与英特尔联合举办的天池医疗AI大赛中大获全胜,以0.732的成绩从两千多组强劲队伍中脱颖而出,在比赛最为重要的复赛赛程中排名第一。


根据算法训练出的模型能够更好地处理不同形态的结节特征,达到很好的检测效果,在400例小结节测试数据上,FROC曲线如图所示:




值得注意的是,该算法诊断20万张肺结节片需要10分钟,远远少于医生人工诊断的时间,在提升准确率的同时,节约了医生的时间,真正在诊断流程上做好了医生的助手。团队也将算法真正投入到上海各大医院进行试验与使用,嵌入医生诊断流程当中,真正造福患者。


推荐阅读
  • 强人工智能时代,区块链的角色与前景
    随着强人工智能的崛起,区块链技术在新的技术生态中扮演着怎样的角色?本文探讨了区块链与强人工智能之间的互补关系及其在未来技术发展中的重要性。 ... [详细]
  • 2017年人工智能领域的十大里程碑事件回顾
    随着2018年的临近,我们一同回顾过去一年中人工智能领域的重要进展。这一年,无论是政策层面的支持,还是技术上的突破,都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 探索电路与系统的起源与发展
    本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
  • 机器学习核心概念与技术
    本文系统梳理了机器学习的关键知识点,涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容,并深入探讨了各算法的原理和应用场景。 ... [详细]
  • 随着5G、云计算、人工智能、大数据等新技术的广泛应用,人们的生活生产方式发生了深刻变化。从人际互联到万物互联,数据存储与处理需求激增,推动了数据与算力设施的发展。 ... [详细]
  • 吴恩达推出TensorFlow实践课程,Python基础即可入门,四个月掌握核心技能
    量子位报道,deeplearning.ai最新发布了TensorFlow实践课程,适合希望使用TensorFlow开发AI应用的学习者。该课程涵盖机器学习模型构建、图像识别、自然语言处理及时间序列预测等多个方面。 ... [详细]
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • 卷积神经网络(CNN)基础理论与架构解析
    本文介绍了卷积神经网络(CNN)的基本概念、常见结构及其各层的功能。重点讨论了LeNet-5、AlexNet、ZFNet、VGGNet和ResNet等经典模型,并详细解释了输入层、卷积层、激活层、池化层和全连接层的工作原理及优化方法。 ... [详细]
  • 尽管深度学习带来了广泛的应用前景,其训练通常需要强大的计算资源。然而,并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下(如ARM CPU)高效运行深度神经网络,特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]
  • 智能投顾机器人:创业者如何应对新挑战?
    随着智能投顾技术在二级市场的兴起,针对一级市场的智能投顾也逐渐崭露头角。近日,一款名为阿尔妮塔的人工智能创投机器人正式发布,它将如何改变投资人的工作方式和创业者的融资策略? ... [详细]
  • 江苏启动鲲鹏生态产业园首批应用孵化项目
    2019年9月19日,在华为全联接大会上,江苏鲲鹏生态产业园正式启动了首批鲲鹏应用孵化项目。南京市委常委、江北新区党工委专职副书记罗群等多位嘉宾出席并见证了这一重要时刻。 ... [详细]
  • 本文档旨在帮助开发者回顾游戏开发中的人工智能技术,涵盖移动算法、群聚行为、路径规划、脚本AI、有限状态机、模糊逻辑、规则式AI、概率论与贝叶斯技术、神经网络及遗传算法等内容。 ... [详细]
  • 本文探讨了亚马逊Go如何通过技术创新推动零售业的发展,以及面临的市场和隐私挑战。同时,介绍了亚马逊最新的‘刷手支付’技术及其潜在影响。 ... [详细]
  • 浪潮AI服务器NF5488A5在MLPerf基准测试中刷新多项纪录
    近日,国际权威AI基准测试平台MLPerf发布了最新的推理测试结果,浪潮AI服务器NF5488A5在此次测试中创造了18项性能纪录,显著提升了数据中心AI推理性能。 ... [详细]
author-avatar
到处旅游增加阅历入
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有