热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

文献阅读2019MachineLearning‐AssistedSystemforThyroidNoduleDiagnosis

文献阅读2019-MachineLearning‐AssistedSystemforThyroidNoduleDiagnosis方法:在9种常用算法的基础上

文献阅读2019-Machine Learning‐Assisted System for Thyroid Nodule Diagnosis

方法:在9种常用算法的基础上,随机抽取60%的样本建立模型,并使用剩余40%的案例进行验证。所有的模型都有一个验证数据集,该数据集在测试前的恶性概率为10%。这些模型通过包含1000次衍生化和验证的机器学习进行了改进,并与经验丰富的放射科医生的诊断进行了比较。计算敏感性、特异性、准确度和曲线下面积(AUC)。

结果:随机森林算法产生了最佳诊断模型,该模型优于仅基于传统美国的放射学家诊断[AUC 0.924(95%置信区间[CI] 0.895‐0.953)vs. 0.834 (95%CI: 0.815‐0.853)],也优于基于传统美国和RTE的放射学家诊断[AUC: 0.938 (95%CI: 0.914‐0.961)vs. 0.843 (95%CI: 0.829‐0.857)]。
具体介绍:在这里插入图片描述

机器学习训练:

对于每个结节,常规US中收集了11个特征,RTE中收集了1个特征。数据集1包含了11种特征,数据集2包含了11种特征加上1个RTE特征。这两个数据集被输入9种机器学习算法:l2‐logistic回归、线性判别分析、随机森林、核–支持向量机、自适应增强、k‐NN、神经网络、朴素贝叶斯和卷积神经网络。使用每一种算法,在以训练测试集3:2的比例随机分割整个2064个样本 后分析数据1000次。注意,所有上述方法的性能依赖于调整参数的选择。这些方法通过使用训练集的10倍交叉验证进行训练,并通过使用验证集进行评估。例如,k‐SVM中的调整参数是通过网格搜索进行10次交叉验证来确定的,其中网格设置为{0.1+0.1s: s = 0,…, 20}。对于RF方法,我们使用R包中的’ tuneRF '函数“随机森林”,树的数量为500,并在每次分割时调整随机抽样作为候选变量的数量。对于k‐NN方法,我们使用R包“插入”中的“训练控制”功能,通过10个交叉验证选择最佳的k,以此类推。

机器学习验证和基准测试:

九种机器学习算法的功能与验证数据集,其预测试的恶性概率为10%。使用固定随机数种子生成此验证的数据子集(模型VS医生)

结果:
数据分析中包括年龄为45.25±13.49岁(范围9‐86)的2032名患者(695名男性)共2064个结节(图2)。在2064个结节中,病理发现恶性750个(36.3%),良性1314个(63.7%)。表1总结了这些结节在常规美国和RTE中的特征。

机器学习模型的选择:

在这里插入图片描述
在这里插入图片描述
因此,随机森林算法被选择为最好的,并与经验丰富的放射科医生的诊断进行比较。

影响随机森林算法诊断性能的因素:
每个输入特征对随机森林模型诊断性能的相对重要性
在这里插入图片描述
随机森林分类器的性能与经验丰富的放射科医生的诊断的比较
在这里插入图片描述


推荐阅读
  • 支持向量机训练集多少个_25道题检测你对支持向量机算法的掌握程度
    介绍在我们学习机器算法的时候,可以将机器学习算法视为包含刀枪剑戟斧钺钩叉的一个军械库。你可以使用各种各样的兵器,但你要明白这些兵器是需要在合适的时间合理 ... [详细]
  • cs231n Lecture 3 线性分类笔记(一)
    内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注:中文翻译 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • 1.组合最优化问题定义:是通过数学方法的研究去寻找离散事件的最优编排、分组、次序或筛选等。描述:最优化问题的数学模型的一般描述是,x为决策 ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • 2017亚马逊人工智能奖公布:他们的AI有什么不同?
    事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器 ... [详细]
  • 程度|也就是_论文精读:Neural Architecture Search without Training
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了论文精读:NeuralArchitectureSearchwithoutTraining相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 干货 | 携程AI推理性能的自动化优化实践
    作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品,其中性能优化组为AI模型提供全方位的优化方案,提升推理性能降低成本࿰ ... [详细]
  • 「爆干7天7夜」入门AI人工智能学习路线一条龙,真的不能再透彻了
    前言应广大粉丝要求,今天迪迦来和大家讲解一下如何去入门人工智能,也算是迪迦对自己学习人工智能这么多年的一个总结吧,本条学习路线并不会那么 ... [详细]
  • 机器学习之数据均衡算法种类大全+Python代码一文详解
    目录前言一、为什么要做数据均衡?二、数据场景1.大数据分布不均衡2.小数据分布不均衡三、均衡算法类型1.过采样2.欠采样3.组合采样四、算法具体种类1 ... [详细]
author-avatar
mobiledu2502910181
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有