热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

文献阅读2019MachineLearning‐AssistedSystemforThyroidNoduleDiagnosis

文献阅读2019-MachineLearning‐AssistedSystemforThyroidNoduleDiagnosis方法:在9种常用算法的基础上

文献阅读2019-Machine Learning‐Assisted System for Thyroid Nodule Diagnosis

方法:在9种常用算法的基础上,随机抽取60%的样本建立模型,并使用剩余40%的案例进行验证。所有的模型都有一个验证数据集,该数据集在测试前的恶性概率为10%。这些模型通过包含1000次衍生化和验证的机器学习进行了改进,并与经验丰富的放射科医生的诊断进行了比较。计算敏感性、特异性、准确度和曲线下面积(AUC)。

结果:随机森林算法产生了最佳诊断模型,该模型优于仅基于传统美国的放射学家诊断[AUC 0.924(95%置信区间[CI] 0.895‐0.953)vs. 0.834 (95%CI: 0.815‐0.853)],也优于基于传统美国和RTE的放射学家诊断[AUC: 0.938 (95%CI: 0.914‐0.961)vs. 0.843 (95%CI: 0.829‐0.857)]。
具体介绍:在这里插入图片描述

机器学习训练:

对于每个结节,常规US中收集了11个特征,RTE中收集了1个特征。数据集1包含了11种特征,数据集2包含了11种特征加上1个RTE特征。这两个数据集被输入9种机器学习算法:l2‐logistic回归、线性判别分析、随机森林、核–支持向量机、自适应增强、k‐NN、神经网络、朴素贝叶斯和卷积神经网络。使用每一种算法,在以训练测试集3:2的比例随机分割整个2064个样本 后分析数据1000次。注意,所有上述方法的性能依赖于调整参数的选择。这些方法通过使用训练集的10倍交叉验证进行训练,并通过使用验证集进行评估。例如,k‐SVM中的调整参数是通过网格搜索进行10次交叉验证来确定的,其中网格设置为{0.1+0.1s: s = 0,…, 20}。对于RF方法,我们使用R包中的’ tuneRF '函数“随机森林”,树的数量为500,并在每次分割时调整随机抽样作为候选变量的数量。对于k‐NN方法,我们使用R包“插入”中的“训练控制”功能,通过10个交叉验证选择最佳的k,以此类推。

机器学习验证和基准测试:

九种机器学习算法的功能与验证数据集,其预测试的恶性概率为10%。使用固定随机数种子生成此验证的数据子集(模型VS医生)

结果:
数据分析中包括年龄为45.25±13.49岁(范围9‐86)的2032名患者(695名男性)共2064个结节(图2)。在2064个结节中,病理发现恶性750个(36.3%),良性1314个(63.7%)。表1总结了这些结节在常规美国和RTE中的特征。

机器学习模型的选择:

在这里插入图片描述
在这里插入图片描述
因此,随机森林算法被选择为最好的,并与经验丰富的放射科医生的诊断进行比较。

影响随机森林算法诊断性能的因素:
每个输入特征对随机森林模型诊断性能的相对重要性
在这里插入图片描述
随机森林分类器的性能与经验丰富的放射科医生的诊断的比较
在这里插入图片描述


推荐阅读
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • Coursera ML 机器学习
    2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]
  • 机器学习核心概念与技术
    本文系统梳理了机器学习的关键知识点,涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容,并深入探讨了各算法的原理和应用场景。 ... [详细]
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • Python 工具推荐 | PyHubWeekly 第二十一期:提升命令行体验的五大工具
    本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具,涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]
  • LambdaMART算法详解
    本文详细介绍了LambdaMART算法的背景、原理及其在信息检索中的应用。首先回顾了LambdaMART的发展历程,包括其前身RankNet和LambdaRank,然后深入探讨了LambdaMART如何结合梯度提升决策树(GBDT)和LambdaRank来优化排序问题。 ... [详细]
  •   上一篇博客中我们说到线性回归和逻辑回归之间隐隐约约好像有什么关系,到底是什么关系呢?我们就来探讨一下吧。(这一篇数学推导占了大多数,可能看起来会略有枯燥,但这本身就是一个把之前算法 ... [详细]
  • 探索如何使用公共数据集为您的编程项目提供动力。无论您是编程新手还是有经验的开发者,本文将为您提供实用建议和资源,帮助您启动并运行一个创新的数据驱动型项目。 ... [详细]
  • 智能车间调度研究进展
    本文综述了基于强化学习的智能车间调度策略,探讨了车间调度问题在资源有限条件下的优化方法。通过数学规划、智能算法和强化学习等手段,解决了作业车间、流水车间和加工车间中的静态与动态调度挑战。重点讨论了不同场景下的求解方法及其应用前景。 ... [详细]
  • Python中HOG图像特征提取与应用
    本文介绍如何在Python中使用HOG(Histogram of Oriented Gradients)算法进行图像特征提取,探讨其在目标检测中的应用,并详细解释实现步骤。 ... [详细]
  • 在互联网信息爆炸的时代,当用户需求模糊或难以通过精确查询表达时,推荐系统成为解决信息过载的有效手段。美团作为国内领先的O2O平台,通过深入分析用户行为,运用先进的机器学习技术优化推荐算法,提升用户体验。 ... [详细]
  • 支持向量机(SVM)是一种基于统计学习理论的模型,主要在VC维和结构风险最小化的理论基础上发展而来。本文将探讨几种不同的SVM方法及其优化策略,旨在提高模型的效率和适用性。 ... [详细]
  • 本文档旨在帮助开发者回顾游戏开发中的人工智能技术,涵盖移动算法、群聚行为、路径规划、脚本AI、有限状态机、模糊逻辑、规则式AI、概率论与贝叶斯技术、神经网络及遗传算法等内容。 ... [详细]
author-avatar
mobiledu2502910181
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有