作者:mobiledu2502910181 | 来源:互联网 | 2023-08-01 16:36
文献阅读2019-Machine Learning‐Assisted System for Thyroid Nodule Diagnosis
方法:在9种常用算法的基础上,随机抽取60%的样本建立模型,并使用剩余40%的案例进行验证。所有的模型都有一个验证数据集,该数据集在测试前的恶性概率为10%。这些模型通过包含1000次衍生化和验证的机器学习进行了改进,并与经验丰富的放射科医生的诊断进行了比较。计算敏感性、特异性、准确度和曲线下面积(AUC)。
结果:随机森林算法产生了最佳诊断模型,该模型优于仅基于传统美国的放射学家诊断[AUC 0.924(95%置信区间[CI] 0.895‐0.953)vs. 0.834 (95%CI: 0.815‐0.853)],也优于基于传统美国和RTE的放射学家诊断[AUC: 0.938 (95%CI: 0.914‐0.961)vs. 0.843 (95%CI: 0.829‐0.857)]。
具体介绍:
机器学习训练:
对于每个结节,常规US中收集了11个特征,RTE中收集了1个特征。数据集1包含了11种特征,数据集2包含了11种特征加上1个RTE特征。这两个数据集被输入9种机器学习算法:l2‐logistic回归、线性判别分析、随机森林、核–支持向量机、自适应增强、k‐NN、神经网络、朴素贝叶斯和卷积神经网络。使用每一种算法,在以训练测试集3:2的比例随机分割整个2064个样本 后分析数据1000次。注意,所有上述方法的性能依赖于调整参数的选择。这些方法通过使用训练集的10倍交叉验证进行训练,并通过使用验证集进行评估。例如,k‐SVM中的调整参数是通过网格搜索进行10次交叉验证来确定的,其中网格设置为{0.1+0.1s: s = 0,…, 20}。对于RF方法,我们使用R包中的’ tuneRF '函数“随机森林”,树的数量为500,并在每次分割时调整随机抽样作为候选变量的数量。对于k‐NN方法,我们使用R包“插入”中的“训练控制”功能,通过10个交叉验证选择最佳的k,以此类推。
机器学习验证和基准测试:
九种机器学习算法的功能与验证数据集,其预测试的恶性概率为10%。使用固定随机数种子生成此验证的数据子集(模型VS医生)
结果:
数据分析中包括年龄为45.25±13.49岁(范围9‐86)的2032名患者(695名男性)共2064个结节(图2)。在2064个结节中,病理发现恶性750个(36.3%),良性1314个(63.7%)。表1总结了这些结节在常规美国和RTE中的特征。
机器学习模型的选择:
因此,随机森林算法被选择为最好的,并与经验丰富的放射科医生的诊断进行比较。
影响随机森林算法诊断性能的因素:
每个输入特征对随机森林模型诊断性能的相对重要性
随机森林分类器的性能与经验丰富的放射科医生的诊断的比较