过去,医疗行业的研究人员需要手动收集和分析大量数据来预测和治疗疾病。面对复杂的数据信息,相关的数据分析工作极具挑战性。随着人工智能的发展,医生在就诊时根据实验室检测结果、家族史、临床试验数据和其他生命统计数据获得实时分析报告将成为现实。本文以人工智能在重症医学中的应用为例,描述了如何利用DarwinML来辅助医疗行业的数据科学家进行自动建模。数据融合数据提取平台该平台帮助医学数据科学家将原始数据自动转换为模型可以使用的特征数据。该功能以数据流的形式实现,研究人员可以通过修改参数和拖动节点灵活改变特征提取过程。下图是一个数据流图。DarwinMLStudio自动建模平台从数据导入和清理开始。DarwinML可以自动建模并给出模型的多向评价结果。数据科学家只需要关注模型的评估结果。根据研究目标,研究者将返回调整初始数据清理方案和模型设置,多次建立模型,并选择满足研究需要的最终模型。DarwinML自动建模平台的整个过程如下:1)数据清理:平衡样本分布,填充缺失值,消除特征的异常值,数字化文本特征。2)模型设计:根据研究人员的数据特征和参数设置,在搜索空间中自动构建最优网络结构。网络结构将在平台中显示如下。3)超级参数调整:为最佳网络结构和数据特征提供匹配的最佳超级参数组合,如下图所示“超级参数”栏中的XGBClassifiler的学习速率和嵌套参数。4)模型训练:使用最优网络和超级参数的组合来实际训练模型。5)模型评价:给出了召回率、精度和AUC等基本指标值,从模型角度给出了重要栏目的分析结果,从样本角度给出了单个样本的重要特征分析。同时,DarwinML自动建模平台也支持只使用一些需要的功能。例如,我们可以导入一组新患者的检查数据,使用上次训练的模型,并且只评估模型,从而预测这组新患者的患病概率。病例:中严重感染综合征(也称为败血症)的预后研究根据其早期检查指标,我们使用DarwinML对重症监护病房(ICU)中的患者进行严重感染综合征(也称为败血症)的警告
面向医疗行业数据科学家的人工智能解决方案:自动建模平台
浏览:261 时间:2023-1-3