计算机科学与探索 ›› 2014, Vol. 8 ›› Issue (11): 1381-1390.DOI: 10.3778/j.issn.1673-9418.1406016
张远健1,徐健锋1+,涂 敏2,黄学坚1,刘 清3
ZHANG Yuanjian1, XU Jianfeng1+, TU Min2, HUANG Xuejian1, LIU Qing3
摘要: ICU病人生死预测一直都是医学界的研究热点和难点。数据挖掘的机器学习方法近年来在该领域取得了一定的进展,但依然有很大的发展空间。针对ICU时序数据的高维度和不确定间隔采样特性,提出了不确定间隔采样转化为确定间隔的空采样的思想和相应的处理策略;在此基础上将传统的时间序列聚类与机器学习方法相结合,提出了一个两阶段的混合多机器学习算法框架,使得数据集的高维和不确定性得到了约简,从而可以采用经典的机器学习方法挖掘病人生死知识。在一个公开数据集上的两组实验结果表明,基于该算法框架的ICU病人死亡预测方法对于少数样本的分类效果优于传统方法,弹性时间间隔下的预测效果更好,最优时间间隔的选取可以通过实验效果来验证。