计算机科学与探索 ›› 2018, Vol. 12 ›› Issue (7): 1136-1144.DOI: 10.3778/j.issn.1673-9418.1705029
路子祥,黄嘉爽,屠黎阳,徐西嘉,张道强
LU Zixiang, HUANG Jiashuang, TU Liyang, XU Xijia, ZHANG Daoqiang
摘要:
常用的回归算法,如LASSO(least absolute shrinkage and selection operator)算法,是对数据向量化后进行分析处理。然而,数据向量化将破坏数据的原始结构和内在相关性,并且忽略数据的高阶依赖性。与此同时,数据向量化会导致数据维数过高,计算复杂和存储困难。因此,提出了一种基于张量的正则化多线性回归算法(multilinear LASSO,mLASSO)。该算法是LASSO算法在张量空间的一个扩展,首先使用加权向量对张量做模乘运算,将张量空间变换到向量空间;然后在该空间上使用LASSO算法对目标值进行回归分析,得到该方向上的加权向量,采用交替迭代算法依次优化各个方向的加权向量;最后,使用各个方向的最优加权向量和张量数据做模乘运算得到预测变量值。算法主要包含以下两个优点:(1)充分利用了数据的结构信息;(2)该算法使用的LASSO算法嵌入了特征选择功能,提高了模型的泛化能力。实验结果表明该方法在多线性数据上表现出了良好的性能。