计算机科学与探索 ›› 2019, Vol. 13 ›› Issue (7): 1114-1122.DOI: 10.3778/j.issn.1673-9418.1806023
李幸幸,刘华锋,景丽萍+
LI Xingxing, LIU Huafeng, JING Liping+
摘要: 随着推荐系统的发展,矩阵近似算法成为研究热点,而以概率矩阵分解为代表的低秩矩阵近似模型因其具有较高的推荐精度而广受关注。但是,随着大数据时代的到来,评分矩阵越来越复杂,简单的单个矩阵近似模型会使一些隐藏在数据中的信息被忽视。为了解决这个问题,提出了一种基于boosting框架的混合秩矩阵近似算法(mixture rank matrix factorization,MRMF)。该算法基于boosting框架融合多个不同秩矩阵获取丰富的评分信息。具体方法为首先从整体结构出发,获取矩阵的整体信息,然后基于boosting求偏差获得残差矩阵,抓取局部的相关性。同时为了更好地学习局部特征,引入服从拉普拉斯先验分布的样本权重,构建自适应权重的概率矩阵模型(adaptive weight matrix factorization,AWMF)。在获取残差矩阵之后,通过EM算法学习残差矩阵的权重,避免模型过拟合以及减少人工调差的复杂度。实验结果验证,所提出的算法在四个真实数据集(Ciao、Epinions、Douban、Movielens(10M))上均具有较好的推荐精度。