基于权值相似性的神经网络剪枝

doi:10.3778/j.issn.1673-9418.1710016

计算机科学与探索 ›› 2018, Vol. 12 ›› Issue (8): 1278-1285.DOI: 10.3778/j.issn.1673-9418.1710016

基于权值相似性的神经网络剪枝

黄聪1，常滔1，谭虎2，吕绍和1，王晓东1+

1. 国防科技大学并行与分布处理重点实验室，长沙 410073

2. 武警新疆总队，乌鲁木齐 830063

出版日期:2018-08-01 发布日期:2018-08-09

Neural Network Pruning Based on Weight Similarity

HUANG Cong1, CHANG Tao1, TAN Hu2, LV Shaohe1, WANG Xiaodong1+

1. China National Laboratory for Parallel and Distributed Processing, National University of Defense Technology, Changsha 410073, China
2. Xinjiang Armed Police Corps, Urumqi 830063, China

Online:2018-08-01 Published:2018-08-09

摘要/Abstract

摘要： 随着深度学习的发展，深度神经网络结构变得越来越复杂，模型深度、大小、计算量以及模型运行时的内存开销、显存开销都随之快速上升，这使得深度网络难以应用到硬件资源不足且实时性要求高的移动终端或是嵌入式设备上（如自动驾驶汽车）。神经网络的轻型化是其未来发展的方向，网络压缩已经成为当下研究的热点。对神经网络权值更新传播方式进行深入研究，提出一种简单且易于理解的网络压缩方法。针对卷积层，采用一种基于可分卷积的卷积层加速方法，能够有效减少卷积层（包含pooling）的计算量，并在5层网络中实验测评性能；针对全连接层，应用基于权值相似的剪枝方法。在标准mnist数据集和cifar10数据集上，能够剪除90%以上的全连接层单元，而模型分类准确率没有明显下降。

关键词: 深度学习, 神经网络, 网络压缩, 模型加速, 剪枝

Abstract: With the development of deep learning, the structure of deep neural network is becoming more and more complicated, which makes the depth, size and computation increase, as well as memory cost and GPU cost, so it is difficult to apply the model to mobile terminal and embedded devices like auto-driving which have limited resources and high real-time request. Lightening network is the future, building small and efficient neural network has been a hot spot. By studying the propagation mode of weight update of neural network, this paper proposes a simple but useful way to compress the net. For the convolution net, this paper applies the separable convolution to speed the process and evaluate it at a standard 5 layer network. As for full-connect layer, this paper uses a pruning method based on weight similarity, which can prune more than 90% full connect layer units without obviously accuracy decline on mnist dataset and cifar10 dataset.

Key words: deep learning, neural network, net compression, model accelerate, units pruning

黄聪，常滔，谭虎，吕绍和，王晓东. 基于权值相似性的神经网络剪枝[J]. 计算机科学与探索, 2018, 12(8): 1278-1285.

HUANG Cong, CHANG Tao, TAN Hu, LV Shaohe, WANG Xiaodong. Neural Network Pruning Based on Weight Similarity[J]. Journal of Frontiers of Computer Science and Technology, 2018, 12(8): 1278-1285.

208

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	208

来源	本网站	其他网站

次数	196	12
比例	94%	6%

摘要

199

最新录用	在线预览	正式出版

0	0	199

	来源	本网站

	次数	199
	比例	100%

[1]	王迪聪，白晨帅，邬开俊. 基于深度学习的视频目标检测综述[J]. 计算机科学与探索, 2021, 15(9): 1563-1577.
[2]	张晓旭，马志强，刘志强，朱方圆，王春喻. Transformer在语音识别任务中的研究现状与展望[J]. 计算机科学与探索, 2021, 15(9): 1578-1594.
[3]	郁龚健，张鲁飞，李佩琦，华夏，刘家航，柴志雷，陈闻杰. SWAM：SNN工作负载自动映射器[J]. 计算机科学与探索, 2021, 15(9): 1641-1657.
[4]	陈璠，彭力. 多层级重叠条纹特征融合的行人重识别[J]. 计算机科学与探索, 2021, 15(9): 1753-1761.
[5]	任龙杰，孙颖，丁卫平，鞠恒荣，曹金鑫. 基于单种群蛙跳优化CNN的眼底图像多病变检测[J]. 计算机科学与探索, 2021, 15(9): 1762-1772.
[6]	陈德光，马金林，马自萍，周洁. 自然语言处理预训练技术综述[J]. 计算机科学与探索, 2021, 15(8): 1359-1389.
[7]	刘利平，乔乐乐，蒋柳成. 图像去噪方法概述[J]. 计算机科学与探索, 2021, 15(8): 1418-1431.
[8]	武家伟，孙艳春. 融合知识图谱和深度学习方法的问诊推荐系统[J]. 计算机科学与探索, 2021, 15(8): 1432-1440.
[9]	武晓栋，刘敬浩，金杰，毛思平. 基于DT及PCA的DNN入侵检测模型[J]. 计算机科学与探索, 2021, 15(8): 1450-1458.
[10]	马煜，杜慧敏，毛智礼，张霞. 深度语义分割人群密度检测技术[J]. 计算机科学与探索, 2021, 15(8): 1469-1475.
[11]	荣欢，马廷淮. 利用收益预测与策略梯度两阶段众包评论集成[J]. 计算机科学与探索, 2021, 15(8): 1476-1489.
[12]	张梦倩，张莉. 粗-细两阶段卷积神经网络算法[J]. 计算机科学与探索, 2021, 15(8): 1501-1510.
[13]	马玉琨，徐姚文，赵欣，徐涛，王泽瑞. 人脸识别系统的活体检测综述[J]. 计算机科学与探索, 2021, 15(7): 1195-1206.
[14]	葛轶洲，许翔，杨锁荣，周青，申富饶. 序列数据的数据增强方法综述[J]. 计算机科学与探索, 2021, 15(7): 1207-1219.
[15]	方钧婷，谭晓阳. 注意力级联网络的金属表面缺陷检测算法[J]. 计算机科学与探索, 2021, 15(7): 1245-1254.

基于权值相似性的神经网络剪枝

Neural Network Pruning Based on Weight Similarity

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐 0

Metrics