基于向量余弦的支持向量机主动学习策略

doi:10.3778/j.issn.1673-9418.1403056

计算机科学与探索 ›› 2014, Vol. 8 ›› Issue (7): 868-876.DOI: 10.3778/j.issn.1673-9418.1403056

基于向量余弦的支持向量机主动学习策略

郭虎升1，王文剑1,2+，白龙飞1

1. 山西大学计算机与信息技术学院，太原 030006
2. 山西大学计算智能与中文信息处理教育部重点实验室，太原 030006

出版日期:2014-07-01 发布日期:2014-07-02

Support Vector Machine Active Learning Strategy Based on Vector Cosine

GUO Husheng1, WANG Wenjian1,2+, BAI Longfei1

1. School of Computer and Information Technology, Shanxi University, Taiyuan 030006, China
2. Key Laboratory of Computational Intelligence and Chinese Information Processing, Shanxi University, Taiyuan 030006, China

Online:2014-07-01 Published:2014-07-02

摘要/Abstract

摘要： 针对传统基于主动学习的支持向量机（support vector machine，SVM）方法中所采用的欧式距离不能有效衡量高维样本之间的相关程度，导致学习器泛化能力下降的问题，提出了一种基于向量余弦的支持向量机主动学习（SVM active learning based on vector cosine）策略，称为COS_SVMactive方法。该方法通过在主动学习过程中引入向量余弦来度量训练集中样本信息的冗余度，以挑选那些含有重要分类信息的最有价值样本交给专家进行人工标注，并在迭代的样本标注过程中对训练集的平衡度进行逐步调整，使学习器获得更好的泛化性能。实验结果表明，与传统基于随机采样的SVM主动学习方法（SVM active learning based on random sampling，RS_SVMactive）和基于距离的SVM主动学习方法（SVM active learning based on distance，DIS_SVMactive）相比，COS_SVMactive方法不仅可以提高分类精度，而且能够减少专家标记代价。

关键词: 支持向量机, 主动学习, 向量余弦, 冗余度, 平衡度

Abstract: This paper proposes a support vector machine (SVM) active learning strategy based on vector cosine for the high dimensional dataset to solve the problem that the traditional support vector machine based on active learning can not measure the correlation degree of different samples by Euclidean distance and obtains the low generalization ability, namely COS_SVMactive method. By measuring the information redundancy of training samples based on vector cosine on active learning procedure, several the most valuable samples are selected and need be labeled by experts. In each samples labeling loop, the balance of labeled data is gradually adjusted in order to achieve good generalization performance. The experimental results demonstrate that, compared with common SVM active learning based on random sampling (RS_SVMactive) and SVM active learning based on distance (DIS_SVMactive) methods, the proposed COS_SVMactive method can not only improve classification accuracy, but also reduce the artificial labeling cost.

Key words: support vector machine, active learning, vector cosine, redundancy, balance

郭虎升，王文剑，白龙飞. 基于向量余弦的支持向量机主动学习策略[J]. 计算机科学与探索, 2014, 8(7): 868-876.

GUO Husheng, WANG Wenjian, BAI Longfei. Support Vector Machine Active Learning Strategy Based on Vector Cosine[J]. Journal of Frontiers of Computer Science and Technology, 2014, 8(7): 868-876.

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	41

	来源	本网站

	次数	41
	比例	100%

摘要

276

最新录用	在线预览	正式出版

0	0	276

	来源	本网站

	次数	276
	比例	100%

[1]	沈浩，王士同. 基于多核学习的风格正则化最小二乘支持向量机[J]. 计算机科学与探索, 2020, 14(9): 1532-1544.
[2]	林浩，李雷孝，王慧. 支持向量机在智能交通系统中的研究应用综述[J]. 计算机科学与探索, 2020, 14(6): 901-917.
[3]	陈钦况，陈珂，伍赛，寿黎但，陈刚. 关于主动学习下的知识图谱补全研究[J]. 计算机科学与探索, 2020, 14(5): 769-782.
[4]	史娜，薛晖，汪云云. 两阶段不定核支持向量机[J]. 计算机科学与探索, 2020, 14(4): 598-605.
[5]	周广悦，李克文，刘文英，苏兆鑫. 灰狼优化的混合参数多分类孪生支持向量机[J]. 计算机科学与探索, 2020, 14(4): 628-636.
[6]	付康安，王文剑，郭虎升. 空间相关性分析的符号数据分类方法[J]. 计算机科学与探索, 2019, 13(7): 1165-1173.
[7]	何丽，韩克平，刘颖. 自适应的SVM增量算法[J]. 计算机科学与探索, 2019, 13(4): 647-656.
[8]	王丽娟，丁世飞. 一种粒子群优化的SVM-ELM模型[J]. 计算机科学与探索, 2019, 13(4): 657-665.
[9]	吴艺凡，梁吉业，王俊红. 基于混合采样的非平衡数据分类算法[J]. 计算机科学与探索, 2019, 13(2): 342-349.
[10]	胡良田，潘海为，谢晓芹，张志强，冯晓宁. 基于NSCT的乳腺图像分类方法[J]. 计算机科学与探索, 2018, 12(4): 618-628.
[11]	彭清，季桂树，谢林江，张少波. 卷积神经网络在车辆识别中的应用[J]. 计算机科学与探索, 2018, 12(2): 282-291.
[12]	陆凯，姜淑娟，王兴亚. 结合图挖掘和支持向量机的错误定位[J]. 计算机科学与探索, 2018, 12(10): 1614-1621.
[13]	赵国荣，王文剑. 融合多结构信息的中文句法分析方法[J]. 计算机科学与探索, 2017, 11(7): 1114-1121.
[14]	张燕，杜红乐. 结合动态代价和协同标注的网络异常检测[J]. 计算机科学与探索, 2017, 11(11): 1775-1782.
[15]	鲁淑霞，周谧，金钊. 非均衡加权随机梯度下降SVM在线算法[J]. 计算机科学与探索, 2017, 11(10): 1662-1671.

基于向量余弦的支持向量机主动学习策略

Support Vector Machine Active Learning Strategy Based on Vector Cosine

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐 0

Metrics