计算机科学与探索 ›› 2012, Vol. 6 ›› Issue (2): 183-192.DOI: 10.3778/j.issn.1673-9418.2012.02.010
• 学术研究 • 上一篇
徐 昇, 业 宁, 徐姗姗
XU Sheng, YE Ning, XU Shanshan
摘要: 通常对径向基(radial basis function, RBF)神经网络的改进大多是注重隐藏节点选取、大规模数据学习速率和函数组织形式, 忽视了初始输入样本自身间的结构信息。研究发现, 输入样本的不同属性对分类能力影响的程度也不同, 即每个属性应该有自己的分类权重。在对样本归一化预处理后, 研究了不同属性在分类时的贡献因子, 提出了新的算法模型CFRBF (contribution factors RBF), 用贡献因子来描述样本各个属性的重要性。选用了蛋白质二级预测问题来验证模型, 传统的二级预测是将样本直接输入网络, 仅仅依靠海明距离来分类, 丢失大量信息。针对设计的新模型, 使用了一种新的组织形式来解决预测问题。实验证明, 采用新的组织形式后网络性能明显提高, 而用CFRBF算法后其精度再次提高。同时通过贡献因子可以揭示看似无规律的蛋白质序列之间氨基酸构态影响关系, 而且还能给出样本不同属性的分类重要性。