计算机科学与探索 ›› 2007, Vol. 1 ›› Issue (3): 282-292.
乔少杰1,2,唐常杰1+,陈 瑜1,彭 京3,温粉莲1
QIAO Shaojie1,2,TANG Changjie1+,CHEN Yu1,PENG Jing3,WEN Fenlian1
摘要: 为了识别犯罪嫌疑人伪造和篡改的虚假身份,利用树编辑距离计算个体属性相似性,证明了树编辑距离的相关数学性质,对属性应用层次编码方法,提出了一种新的基于树编辑距离的层次聚类算法HCTED(Hierarchical Clustering Algorithm Based on Tree Edit Distance)。新算法通过树编辑操作使用最少的代价计算属性相似性,克服了传统聚类算法标称型计算的缺陷,提高了聚类精度,通过设定阈值对给定样本聚类。实验证明了新方法在身份识别上的准确性和有效性,讨论了不同参数对实验结果的影响,对比传统聚类算法,HCTED算法性能明显提高。新算法已经应用到警用流动人口分析中,取得了良好效果。