计算机科学与探索 ›› 2018, Vol. 12 ›› Issue (8): 1323-1330.DOI: 10.3778/j.issn.1673-9418.1705085
董引娣1+,赵晓祎2
DONG Yindi1+, ZHAO Xiaoyi2
摘要: 为提高场景文本识别算法的计算效率和精度,提出基于文本线局部极值区域两阶段场景文本序列识别方法。首先,利用特征计算对每个构建的极值区域字符进行概率计算,并选取局部最大概率特征作为第一阶段的输出和第二阶段的输入。其次,利用高效的聚类算法将极值区域字符进行文本线处理,利用字符区域的标签以及OCR分类器进行字体合成,在上下文中的每个字符的文本线已知的情况下,可实现最有可能字符序列的快速选取。最后,通过在USTB-SV1K数据库对多方向文本的仿真测试,验证了算法在计算效率和计算精度上的优势。