本发明公开了一种基于FasterR?CNN的图像中文本检测方法,首先获取多幅已经标注文本框的图像对FasterR?CNN模型进行训练;当需要进行文本检测的图像时,采用训练后的FasterR?CNN模型粗定位出图像中的文本框;然后通过颜色相似度算法对图像中粗定位的文本框进行扩展;再者将重叠的文本框进行合并;最后提取出上述处理得到的各文本框的HOG特征、LBP特征和CNN特征,并且输入到训练后的随机森林模型中,通过训练后的随机森林模型进行验证,根据验证结果获取到图像中最终的文本框;本发明方法可以克服复杂背景下文本定位效果不甚理想的问题,提高了文本定位的准确率和召回率。
咨询热线:020-38033421
传真号码:020-38061201
电子邮箱:jm@jiaquanip.cn
Copyright © 嘉权专利商标事务所 All Rights Reserved. 粤ICP备2023151901号