专利名称:一种基于注意力机制的文本识别方法专利类型:发明专利发明人:李宏伟,李蓉
申请号:CN201811355154.7申请日:20181114公开号:CN109543667A公开日:20190329
摘要:本发明公开了一种基于注意力机制的文本识别方法,基于空间注意力的网络SAN是一个端到端的文本识别模型,文本识别模型包括带有局部神经网络、残差神经网络和坐标信息的特征提取器以及基于注意力机制的空间解码器。文本识别模型基于编码解码结构,所以文本识别模型也可以理解为编码器和解码器。编码器是用于对输入的图像进行编码,得到解码器可以识别的编码特征序列。解码器用于解码编码器的编码特征,从而实现识别图像中的文本。针对于弧形文本CUTE80数据集,本方法的结果优于现有的所有方法,达到77.43%的准确率。在其他场景文本数据集中,本方法也得到了很好的效果。
申请人:北京工业大学
地址:100124 北京市朝阳区平乐园100号
国籍:CN
代理机构:北京思海天达知识产权代理有限公司
代理人:沈波
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容