专利名称:基于CTC深度神经网络的文字分割和识别的方法专利类型:发明专利发明人:侯进,黄贤俊
申请号:CN202010294624.4申请日:20200415公开号:CN111507348A公开日:20200807
摘要:本发明提供了一种基于CTC深度神经网络的文字分割和识别的方法,包括如下步骤:a1.对输入图像利用CNN提取特征;a2.对a1提取的特征进行CELL切分,CELL的高宽固定,个数由图像长度确定;a3.对确定好的特征每个CELL直接分割分类,输出分割信号;a4.利用CTCLOSS计算真实分割信号与模型输出的分割信号之间的损失,损失情况反馈并训练整个模型;a5.利用a3输出的分割信号对文本进行分割,并对单个字符进行CNN+softmax分类识别,真实分割信号由标注文本映射而来,CTCLOSS可自动解决文本对齐问题。本发明提升了OCR识别的速度,且切成单个字符后其识别优化具有针对性,使得最终精度提高;对识别框架进行改进,将识别过程分离为字符分割、单字符识别,使得优化可以分开的、具有针对性的进行。
申请人:深源恒际科技有限公司
地址:100085 北京市海淀区清河西三旗东路6幢2层203室
国籍:CN
代理机构:北京智沃律师事务所
代理人:吴志宏
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容