您的当前位置:首页正文

基于CTC深度神经网络的文字分割和识别的方法[发明专利]

2021-08-18 来源:易榕旅网
专利内容由知识产权出版社提供

专利名称:基于CTC深度神经网络的文字分割和识别的方法专利类型:发明专利发明人:侯进,黄贤俊

申请号:CN202010294624.4申请日:20200415公开号:CN111507348A公开日:20200807

摘要:本发明提供了一种基于CTC深度神经网络的文字分割和识别的方法,包括如下步骤:a1.对输入图像利用CNN提取特征;a2.对a1提取的特征进行CELL切分,CELL的高宽固定,个数由图像长度确定;a3.对确定好的特征每个CELL直接分割分类,输出分割信号;a4.利用CTCLOSS计算真实分割信号与模型输出的分割信号之间的损失,损失情况反馈并训练整个模型;a5.利用a3输出的分割信号对文本进行分割,并对单个字符进行CNN+softmax分类识别,真实分割信号由标注文本映射而来,CTCLOSS可自动解决文本对齐问题。本发明提升了OCR识别的速度,且切成单个字符后其识别优化具有针对性,使得最终精度提高;对识别框架进行改进,将识别过程分离为字符分割、单字符识别,使得优化可以分开的、具有针对性的进行。

申请人:深源恒际科技有限公司

地址:100085 北京市海淀区清河西三旗东路6幢2层203室

国籍:CN

代理机构:北京智沃律师事务所

代理人:吴志宏

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容