9月21日,太平金科第八項發明“單據識別方法、裝置、計算機設備和存儲介質”獲國家知識產權局專利授權,專利號:ZL202010399997.8。
傳統OCR技術對有干擾的圖像識別準確率不高,識別速度較慢,生僻字識別能力弱,在辦公自動化應用中,仍需安排人工對識別結果進行校對,導致其應用領域和使用場景受到明顯限制。
針對以上問題,專利提出了解決方案:使用最先進的殘差模型,在解決構造深層網絡時梯度消失和梯度爆炸問題的基礎上,完成了53層卷積殘差神經網絡構造,提升了特征提取能力和識別速度;使用CNN加雙向的LSTM神經網絡,提取正向時刻和反向時刻的文本和圖像特征,提高了文本識別準確度,同時在訓練文字中增加生僻字,強化了整體識別能力;增加輸出結果過濾模塊,運用自然語言技術對特殊字段進行模板匹配,提高了輸出結果準確度。






公司新聞
