- 2021/01/21 掲載
東芝デジタルソリューションズ、AI OCR文字認識サービスの最新版V2.5の提供を開始
今回リリースするAI OCR V2.5では、2020年1月にリリースしたV2.0以降の学習手法や学習データの改良に加え、ディープラーニング技術の適用範囲を、文字認識から画像処理(罫線除去や取り消し線・訂正印判別)に拡大させるなどの技術進化を継続させることで、訂正印や画像劣化など幅広いバリエーションの帳票の読取にも対応しました。また、長年のOCR技術開発で培った誤読抑制技術を適用することで、申込書や申請用紙などで広く見られる1枠1文字の書式に対して、99.7%の認識精度を実現し、文字認識から訂正まで効率よく進めることができるようになりました。さらに、帳票識別機能に対してもAPIが利用できるようになり、従来から提供していた文字認識APIと組み合わせることで、アプリケーションやシステムの柔軟な構成が可能となり、業務効率化を実現します。
■AI OCR V2.5の主な特長
1.ディープラーニング技術の進化による読み取り精度向上
ディープラーニング学習手法の改良と多様な学習データの組み合わせを柱としたベース技術の進化はもちろん、文字認識技術と画像処理技術の融合・最適化を図り、さらに精度高い認識結果が得られるようになりました。その結果、取り消し線や訂正印の読み飛ばし、イメージスキャンの際の画像劣化に対応するなど、実際の運用で目にする帳票に対しても、対象となる文字列をより正確に読み取ることができるようになりました。また、住所や名前など複数行で記述される書き方にも対応し、一層効率よく、データ入力できるようになりました。
2.誤読抑制OCR技術
当社OCRスキャナ製品で実現していた誤読抑制OCR技術を採用しました。認識過程で誤読の可能性がある個所は「?」で結果を返し、「?」以外の部分の文字認識精度は99.7%を実現しました。このため、実運用において、認識結果の「?」部分だけを確認・訂正することが可能となり、さらなる効率的な作業を実現します。
3.API機能強化(帳票識別機能のAPI利用)
帳票の種類(申請書や届出書など)を自動で識別し仕分けを行う「帳票識別機能」を改良しました。従来は、多様な帳票が混在した状態から仕分けをすることなく文字認識を行いたい場合、別途専用のWeb画面で帳票識別設定を行った上で文字認識機能を利用する必要がありました。AI OCR V2.5では、帳票識別機能もAPIで利用できるので、アプリケーションやシステムの柔軟な構成が可能となり、業務効率化を実現します。
当社は、今後、文書管理やAI機能の拡充など、OCR部分だけにとどまらず製品強化を継続し、お客さまのDX化や課題解決を支援してまいります。
関連コンテンツ
PR
PR
PR