文字認識エンジンBy Deep Learning

優れた2値化の技術を活かし、言語を抽出

文字認識エンジンでできること

画像内のテキストをAIで認識・抽出するサービスを提供しています。画像に含まれる文字、単語、記号、ロゴマークなどを最新のディープラーニングOCR技術を用いて検出・二値化処理し、テキストデータとして出力します。画像から抽出したテキストの意味やコンテキストを理解する独自の自然言語処理エンジンを搭載しているため、単なるテキストデータにとどまらず、その背景にある意味まで抽出することが可能です。画像認識と自然言語処理の技術を組み合わせたサービスにより、画像内のテキストをより深く理解し、様々なビジネスシーンでの利活用を実現します。

２値化

背景のある画像から文字、文字列、記号、マーク、ロゴを２値化して、DeepLearning でそれらを判定することができます。

意味を抽出する

特に文字列においては、自然言語処理を用いて、誤認識、欠落文字の補完を行い、また文書としての評価を行ない、その意味を抽出することもできます。

文字列生成までの処理の流れ

１）原画を取りこむ

ビデオ
雑誌
看板
ポスター

2）文字認識

・文字領域の判定
・２値化処理
・ノイズ除去
・機械学習

3）文字列生成

・文字抽出
・文字結合
・文書生成
・意味抽出

2値化が実際にどのように行われるか

原画像と２値化画像（例1）

原画像

２値化画像

原画像と２値化画像（例2）

原画像

２値化画像

原画像と２値化画像（例3）

原画像

２値化画像

原画像と２値化画像（例4）

原画像

２値化画像

原画像と２値化画像（例5）

原画像

２値化画像

原画像と２値化画像（例6）

原画像

２値化画像

原画像と２値化画像（例7）

原画像

２値化画像