Close

文字認識エンジンでできること

2値化

背景のある画像から文字、文字列、記号、マーク、ロゴを2値化して、DeepLearning でそれらを判定することができます。

意味を抽出する

特に文字列においては、自然言語処理を用いて、誤認識、欠落文字の補完を行い、また文書としての評価を行ない、その意味を抽出することもできます。

文字認識エンジン構成図

文字列生成までの処理の流れ

1)原画を取りこむ

ビデオ
雑誌
看板
ポスター

2)文字認識

・文字領域の判定
・2値化処理
・ノイズ除去
・機械学習

3)文字列生成

・文字抽出
・文字結合
・文書生成
・意味抽出

2値化が実際にどのように行われるか

原画像と2値化画像(例1)
原画像と2値化画像(例2)
原画像と2値化画像(例3)
原画像と2値化画像(例4)
原画像と2値化画像(例5)
原画像と2値化画像(例6)
原画像と2値化画像(例7)

文字列生成のための文字候補抽出

2値化画像から短形抽出を行います

Deep Learningによる文字判定結果(確信度)

人工知能

認識しづらい「単語」でも、文書の前後から推測できてしまう。
知っている「単語」は正しく認識できるが、知らない「単語」は間違っていても気づかない。

応用例

参考(学習済フォント)

Scroll Up