文字認識エンジンでできること
画像内のテキストをAIで認識・抽出するサービスを提供しています。画像に含まれる文字、単語、記号、ロゴマークなどを最新のディープラーニングOCR技術を用いて検出・二値化処理し、テキストデータとして出力します。画像から抽出したテキストの意味やコンテキストを理解する独自の自然言語処理エンジンを搭載しているため、単なるテキストデータにとどまらず、その背景にある意味まで抽出することが可能です。画像認識と自然言語処理の技術を組み合わせたサービスにより、画像内のテキストをより深く理解し、様々なビジネスシーンでの利活用を実現します。
2値化
背景のある画像から文字、文字列、記号、マーク、ロゴを2値化して、DeepLearning でそれらを判定することができます。
意味を抽出する
特に文字列においては、自然言語処理を用いて、誤認識、欠落文字の補完を行い、また文書としての評価を行ない、その意味を抽出することもできます。
![](https://www.sofnec.co.jp/wp-content/uploads/2017/05/engine_system.png)
文字列生成までの処理の流れ
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/nichika_nagare01.png)
1)原画を取りこむ
ビデオ
雑誌
看板
ポスター
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/nichika_nagare02.png)
2)文字認識
・文字領域の判定
・2値化処理
・ノイズ除去
・機械学習
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/nichika_nagare03-3.png)
3)文字列生成
・文字抽出
・文字結合
・文書生成
・意味抽出
2値化が実際にどのように行われるか
原画像と2値化画像(例1)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample001.png)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample001-2.png)
原画像と2値化画像(例2)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample002-1.png)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample002-2.png)
原画像と2値化画像(例3)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample003-1.png)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample003-2-1.png)
原画像と2値化画像(例4)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample004-1.png)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample004-2-1.png)
原画像と2値化画像(例5)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample005.png)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample005-2.png)
原画像と2値化画像(例6)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample006.png)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample006-2.png)
原画像と2値化画像(例7)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample007.png)
![](https://www.sofnec.co.jp/wp-content/uploads/2021/08/sample007-2.png)