AI-OCR コラム

Column

AIスキャンロボでのOCR化の際に精度に影響が出やすい帳票例について

2020.09.25AI-OCRスキャンロボ

403287_mn.jpg

こんにちは。ネットスマイルです。

AI-OCRを利用して業務効率化を進める際に、どの帳票にAI-OCRを利用するかお悩みではありませんか?

業務効率化を進める際には、あれもこれもとなりやすいですが、結局は優先順位付けが大事になってきます。
OCR化を進める際も、まず業務効率化を進めやすい帳票から始めるのはいかがでしょうか?

今回は、読み取りの精度が落ちやすい帳票状態の例をご紹介しますので、
本コラムの情報をOCR化を進める帳票の優先順位付けのご参考にしていただければ幸いです。


<読み取りが難しい帳票例>
1.帳票上にドットのノイズが入っているもの
2.FAXなどで送られてきたもので、帳票全体が平行四辺形や台形に歪んでしまっているもの
3.手書き文字で、帳票上の記載位置が決まっていないもの

以下、それぞれのケースについて読取精度に影響が出る理由をご説明致します。


【帳票上にドットのノイズが入っているもの】
帳票上のドットを何らかの文字として捉えてしまうことがあり、
読取精度に影響が出やすいケースがあります。
(FAXで送られてくるものでしばしば見られます)

ただし、ノイズがあった場合に影響が出るかどうかについては、
一度読取をお試しされることをお勧めします。

ドットが周りの文字と比較して、非常に薄い場合や数が少ない場合は、
問題なく読み取ることができるケースもあります。


【帳票全体が平行四辺形や台形に歪んでしまっているもの】
帳票が歪んでしまうと、読み取りの際に設定したテンプレートで指定した読み取り位置とずれることにより、
読取の際に指定した箇所のデータの取得が上手くできなくなります。

例えば、表の罫線が読取エリアに入ってきて文字として含まれてしまうことや、
読み取り指定箇所が歪みによって読取エリアから外れてしまうことで、読取精度に影響が出やすくなります。


【手書き文字で、帳票上の記載位置が決まっていないもの】
手書き文字の読み取りをする場合には、書き手の癖字や読取枠からはみだしてしまうなど、
書き方により読取精度に影響を受けやすいことは事実です。

特に記載場所が決まっておらず帳票の空白箇所に自由に書かれてある文字は、
記載されている場所を見つけることができないため、読み取りが出来なくなります。


AI-OCRを検討される中で、こういった帳票は読めるのか試してみたいなどあれば、
どうぞ遠慮なくお問い合わせください。

<お問い合わせURL>
https://aiocr.ai/contact/