AI-OCR コラム

Column

AIスキャンロボでのOCR化に向かない帳票例

2020.09.11AI-OCRスキャンロボ

3641435_sn.jpg

こんにちは。ネットスマイルです。

AI-OCRを検討する際に、各社様々な製品が出ている中、
なるべく多くの紙帳票をデータ化したいというご要望があるかと存じます。

実際に、当社のAI-OCRであるAIスキャンロボでは、
取引先各社で扱われる様々な紙帳票のOCR化が可能です。

しかし、本コラムではあえて「こういった帳票は当社のAI-OCRではデータ化に向かない」という
代表的な例をご紹介したいと思います。


<当社のAI-OCRでのデータ化がお勧めできない例:注*>
・レシート
・契約書
・履歴書

これらに共通する特徴は、1枚1枚全ての帳票の特徴が一致するものが存在しない、
またはその可能性が極めて低いことです。
理由の詳細については、下記の通りです。

・レシートの場合
商品名や金額の読み取りの位置が文字列の長さや購入の数に依存して、毎回変わってしまいます。

・契約書の場合
契約先ごとに内容や各条文の長さが異なり、
同じフォーマットの契約書が存在する可能性が、極めて低いため。
契約書の全ての文字情報をデータとして保管したいというご要望をいただくこともありますが、
読取結果をCSVデータとして出力する仕様のため、
読取したデータを1つのセルに出力する際に文字数の限度があります。

・履歴書の場合
人によって記載項目が違い、同じフォーマットが存在する可能性が極めて低いため。

注*:2020年9月現在の状況で記事を書いておりますが、性能向上に応じて状況は変化します


実務では、上記例以外にも品質の悪い帳票も多数含まれますが、
現在このような帳票も読み取りできるように技術改良を進めております。

AI-OCRをご検討中で、こういった帳票は読めるのか試してみたいなどあれば、
遠慮なくお問い合わせください。

<お問い合わせURL>
https://aiocr.ai/contact/