AI-OCRを取り扱ったセミナーはいくつか開催されていますが、参加企業も多く、高い関心を持っていることが伺えます。しかし、AI-OCRが対応できる業務や、搭載されている機能等は理解されていますが、実際の操作感や認識率について、明確にイメージできない方もいると聞きます。
今回は、AI-OCRは日本国内でどの程度普及しているのかという点を確認した上で、AI-OCRのデモンストレーション環境で様々な文書を読み取らせた結果を基に、実際の認識率をお伝えしていきます。そして現在のAI-OCRは導入を検討するに値するのかを考えていきたいと思います。
AI-OCRの国内普及率
2019年6月にMM総研が1,000社に対してAI-OCRに関するアンケート調査を行いました。その結果からは、「AI-OCRを利用している」と回答した国内の企業は全体の9.6%で、未導入企業であっても「利用に関心がある」と回答した企業は51.9%であり、合わせて61.5%の企業がAI-OCRに関わっていたり、興味を持っているということがわかりました。1,000社中の96社が導入しているという結果を多いと見るか、少ないと見るかは考え方にもよりますが、全体の関心が高い割には、実際の導入はまだあまり進んでおらず、国内企業に普及しているとは言い難い状況だと捉えられるのではないかと思います。
劇的に導入が進まない原因は様々ですが、大きな理由としてはAI-OCRのトライアル利用が有償であることと、実際の認識率がよくわからないことが挙げられます。
普及しにくい理由①:トライアルが有償である
AI-OCRのベンダー各社ではトライアル利用のサービスを展開していますが、1ヶ月~2ヶ月の期間でおよそ10万円~20万円の料金設定となっているところが多いです。これはAI-OCRの利用環境が大半はクラウドなので顧客用のデータを用意すると費用が発生することや、AI-OCRの心臓部であるAIのプログラムやデータベースを常に維持管理しなければならず、ベンダー側の負担も相応にあるためなので、トライアルが有償になることも理解できるところです。しかし、試したい企業からすると、使うことになるかわからないシステムの短期利用に20万円と言われると、踏み出しにくいところがあるのも事実です。
普及しにくい理由②:本当の認識率がよくわからない
AI-OCRのベンダー各社では製品の性能を顧客に理解してもらうため、自社でテストをした結果を認識率として公表しています。中には98%以上という高い率を示している製品もありますが、当然ながらテストの対象とした文字や帳票等の条件によって左右されます。AI-OCRに興味を持つ企業にとっては、実際のところはどうなのかという点と、自社の帳票でも同様の結果が出せるのかという点が残り、検討が前に進まないというケースがあります。
AI-OCRを試す~様々な文字認識の結果~
AI-OCRのトライアルが有償であるという課題の解決は一筋縄ではいかないところですが、理由②については、弊社からある程度参考になる情報を提供することが可能です。あるAI-OCRを使い、様々なパターンの文字認識を試していますので、以下にいくつかの実測値を示していきます。
①全てが印字の請求書
Excelで各項目に枠のある定型フォーマットを作成し、入力後に印刷をした請求書を読み取らせました。請求書の背景は無地で白色です。その結果、全文字数263に対して読み取りが成功した数は260で、認識率にすると98.9%という高いスコアになりました。失敗した箇所は金額欄の一つで、数字の頭にあった「1」を記号と誤っていました。
各文字の形に手書きのような崩れがなく一定していることと、背景が無地かつ薄い色であり、文字に干渉していないことが高い認識率につながったと考えられます。
②文字が手書きの請求書
フォーマットは全てが印字の請求書と同じですが、文字は全て手書きをして試しました。全文字数263の内で成功は247となり、認識率は96.4%でした。失敗をした箇所は、「ン」を「レ」と読んでいたり、書き損じた文字を塗りつぶした跡が「8」と読まれる等していました。しかし、印字と比較をすると手書きは認識率が劣るのが一般的で、テストでは意識的に悪筆で書いたところもありましたので、この結果は健闘した方であると言えます。
③新聞
背景は薄いグレーで縦書きされた印刷物です。全文字数467に対して成功数は13となり、認識率は2.78%と実用には程遠い結果になりました。原因の一つとしては、背景色と文字色のコントラストが高くなかったため、読み取り時に文字として認識できない箇所が多かったのではないかと予想しています。背景が色付きである物の一例として商品券も読み取らせましたが、認識率は63.1%でした。癖の強い企業ロゴや漢数字は読み取り失敗が多く、印字色の濃い数字は成功していました。
OCR全般に言えますが背景の色は白に近く、文字とのコントラストが強い程、認識率が高くなります。そのためほとんどのAIーOCRには、読み込んだ文字のコントラストを補正する処理が備えられています。他にも試していますが、文字が鮮明な場合はベンダーが提示している認識率と同等か、それ以上の結果が出ていましたので、AI-OCRの読み取り対象として考えている帳票の状態を確認すれば、ある程度は成果を予測することが可能です。
導入した企業ではどのような業務に使われているのか?
実践テストから認識率のイメージは付きますが、AI-OCRを検討する上では、導入した企業がどのような業務に利用しているのかというのも気になるところです。
事例①:不動産業
自社が管理している物件の新規契約書や更新契約書は、顧客の押印が必要であるため最初から電子ファイルにできず、受領後に手作業でシステム入力をしていましたが、文字部分をAI-OCRに読み取らせてCSVファイルで出力することで、人手を使わずシステムに取り込む運用になりました。
事例②:卸売業
得意先からの発注連絡は手書きのFAXや電話で受けることが多く、繁忙期には1日で500件~700件を受発注システムに入力していました。このFAXをAI-OCRで読み取り、受発注システムで読み取れる形式の電子ファイルを出力するようにしたことで、受発業務の作業量を半減することができました。
事例③:小売業
商品仕入の担当者がメーカーや卸と打ち合わせを行った際、手書きで記録したメモをExcelの定型フォーマットに入力しており、他業務を圧迫していましたが、AI-OCRでデータ化できるようにしたことにより、出力結果を確認してExcelへ貼り付けるだけの運用になりました。
AI-OCRが効果を発揮しやすいのは、やはり大量の紙情報をデータ化する必要のある業務となります。これらの他にも事例はありますが、各企業の事情に合わせて使われているのが現状です。
AI-OCRの現実から考える導入検討の要否
AI-OCRのベンダー各社からはそれぞれの読み取り率が公表されていますが、実際に試してみるとその率は条件によってかなり上下をします。しかし、従来からあったOCRと比べると読み取りの精度は格段に上がっており、複雑で細かい設定をしなくても使えるように作られていますので、利用しやすくなっていることは事実です。また、AI-OCRの認識精度を100%にすることはできませんが、人間が紙の文書から文字データを起こすよりも、遥かに早く大量のデータを作成することが可能です。企業が許容できる一定以上の認識率をAI-OCRが担保できるのであれば、データ入力と入力結果のチェックを必要とする作業等を省力化できることは確実です。
AI-OCRに読み取らせたい文書の状況を確認し、公表値に近い認識率を確保できそうな見立てがあれば、ある程度は割り切ってしまい、トライアルや導入の検討を進めるのも良いのではないでしょうか。
まとめ
・AI-OCRの国内普及率
☑MM総研が1,000社へ実施したアンケートによると、「AI-OCRを利用している」と回答したのは全体の9.6%だった。
☑AI-OCRを導入していない企業も「利用に関心がある」と回答したのは、51.9%だった。
☑企業の関心が高い割には普及が進んでいない。
☑普及しにくい理由の一つ目は、トライアルが有償であること。
☑普及しにくい理由の二つ目は、AI-OCRの本当の認識率がわからないこと。
・AI-OCRを試す~様々な文字認識の結果~
☑「全てが印字の請求書」の認識率は98.9%だった。
☑「文字が手書きの請求書」の認識率は96.4%だった。
☑「新聞」の認識率は2.78%だった。
☑読み取り帳票の背景と文字のコントラストが強い程、認識率が上がる。
☑自社で試したい帳票の状態を確認することにより、実際の認識率を予測することが可能である。
・導入した企業ではどのような業務に使われているのか?
☑不動産業:自社管理の物件に関する新規契約書と更新契約書の読み取りに利用している。
☑卸売業:FAXで受領する発注書を読み取り、受発注システムに登録できる形式にしている。
☑小売業:仕入担当者がメーカーと打ち合わせをした際のメモの読み取りをしている。
・AI-OCRの現実から考える導入検討の要否
☑従来のOCRと比較をすると精度は上がっており、使いやすくはなっている。
☑一定以上の認識率を担保できるのであれば、業務を省力化できる可能性が高い。
☑AI-OCRに読み取らせる文書の状況を確認し、公表値に近い結果が得られそうであれば、検討する価値はある。