現在の日本企業は業務システムの導入が進み、多くの情報がデータ化されています。
しかし、それでもまだ紙を利用している業務が残されています。また最近ではRPAを導入して、PCで行う業務を自動化する企業も増えてきていますが、担当者が手書きの情報を見ながらシステムへ入力するような業務はRPAの対象外となるため、一部の業務は従来と変わらず、人の手で行うところが残されています。
そのように業務システムやRPAでは自動化ができない手作業を削減する手段の一つとして注目されているのが、AI-OCRです。複合機などで紙の情報をデータ化して文字情報を読み取るOCRは以前からある技術ですが、文字認識精度の低さや、あらかじめ設定した帳票しか対応できない等の課題がありました。それらの課題を克服するためにAI技術を組み合わせ、精度と汎用性を高めたものがAI-OCRです。
今回は、最近のAI-OCRはどのくらいの文字認識率があり、精度を上げるためにどのような仕組みで成り立っているのかを整理しながら、AI-OCRの業務活用について触れたいと思います。
文字の認識率を高める仕組み
AI-OCRはRPAと共に業務効率化のツールとして注目を集めていますが、従来のOCRよりも高い文字認識精度を出すために、どのような仕組みを利用しているのでしょうか。キーワードとなるのは機械学習と補正データベースの利用です。
まず従来のOCRは、帳票内で文字が入力される枠のサイズ情報と、各種の文字の特徴が設定されており、そのサイズと特徴を基にして、与えられた文字を判断します。
例えば、顧客から注文書がFAXで届き、数量の欄に「7」と書いてあったとします。OCRには「7」の特徴として、①枠の左上あたりから線が横にある・②枠の右上から45度の角度で左下に線が伸びる・③枠の下部分まで線がある、という設定がされています。OCRはこれらの特徴と手書きの7を比較して判断をするのですが、7の書き方によっては特徴と合致せず、似たような特徴を持つ「2」と誤って判断してしまう場合があります。
AI-OCRも利用開始時に持っている文字の特徴量は従来型のOCRと同じ程度ですが、様々な手書き文字を読み取っていくことで保持する特徴量を増やし、読み取り精度を上げていくことができるようになっています。これが機械学習と呼ばれるものです。
同じ「7」でも人によって書き方が異なります。書き始めの横線が右肩上がりになる人や片仮名の「ワ」に近い書き方をする人もいれば、「1」と区別するために「7」の縦線部分に短い横線を加える人もいます。従来のOCRではそれらが「7」であることを判断するためには、細かく設定をしなければならず、保持する特徴とは異なるタイプの書き方が現れる度に設定を行う必要があります。
一方、AI-OCRの場合は読み取りに失敗した際、これは「7」であると教えることで、その手書き文字が持つ特徴を掴みます。
特徴の情報を溜め込み、判断に利用するため、少し異なるタイプの書き方がされた場合でも総合的に判断をして、「これは7である」と決定できるようになっています。
しかし、機械学習を行うAI-OCRでも正確に判断できないときもあり、例えば「東京都中央区」と書かれた帳票を読み取った場合、誤って「東京者B中央区」としてしまうこともあります。文字の特徴から判断をしていますので、「都」の書き方が独特なときは失敗する可能性があるのです。AI-OCRは各ベンダーから販売されていますが、中にはこのような結果を避けるために、補正用のデータベースを用意しているものもあります。
データベースには全国の住所等の情報が保存されており、AI-OCRの読み取り結果と照合して正しい情報に修正する仕組みになっています。先ほどの例では、AI-OCRの読み取りで「東京者B中央区」と判断してしまったとしても、データベース内には「東京」と「中央区」が含まれる文字列があることから、「者B」ではなく「都」であると再判断され、結果は「東京都中央区」に修正されます。
このように、AI-OCRは機械学習と補正用データベースの利用を組み合わせる等の方法を採用することによって、その精度を上げています。
文字読み取りの事例
AI-OCRは機械学習により精度を向上すると書きましたが、実際にはどのような文字を読み取れるのか、いくつかの事例を紹介します。
■崩れ文字
「ツ」が崩れて「”‘」のようになってしまった文字も、学習が進むにつれて認識できようになります。
■枠外へのはみ出し
読み取り設定をした枠の外へ文字がはみ出している場合も、そこまでに読み取った文字列の内容から想定して補完する製品もあります。
■漢字とカタカナの混合
漢字とカタカナが混じっている文字列も、それぞれを識別してデータ化が行われます。
■二重取り消し線
二重取り消し線が入れられている部分は認識せず、読み取らないようにすることが可能です。
AI-OCRを活用できる業務例
AI-OCRは紙の情報を読み取り、データ化をするツールですので、紙が多く使われる業務で真価を発揮します。ここでは実際に使われている業務を紹介していきます。
■受注伝票の読み取りと区分作業
手書きの受注伝票をExcelに転記し、伝票番号から種類を特定して区分けをする必要があったのですが、伝票が大量に発生するため、営業事務の担当者が作業に多くの時間を費やしていました。これをAI-OCRで読み取らせ、CSVとして一覧化できるようにしたため、区分けをするまでの時間を短縮することができた企業があります。
■請求書の情報入力作業
取引先から受領する書面またはPDFの請求書が数百枚あり、債権管理システムへの入力は手作業でしたが、AI-OCRで読み取った結果のCSVをシステムへ取り込めるようにしたことで、業務量を大幅に削減した企業があります。請求書は発行する企業によって様式が異なりますが、AI-OCRにパターンを覚えさせておき、異なる様式であっても連続して読み取らせ、大量の請求書を処理できるようにしている企業もあります。
また、公表されている事例の代表としては、ゆうちょ銀行と東京の足立区役所があります。
ゆうちょ銀行は投資信託の口座開設業務向けにAI-OCRとRPAを組み合わせた仕組みを作り、業務時間が3分の1に削減されたと発表しています。そして足立区役所では特別区民税・都民税申告書データ入力や、給与所得者異動届出書データ入力業務等でAI-OCRとRPAの検証を行い、1,436時間の削減が見込めたと発表しています。
なお足立区は、検証の結果が良くなかった業務とその理由もホームページで公開しており、興味深い内容となっています。
例えば、保育施設利用申込書データ入力業務で試したところ、申請は複数枚で1セットになっているため、AI-OCRのスキャンに伴う書類整理に時間がかかり、効果が見込めなかったとあります。
このような効果が得られなかった結果の公表は、AI-OCRの導入を検討する企業にとって有益な情報です。
AI-OCR導入すべきなのか?
一部のAI-OCRは機械学習と読み取り結果を補正するDBを使うことによってその読み取り精度を上げており、よほどの悪筆ではない限り、読み取ることが可能になってきています。
以前のOCRに比べ、細かな設定や調整の必要も少なくなっていますので、紙が大量に発生する業務が多く、またデータ化を多く行っている企業であれば、導入の効果は出しやすい状況です。
一方、紙を使う業務は多いけれど紙の量は少ないのであれば、AI-OCRと人力作業のコストを比較するのが正攻法ですが、場合によっては専用システムを導入することで解決を図る方法もあると思います。
AI-OCR導入の判断材料として必要なのは費用対効果ですが、算出には読み取り精度の確認と費用の情報が必要となります。これらを得るには、ベンダー各社で行っている有償または無償のトライアルを実施するのが近道です。自社の紙資料で実際の読み取り精度を確認し、ベンダーから年間の費用感を聞き出すことで、費用対効果を算出することができるようになります。その結果を基に、自社でもAI-OCRを使うべきか否かの検討を進めていくことが、効率の良い判断につながります。
まとめ
・文字の認識率を高める仕組み
☑AI-OCRの文字認識率を上げる仕組みには、機械学習と補正データベースの利用がある。
☑AI-OCRは様々な手書き文字を読み取ることで、保持する文字の特徴量を増やしていく。
☑不正確な読み取りをした場合でも、正しい文字に補完するためのデータベースを備えているものもある。
・文字読み取りの事例
☑「ツ」が崩れて「”‘」のようになってしまった文字も、学習が進むにつれて認識できようになる。
☑読み取り設定をした枠の外へ文字がはみ出している場合も、文字列の内容から想定して補完する。
☑漢字とカタカナが混じっている文字列も、それぞれを識別してデータ化が行われる。
・AI-OCRを活用できる業務例
☑受注伝票の読み取りと区分作業
☑請求書の情報入力作業
☑公表されている事例にはゆうちょ銀行と東京の足立区役所があり、一定の効果を得ている。
・AI-OCR導入すべきなのか?
☑AI-OCRの読み取り精度は上がっているので、紙の業務量が多い企業は検討に値する。
☑AI-OCRの検討ではトライアルを行い、読み取り精度と費用対効果を確認する。