OCRとは? 紙に書かれた文字をデジタル化する業務効率化ツールを徹底解説

/
OCRとは?紙に書かれた文字をデジタル化する業務効率化ツールを徹底解説

OCR(Optical Character Recognition/Reader、オーシーアール)とは、紙や画像ファイルに書かれている文字を、コンピュータで利用できるデジタルデータに変換する光学的文字認識技術のことです。OCRを活用することで、紙帳票のコンピュータへの手入力および確認作業にかかる人員を削減することや、紙で書かれていた情報にアクセスできるようになることで、業務の効率化が期待できます。

➡︎【資料ダウンロード】業界ごとのDX推進ケースをまとめた“DX事例集”

OCRとは?

文字をスキャンしてOCRにかけることで、紙の書類をデジタル化できる

文字をスキャンしてOCRにかけることで、紙の書類をデジタル化できる

OCRとは、Optical Character Recognition(またはReader)の略で、紙や画像ファイルに書かれている文字を、コンピュータで利用できるデジタルデータに変換する光学的文字認識技術のことです。人間は紙や画像ファイルに書かれている文字が、読みにくい文字であっても意味を理解することができます。しかし、コンピュータはそうはいきません。

OCRを使い、文字を解析することで、はじめてコンピュータは文字をデジタルデータとして認識できるようになります。OCRなしに、スキャナやカメラで読み取った紙の書類をPDFとして保存した場合、それはただ画像が貼られているだけのPDFとなり、書かれている文字の検索を行うことはできません。コンピュータがスキャナやカメラで読み取った画像から、文字を認識・解析して保存するにはOCR技術が必要です。

➡︎【資料ダウンロード】業界ごとのDX推進ケースをまとめた“DX事例集”

★OCRは紙や画像ファイルに書かれている文字を、コンピュータで利用するための技術
・スキャナやカメラで読み取った画像から、文字を解析する
・コンピュータで紙の文字を検索できるようになる
・コンピュータが文字を認識・解析して保存するにはOCR技術が必要

OCRを活用するメリット

企業の業務では、紙の書類を扱うケースが根強く存在しています。OCRを活用するとそれらはどうなるか、メリットはどういったものがあるか、具体的に見ていきましょう。

データ入力作業工数を削減

OCRを導入することで、従来、手作業で行っていた伝票処理などの業務を自動化できます。このような処理を人が行う場合、長時間の作業による疲労で、誤入力・見落としなどのミスをしてしまったという経験をされた方もいるのではないでしょうか?
OCRを活用すると、ミスや作業時間の削減を実現しながら、文字のデジタルデータ化を行うことができます。OCRの文字認識の精度は100%ではありませんので、読み取った文字の確認は必要ですが、手動のデータ入力工数を削減できるのは大きなメリットです。

データの検索利便性が向上

OCR処理を行っていないPDFファイルは、ただ文字が書かれた画像が貼られているファイルのため、文字によるデータ検索ができません。そうしたファイルにOCR処理を行うことで、ファイルの画像を文字と画像部分に分け、文字を解析し、キーワードによる検索が可能なデジタルデータにできます。画像データはテキスト化することで圧縮でき、さらにノイズなどの不要情報の削減をすることで、ファイルサイズの容量縮小も可能です。

Word、Excelなどの形式で保存し、修正が可能

文字をテキストデータとして保持することになるので、ソフトウェアに転記して利用することができます。読み込んだデータをそのままワード、エクセル、パワーポイントの形式に変換できるので書類の修正が容易に可能です。紙の書類を修正するとなると、記載されている情報を手動で転記したり、新たにベースとなるひな形を作成し入力する手間がかかりますが、デジタルデータであればピンポイントで修正可能で、非効率な作業から解放されます。

ペーパーレスとなり、遠隔地でも情報共有できる

紙の帳票は保管スペースを必要とするので、オフィスを圧迫していることもあるかと思います。また、資料が膨大だと資料室や倉庫に資料を探しにいく必要もあったのではないでしょうか。
OCRでペーパーレス化を進めれば、オフィスの書類の保管場所という物理的なスペースの削減が可能です。さらにファイルをサーバーに格納し、関係者に共有しておくことで、遠隔地からでも書類の内容を確認できるようになります。

➡︎【資料ダウンロード】業界ごとのDX推進ケースをまとめた“DX事例集”

OCRの仕組み

OCR処理の流れは、多くの場合、紙の書類のスキャンから始まり、レイアウト解析や文字の処理を経て、テキストデータとして文字を抽出します。それぞれの段階を具体的に見ていきましょう。

スキャンし画像データに変換

紙の書類をスキャンし、画像データに変換します。読み取った画像データに対し、向きや色調の補正、ノイズ除去も行います。このときに高い解像度でスキャンを行うことで認識精度を向上させることができます。反面、スキャン速度も遅くなるので、読み込むファイル数や目的に応じて調整が必要です。

レイアウトの解析

文書には文字や図、表が混在していることがあります。そのためOCRではスキャンした画像のレイアウトを解析し、文字部分と画像部分に分けます。こうすることで、文字部分は次の文字処理の実施、画像部分は圧縮・ノイズ削減を行えるようになります。あらかじめ、人の手でテキスト領域や画像領域のレイアウトを登録する場合もあります。

文字の処理

文字部分として分けられた箇所は複数行に渡ることもあるので、1行ずつに分けます。そして1行から1文字ずつ切り出していきます。切り出された文字を一定のサイズに変換し、特徴を抽出。抽出された特徴に対し、事前にさまざまなフォントから作成されたパターンとマッチングさせ、文字を確定します。

出力

確定した文字をテキストとして処理し、出力します。OCRソフトによってさまざまなファイル形式に出力することが可能です。PDFに書き出すことや、ワードやエクセルに変換し、元のファイルの修正ができるものもあります。

➡︎【資料ダウンロード】業界ごとのDX推進ケースをまとめた“DX事例集”

AI OCRとは? OCRとの違い

従来のOCRは文字認識精度が低く、読み取った文字の修正やチェックに手間がかかっていたため、導入を見送った方もいるのではないでしょうか。しかし近年、OCRにAIを搭載しディープラーニングを活用する「AI OCR」により、文字認識をより正確に行えるようになっています。AI OCRで改善された点を具体的に見ていきましょう。

文字認識率が向上、手書き文字認識もできる

これまでのOCRは、決められたルールの範囲内でしか認識結果を導き出すことができませんでした。

しかし、AI OCRでは、AIを搭載しディープラーニングを活用するため、一度文字を読み間違えても、間違えたデータをAIが学習することで徐々に読み取り精度を改善することが可能です。

たとえば、従来のOCRでは「夕方」と書かれているとき、漢字の「夕」とカタカナの「タ」を判別することができませんでした。AI OCRでは、大量のデータからAIが自動的に特徴を抽出するディープラーニングの技術を使い、文脈や語句の規則性を学習することで、判別が困難な文字を、手書きであっても高精度で認識することができるようになっています。

★ディープラーニングについて詳しくはこちら

フォーマットが異なる帳票にも対応

正確に文字を認識するために、従来のOCRソフトの多くは、帳票ごとに読み取る文字の位置や項目の設定を必要としていました。また、領収書などの非定型の帳票の場合、OCRソフトが使えず、すべて手作業でコンピュータにデータ入力をする場合もあったのではないでしょうか。

AI OCRでは、精度を高めるために事前に設定を行う場合もありますが、範囲や項目の設定をすることなく自動で文字列を抽出できるため、紙ベースの資料をスキャンするだけで文字を認識してくれます。請求書や納品書といったさまざまな形式の書類を迅速に処理でき、業務効率が大幅にアップします。

RPAとの連携で作業効率アップ

AI OCRをRPA(Robotic Process Automation)と連携させて使用すれば、AI OCRで読み込んだデータをそのまま利用することが可能になります。

たとえば、経理処理で取引先からの請求書を会計システムに入力し、受理メールを出す場合を考えてみましょう。従来は担当者が請求書を見ながら手入力で入力し、内容をダブルチェックで確認後、受理メールを送信していました。AI OCRとRPAを連携すると、AI OCRが請求書を読み込み、そのデータをRPAが自動で会計システムに入力、担当者が一度確認するとRPAが受理メールを送信する、ということができるようになります。

つまり、人の作業はAI OCRにデータを読み込ませることと、入力データを一度確認するのみでよくなり、業務を大幅に削減することができるようになっているのです。

★RPAについて詳しくはこちら

➡︎【資料ダウンロード】業界ごとのDX推進ケースをまとめた“DX事例集”

OCRソフトウェア導入のポイント

OCRはさまざまな製品があり、製品によって得意分野が異なります。また、帳票のタイプや枚数、運用・導入形式によって予算が変わってきます。OCRソフトを導入する前に確認すべき点を見ていきましょう。

帳票の文字タイプ・件数・レイアウト

自社が使用している帳票について、文字タイプ・レイアウト・件数を確認しましょう。手書き文字の読み取りが多い場合、手書き文字の読み取りを得意とするOCR製品を選ぶ必要があります。
印字の読み取りが多く、かつ発注書や請求書などの定まったレイアウトの帳票が多い場合、一度に大量に処理できるOCRもあります。逆に、帳票のレイアウトが非定型のものが多い場合は、非定型の帳票に対応できるソフトを選ばなくてはなりません。
また、縦書きの帳票には対応していないというケースもありますので、文字の向きについても確認しておきましょう。

読み取る文字は日本語か、外国語か

自社の帳票で多く使われているのは日本語だけでしょうか?海外に拠点がある企業とやりとりする場合、その言語に対応したOCRソフトを選ぶ必要があります。言語によっては、海外製のソフトの方が文字の読み取りがうまくいく場合があります。

データの入力・出力・連携方式

OCRソフトに読み込ませたいファイルは何でしょう? OCRソフトによって、読み込めるファイル形式は異なるため、自社でよく使うファイル形式に対応したソフトを選ぶ必要があります。
読み込んだデータを保存する際のポイントとして、出力フォーマットや帳票の仕分け機能の有無なども事前に確認しておきましょう。帳票の仕分け機能があると、請求書・申込書など、仕分け条件に従ってフォルダ別に保存することが可能です。
また、AI OCRの中には、RPAに組み込むことができる製品も存在します。想定した運用が可能かについても確認が必要です。

クラウドでの運用か、オンプレミスでの運用か

OCRツールを、何人がどこで使う想定なのかも選定ポイントです。たとえば、リモートワークが多い場合は、どこからでもブラウザを通してアクセスできる、クラウドタイプの OCRソフトを選ぶと作業効率が良くなります。
一方、セキュリティを重視する場合は、自社のコンピュータにインストールして利用するオンプレミスタイプのソフトを選ぶとよいでしょう。

➡︎【資料ダウンロード】業界ごとのDX推進ケースをまとめた“DX事例集”

OCRの導入事例

実際にOCRをサービスに活用した事例を紹介します。

キャッシュビーデータ|キャッシュバック提供アプリ『CASHb』の画像処理技術改善

画像処理技術の改善によるレシート内データの効率的な取り込みと識別を実現

画像処理技術の改善によるレシート内データの効率的な取り込みと識別を実現

『CASHb』アプリは、キャッシュビーが提供するレシート内の購買データを収集する日本初のキャッシュバックサービス。ユーザーが送付したレシート画像から生活者購買データを取得・活用し、B2C企業にデータを活用する機会を提供しています。

同社が課題に感じていたのは、OCRで取得したテキストをビジネスで活用できるデータに加工するための正確なデータ収集の仕組みの構築。また、これまで画像から正しくデータを読み取れなかった情報処理は人の手で行われており、それに伴う作業時間とコストの削減も課題となっており、精度の高い画像処理技術の開発が急務となっていました。

モンスターラボは、画像処理技術を改善し、AIの画像認識精度を向上させることを提案。どんな画角の画像でも認識できるように、抽出技術をリサーチしては改善を繰り返しました。

画像処理技術の改善により、精度よく抽出・分析を行うことが可能に。これまで人の手に頼っていた確認作業を大幅に削減でき業務効率化に繋がりました。

★事例について詳しくはこちら

まとめ:OCRを活用して業務効率を改善

OCRについて解説しましたが、いかがでしたでしょうか?
OCR製品を用いて業務プロセスのデジタル化を行うことは、コロナ禍を契機に企業が直ちに取り組むべきアクションとして、経済産業省のDXレポートでも位置付けられています。
OCRによって紙の書類のデジタル化を行うことで、書類スペースの削減や情報共有の向上が見込めます。さらにAI OCRにより手動のデータ入力を削減し、RPAと連携することでさらなるコスト削減、業務効率化の実現に繋がっていきます。

➡︎【資料ダウンロード】業界ごとのDX推進ケースをまとめた“DX事例集”

サービス・プロダクト開発を検討している企業ご担当者様へ

モンスターラボは、約20年にわたるサービス・プロダクト開発実績から得られたデジタル領域の知見や技術力を活かし、デジタルプロダクト開発事業を展開しています。

先端テクノロジーに対応した高度なIT人材があらゆるプラットフォーム上での開発を支援します。アジャイル開発とDevOpsによる柔軟な開発進行や、国内外のリソースを活用したスケーラブルな開発体制の構築も可能です。 また、リリース後の保守運用や品質向上支援まで伴走可能です。

モンスターラボが提供するサポートの詳しい概要は以下リンクをご確認ください。

➡︎モンスターラボのサービス概要はこちら

案件の相談はこちら

直近のイベント

記事の作成者・監修者

平田 大祐(株式会社モンスターラボ 常務執行役員)

平田 大祐(株式会社モンスターラボ 常務執行役員)

2004年IBMグループに入社し、IBM ITスペシャリストとしてシステム開発に従事。 2009年からベンチャー企業にて受託開発、コンテナ型無人データセンターの管理システム、ドローン開発などソフトウェアからハードウェア開発まで幅広く関わる。チーフテクノロジストとして2015年にモンスターラボへ入社し、2018年4月より最高技術責任者であるCTOに就任。 プロフィールはこちら