お問い合わせ

News
新着情報

OCRの精度を上げるのが難しい理由や解決方法を解説

業務のデジタル化やDXの第一歩となるのが、書類をデータ化することです。

一般的にはスキャナとOCRとよばれるソフトウェアを利用するケースが多いですが、実際のところOCRの精度はどの程度なのでしょうか。

OCRによる文字の認識率を向上させるためのポイントも合わせてご紹介します。

そもそもOCRとは

OCRとは「Optical Character Recognition」の略称で、書類に印字された文字や手書きのテキストをデジタルデータとして認識し、テキストデータに変換する技術のことを指します。

日本語では「光学文字認識」ともよばれています。

通常、書類をスキャナで読み取りPDFファイルを作成しても、本文の一部をコピーしたり検索することはできません。

これはPDFファイルとして読み込まれたデータがテキストとして認識されていないためです。

OCRを活用すれば、スキャンした書類や画像に含まれる文字を解析し、PCが認識できるテキストデータに変換することができます。

これにより、デジタル化した書類を容易に検索できるようになります。

関連記事:紙媒体をデータ化するメリット方法を徹底解説

OCRの精度の現状について

OCRは最近になって登場した技術ではなく、実は古くから存在していました。

かつてのOCRは文字認識の精度が低く、誤った文字列として認識するケースが少なくありませんでした。

たとえば、「を」と「と」を誤って認識したり、「ツ」と「シ」を混同するケースもあったようです。

しかし、昨今のOCRは技術が飛躍的に進化し、識字率も大幅に向上しています。

国立国会図書館では明治から大正、昭和までの膨大な蔵書をOCRによってデジタル化する取り組みを行っており、その結果を「OCRを用いたデジタル画像の全文テキスト化実施結果報告書」にまとめています。

この報告書によると、全20,000冊の平均認識率は91.3%に達しており、特に「昭和戦前期刊行図書」は92.7%、「昭和戦後期刊行図書」は96.6%と高い認識率を誇っています。

近年になって急速にOCRの精度が向上した背景には、機械学習やディープラーニングといったAIの技術が進化していることが挙げられるでしょう。

AIが大量のデータを学習することで、さまざまなフォントや手書き文字も精密に認識できるようになったのです。

しかし一方で、スキャナで書類を読み取る際に文字が潰れてしまったり、色合いや文字の大きさ、ピントのズレなどが原因でOCRが正しく認識できないケースもあります。

これらはOCRそのものの問題というよりも、スキャナの設定や読み込み作業などの問題といえるでしょう。

OCRの精度を上げる方法

では、OCRで正しく文字を認識するためには、スキャニングの際にどういった点に注意すれば良いのでしょうか。

高解像度でスキャンする

文字の一部が潰れて正しくスキャニングできない場合、スキャナの解像度が低すぎる可能性があります。

スキャナの解像度を上げることで細かい文字や輪郭がより鮮明にキャプチャされ、OCRが正確に文字を認識しやすくなります。

文書のみのモノクロ印刷書類の場合は200dpi以上の解像度でスキャンすることが推奨されていますが、画像付きのカラー印刷書類であれば400dpi以上が理想的です。

ノイズ除去とシャープニング

スキャンした画像に不要な点や線などのノイズが入り込んでいる場合には、再スキャンするか編集ソフトなどを使用しノイズを除去しておきましょう。

また、画像全体のシャープネスを調整することで文字の輪郭がはっきりし、OCRの精度が向上することもあります。

画像の傾き補正と余白の統一

スキャンした画像が極端に傾いていると文字のバランスが崩れ、OCRの認識精度が低下することがあります。

そこで、再スキャンや編集ソフトなどを利用して画像の傾きを補正し、余白を統一することで文字が正確に認識されるようになります。

カラー設定の調整

OCRを使用する場合、書類の背景色は白が基本となります。

黄色やグレーなどのカラーの書類を取り込む際には認識精度が低下するおそれがあるため、あらかじめ背景色を白に編集しておくようにしましょう。

また、本文の文字色も白背景に黒のパターンが理想的のため、OCRの認識率が悪い場合はカラー設定を調整してみることがおすすめです。

高性能スキャナの使用

スキャナ本体の性能が低く、取り込んだ画像にノイズが入ったり文字がぼやけたりすることもあります。

特に古い型式のスキャナは細かい文字やフォント、複雑なレイアウトなどを正しく読み取れないことも多いものです。

そのため、新しい型式の高性能スキャナで試してみるとOCRの認識率が改善する可能性もあります。

文字のある範囲のみ読み込ませる

文字列と画像、イラストなどが混在している書類を読み込むと、画像やイラストなどを文字列と認識したり、文字列を画像と認識するケースもあります。

そのため、可能であれば書類全体を読み込むのではなく、文字が含まれている範囲だけを読み込むことで無駄な部分の影響を避け、認識率が向上する可能性もあります。

特定の色ををフィルタリングする

特殊なデザインの書類を取り込む際には、特定の色をフィルタリングして除去することで文字認識の精度が向上する可能性もあります。

たとえば、黒地に白抜きの文字が印刷されている書類であれば、白黒を反転させたり、網掛けやマーカーなどの装飾が施された文字列はこれらを除去したりします。

これにより、文字と背景のコントラストが明確になりOCRの認識率が向上します。

関連記事:スキャン代行で対応できる書類やメリットを紹介|業者を選ぶポイントも解説

OCRの精度を向上させるのが難しい理由

上記でご紹介した通り、OCRの精度を向上させるためにはスキャナで取り込む前段階の準備が何よりも重要です。

しかし、現実的に考えた場合、これらは決して簡単ではなくさまざまな課題が残ります。

適切な機材とソフトウェアの選択が困難

書類をスキャニングする前の段階で、画像の編集や加工を行っておけば理論上は精度を向上することができます。

しかし、編集用のソフトウェアや機材も準備しなければならず、ノウハウがないユーザーにとってはそれらの選定作業だけで頭を悩ませることもあるでしょう。

また、機材やソフトウェアの導入にあたっては手間とコストもかかり、大きな負担を強いられます。

専門知識と技術の不足

コストをかけて機材やソフトウェアを導入できたとしても、編集作業の知識や技術がなければ運用していくことはできません。

たとえば、背景色を変更したり、白抜き文字の反転、網掛けやマーカーを除去するための方法・手順なども覚えなければならず、ユーザーにとっては大きな負担となります。

また、基本的な作業方法や手順を覚えたとしても、編集技術によっては精度を向上させられない可能性もあります。

多様なフォーマットや条件への対応が困難

一口に書類といっても、ビジネス文書としてまとめられたA4サイズの書類もあれば、領収証やレシート、名刺といった小さいサイズの書類もあり、それぞれフォーマットも異なります。

これらの書類をスキャナで取り込みOCRで解析した場合、意図しない形にフォーマットが崩れたり、文字そのものが正しく認識されないケースもあります。

特に領収証や名刺などのフォーマットは千差万別であるため、体裁を整えて読み込んだとしても誤って認識される可能性はあるのです。

OCRの精度が不安なら専門業者への外注がおすすめ

OCRの精度に不安がある場合には、費用をかけてでも専門業者に外注することをおすすめします。

プロの業者に依頼することで、以下のようなメリットが期待できます。

高性能なスキャナーとソフトウェアを使用

専門業者は、一般には提供されていない高性能なスキャナとOCRソフトウェアを導入しています。

これにより、複雑なレイアウトや特殊なフォントの文字、あるいは手書き書類なども正確に読み取り、データ化することができます。

プロによる画像品質の管理

専門業者ではスキャンした画像のノイズ除去や傾き補正など、細かな画像処理をプロの技術で行ってくれます。

専門業者に依頼することで細かい部分まで丁寧に処理し、OCRの精度向上とデータの品質が保証されます。

時間とコストの節約

書類のスキャニングや画像処理の作業を自社で一から行うとなると膨大な手間とコストを要しますが、専門業者に依頼することでスピーディーに仕上げられます。

短期間で大量のデータを効率的に処理できれば、結果的に時間とコストの節約になり生産性も向上するでしょう。

多様な文書形式への対応

専門業者は、様々なフォーマットの文書に対応できるノウハウを持っています。

名刺や領収証、古い書類、画像・イラストが差し込まれた書類はもちろん、手書き文書や特殊なフォントの文書、外国語の文書も高い精度でデータ化できます。

徹底されたセキュリティ管理

専門業者は不特定多数の企業から依頼を受けるため、厳格な情報セキュリティ管理を行っています。

特にISO/IEC 27001やPマークなどを取得済みの専門業者は、第三者機関から万全な情報セキュリティ管理の認証を受けているため信頼性が高く、安心して依頼することができます。

関連記事:データ入力の内容とは?社内で作業するリスクと対策

スキャン代行ならプロセスマネジメントまでご相談ください

企業を対象としたスキャン代行サービスを提供している専門業者は数多く存在しますが、OCRの精度が高く安心して依頼できる業者を見極めるのは簡単ではありません。

複数の業者を候補に挙げているものの、本当に信頼できる業者が見つからずお悩みの企業様は、ぜひ一度プロセスマネジメントまでご相談ください。

プロセスマネジメントではOCRを活用した高精度のスキャニングとデータ化はもちろんのこと、名簿や名刺などに記載された情報のデータ入力にも対応しており、幅広いフォーマットの書類をデータ化することができます。

また、Pマークも取得済みでスタッフは個人情報保護士によって構成されているため、機密情報や個人情報が含まれるデータも安心して依頼できます。

安価で分かりやすい料金体系も魅力のため、まずはお気軽にご相談・お見積りをご依頼ください。

まとめ

OCRは書類に印字された文字や手書き文字をデータ化し、PCで検索・編集可能にする便利なソフトウェアです。

近年ではOCRの性能も飛躍的に向上し、90%を超える高い認識率を誇るようになりました。

しかし、スキャナで取り込む書類や読み込み方によっては認識率が低下するおそれもあり、入念な準備や加工、処理も必要です。

このような作業を効率化し、OCRの精度を向上させるためには専門の業者に依頼するのもひとつの手といえます。

信頼できる専門業者をお探しの企業様は、プロセスマネジメントまでお気軽にご相談ください。