身近になったOCR機能を有効活用

OCRという言葉をご存じでしょうか？ネットで検索すると光学文字認識とありますが、要は画像上に含まれている文字を認識してテキストデータ化する技術となります。場合によってはPDFなどにも使われるようですが、最近ではこのOCR機能がかなり身近となり、誰でも容易に使えるようになっています。

Windows 11の24H2からは標準の画像ビューアのフォトにOCR機能が追加されましたが、それより前にWindows付属キャプチャソフトのSnipping ToolにはOCR機能が搭載されていました。10の場合、Snipping ToolにOCR機能がありませんが、フォトにはOCR機能が追加されています。

筆者がOCR機能を最も活用している場面は下のようにパソコンの操作で何らかのエラー画面が表示された時になります。海外製のソフトウェアだとエラー画面の内容は英語となっている事が多く何のエラーなのかが分からないのでテキストをコピーして翻訳したい所ではありますが、一部の例外を除いて殆どの場合は表示されているテキストをコピーする事が出来ません。

そんな時、一旦エラー画面をスクリーンキャプチャして画像として保存しておき、フォトやSnipping ToolからOCR機能を使用すると、画像内のテキストを容易に抽出する事が出来ます。

また、日本語訳の無い海外製のソフトウェアを使用する際の画面内のメニューや説明文などを、同じ方法でテキスト抽出して機械翻訳にかければソフトウェアの機能をより理解して使用出来るようになります。

OCR機能の利用で最も多いのは印刷物をスキャンして取り込んだ画像データからテキストを抽出する用途だと思われますが、意外にも縦書きの文書の画像でもフォトでテキストを抽出する事が出来ました。ただ現状では右から左に構成されていると認識されず、左から右読みとしてコピーされる問題があります。

他、文字の認識においては英数字と比べて漢字の混じる日本語の文章では精度がかなり落ちる印象があり、テキストデータとして抽出した際に全く異なる文字に置き換わっていたり不自然なスペースが挿入されていたりといった事も多々あります。

パソコンだけでなく最近ではスマホでGoogle レンズを使って食品のラベルの写真から文字を抽出して記載されている成分を検索したり、外国語の記載を即翻訳したりといった事もOCR技術の進歩で簡単に出来るようになりました。物によっては精度面で若干不安な部分もありますが、是非OCRを積極的に活用してパソコンの利便性の向上や生活にお役立て下さい。