画像処理 OCR
文字認識(OCR)技術の検証 その2 -下線削除、罫線削除の試行実験
既にラボラトリーでご紹介した文字認識(OCR)技術の検証では、MSゴシックについては、下線付きの文字もしくは罫線に囲まれた文字において認識率が低下する、という結果が出ました。
アルモニコスにおいては、様々な手法でその課題を解決しようとしています。その一つとして下線や罫線を削除するプログラムを試作しました。
罫線や下線を削除したデータに対して、文字認識がどれだけ向上するのか?をご紹介いたします。
検証パターン
上記のパターンの中から、認識結果の一部、
- 数字認識の 1-3-1~3(罫線あり・下線あり)と 1-5-1~3(罫線削除・下線削除)
- 文章認識の 2-2(罫線あり) と 2-3(罫線削除)
を抜粋してご紹介いたします。
まず、結果画像です。
数字認識の1-3-1~3(罫線あり・下線あり)のフォント3種類
数字認識の 1-5-1~3(罫線削除・下線削除)のフォント3種類
文章認識の 2-2 (罫線あり)
文章認識の 2-3(罫線削除)
続いて、結果画像の分析結果を数値化してみました。
数字認識の1-3-1~3(罫線あり・下線あり)のフォント3種類
数字認識の 1-5-1~3(罫線削除・下線削除)のフォント3種類
文章認識の 2-2 (罫線あり)
文章認識の 2-3(罫線削除)
全体考察
上記のような結果になりました。
前回ご紹介した内容通り、フォントによって結果が全く異なることが分かりました。2D図面などのPDF化した資料をOCR技術によって文字認識するプロセスが必要な企業様においては、フォントを指定したルールを社内標準化した方が良いかもしれません。
続いて、数字認識と文章認識をそれぞれ考察してみたいと思います。
まず、数字認識においては、MSゴシックが微妙な結果になりましたが、他2つのフォントにおいては罫線削除プログラムが功を奏した結果になったようです。
文章認識では、下線、罫線削除の効果は出ませんでした。
下線、罫線削除におけるOCR技術検証結果の全体考察としては、「フォントを限定すれば数字認識には効果があるが、文章認識には効果は期待できない」ということになりました。
スッキリしない結果になってしまいましたが、まだまだ課題解決のアプローチを探り続けようと考えております。
アルモニコスにおいては、このように正解がない世界を追求する研究に挑戦しています。
OCRの技術検証に関して更なる進展がありましたら、またご紹介させていただきます。
研究担当
AXION事業部 片岡慶次郎
2019年、(株)アルモニコス入社。入社以来、アルモニコス製パッケージソフトspGate、spGauge、spScanと様々なパッケージの開発に従事。
趣味は、PCゲーム、ボードゲーム。特にパズルが好きで、時折自分でパズルを考えることもある。
AXION事業部 事業部長 野口勇
2000年、(株)アルモニコス入社。アルモニコス製パッケージソフトのspGauge、spScanの開発に従事。現在は受託開発を軸に、三角形メッシュ関連の仕事にも携わっている。
趣味は、読書、ハーフマラソンとトレイルランニング。
AXION事業部 プロジェクトスーパーバイザー 山根 雅則
元国鉄職員という異色の経歴。国鉄退社後、自動車プレスの業界でプレス成形の業務(金型検査、成形シミュレーション、非接触測定機導入推進、ハイテン材成形研究、ホットプレス技術開発)に従事。
アルモニコスの製品検査ソフト「spGauge」のヘビーユーザーかつ、リバースソフト「spScan」のファーストユーザーでもあり、新バージョンの仕様提案をしてきた。ソフトウェアのユーザーから作り手になりたいと、アルモニコスに2014年入社。入社して以来、spScanの営業担当マネージャーとして、仕様決めから営業、販売、講演まで幅広く担当。
趣味は、プラモデル、シーカヤック、自動車、競技自転車など多岐にわたる。シーカヤックはインストラクターの経験あり。定年退職後に自作でログハウスを作るという夢を持ち続け、枕木300本を20年前に購入済み。
※所属・肩書は記事掲載時のものであり、現在とは異なる場合があります。