画像処理 OCR
文字認識(OCR)技術の検証
現在、株式会社オルトア様との協同研究において、文字認識(OCR※)の技術検証をしています。
世の中にはすでにOCRエンジンが多数出ています。画像処理だけで行うエンジンもあれば、AIを駆使して動作するエンジンもあります。いずれにせよ、OCRという要素技術では、文字の状態によって得意不得意があるようです。
※OCR:Optical Character ReaderまたはRecognition
今回は、あるOCRエンジンの検証をしました。テスト対象は2D図面の画像データです。
世の中にある様々なOCRエンジンにおいても、処理の難易度はほぼ同様になるのでは?と考えています。
- フォントの違い
- 傾斜付き文字
- 下線付き文字
- 枠線付き文字
- 癖の強い手書き文字
上記のような文字の状態(条件)の違いによるOCRエンジンの検証結果の一部をご紹介します。
フォントの違いによる認識率の検証
条件
- 検証対象の文字列は、実際に2D図面で使用されている下記の例文を使用しました。
- 対象フォントは下記のWindows標準フォント5種類。
- フォントの違いだけでなく、使用した文字列認識技術では「日本語のみ」、「日本語+英語(優先言語:日本語)」、「英語+日本語(優先言語:英語)」の設定が可能だったため、設定ごとの認識率も確認しました。
検証結果
検証結果は下記一覧のようになりました。
調査したWindows標準フォントにおいては、70%以上で大きな差はないものの、BIZ UD明朝の「日本語のみ」と「日本語+英語」の設定が一番認識率の高い結果になりました。
BIZ UD明朝の文字列:誤認識の例
記号: /(スラッシュ)、±(プラスマイナス)、□(四角枠)、▼(黒下向き三角)、+(プラス)を誤認識
文字:カタカナの「バ」を「パ」に誤認識など。
傾斜付き文字、下線付き文字、枠線付き文字の位置特定技術についての認識率の検証
条件
- 文字列の15°ピッチで傾けた13パターンで検証
- 「寸法値のみ」、「寸法に枠線、下線あり」で検証
- 対象フォントは、フォント違いの検証で使用したWindows標準フォント5種類。
検証結果
抽出レベルを4段階①~④で評価しました。
「レベル①:寸法値全体を1つの文字列として認識」できることがベストですが、「レベル②:寸法値全体を複数の文字列として認識」ができれば、後処理で文字の結合は可能になります。
調査したWindows標準フォントでは①、②を合わせると100%の認識率になりました。
枠線、下線があるほうが①の認識率が高くなるフォントなど、大変興味深い結果になりました。
数値の桁数と下線有無、癖の強い文字に対する認識率の検証
条件
- 整数値、小数点以下の桁数を変えたテストデータ8種類
- Windows標準フォント「MSゴシック」、癖の強いフォント例として、フリーフォント「GN曲線ストロークフォント」、「櫻井幸一フェルトペンフォント」で検証
- 文字サイズ3種類、「小」、「中」、「大」
- 数値に下線有無
- 「日本語+英語」、「英語のみ」の条件設定
検証結果
MSゴシックの下線無しでは文字サイズの影響は少なく、整数1文字だけの認識ができていません。
下線付きの場合は認識率が大幅に低下する結果に、また、癖の強いフォントでは条件の違い以前に、認識ができない結果になりました。
今回のOCRエンジン検証は、上記のような結果となりました。
手書き文字の検証については、検証結果が整理できたところで、このラボラトリーに追加掲載します。
OCRエンジンは今後も進化し続けていくでしょう。アルモニコスも引き続きOCRエンジンの進化に伴った検証を進めていきたいと思います。
研究担当
株式会社オルトア 須藤 享明 氏
2001年に株式会社オルトアへ入社。
同2001年より、アルモニコスの開発プロジェクトに参画。長期間にわたり、パッケージソフトspGaugeの開発に参加した後、spScan、ClassNK-PEERLESSの開発に参加。アルモニコスのほぼすべてのパッケージ開発に参加している古株的存在。
趣味は、食べることとウォーキング。
※プロフィール画像は奥様が描かれた似顔絵。
AXION事業部 プロジェクトスーパーバイザー 山根 雅則
元国鉄職員という異色の経歴。国鉄退社後、自動車プレスの業界でプレス成形の業務(金型検査、成形シミュレーション、非接触測定機導入推進、ハイテン材成形研究、ホットプレス技術開発)に従事。
アルモニコスの製品検査ソフト「spGauge」のヘビーユーザーかつ、リバースソフト「spScan」のファーストユーザーでもあり、新バージョンの仕様提案をしてきた。
ソフトウェアのユーザーから作り手になりたいと、アルモニコスに2014年入社。
入社して以来、spScanの営業担当マネージャーとして、仕様決めから営業、販売、講演まで幅広く担当。
趣味は、プラモデル、シーカヤック、自動車、競技自転車など多岐にわたる。シーカヤックはインストラクターの経験あり。
定年退職後に自作でログハウスを作るという夢を持ち続け、枕木300本を20年前に購入済み。
株式会社アルモニコス 代表取締役社長 森川滋己
1988年、(株)アルモニコス入社。
入社以来、「点群、ポリゴン、自由曲線、自由曲面」を扱う形状処理技術に従事。特許出願、多数。アルモニコス製パッケージソフトspGate、spGauge、spScan、ClassNK-PEERLESSの企画および立ち上げを牽引。
1999年、取締役に就任。2014年、代表取締役社長に就任。
趣味は、読書、釣り、ゴルフ、サーフィン。
※所属・肩書は記事掲載時のものであり、現在とは異なる場合があります。