スマートリーディング / SmartOCR 1.0 ヘルプ

 

 

 

「画像入力」 タブ



「デジカメ画像に適した補正を行う」

原稿をデジタルカメラで撮影した場合、ゆがんでいたり、背景が濃くて文字が読めなかったり、文字が小さかったり、光量不足や手ぶれのため文字がぼけている等で、文字認識が非常に難しく実用的な結果が得られません。
特殊な2値化や画像補整を適用することで従来のOCRでは認識率の低かったデジカメ画像の認識を実用的に行うことが可能です。



「認識に最適なサイズに自動拡大する」
デジタルカメラでの撮影や、低い解像度でのスキャナー読込みでは、文字のサイズが小さくなり文字認識の精度は悪くなります。SmartOCR では、この問題の解決策として「スマート画像拡大」機能を用意しました。原稿全体の文字サイズや品質を考慮し認識率が高くなるように最適化された画像を作 ります。この機能をオンにして原稿を読み込むと自動的に最適化された原稿が作成されます。
白黒原稿でも効果がありますが、主にカラー・多値原稿で威力を発揮します。
この機能によって 75% の認識率が 96% まで上がる原稿もあります。



「2値化方式」
カラー原稿は白黒原稿よりも情報量がはるかに多いため、カラー専用の処理を上手に行えば、より良い結果が得られます。
SmartOCRでは、認識率に大きく影響する2値化に力を入れました。
改良型判別2値化、分割判別分析2値化、文字輪郭2値化、文字分布2値化、ニブラック2値化等を実装しました。
それぞれ性能や処理速度に一長一短があるため1枚1枚効果を確かめながらの作業では大きな効果が期待できますが、自動処理には不向きです。そこで、原稿に 最適な2値化を自動選択する機能も追加しました。原稿の領域ごとの状態に合わせて様々な2値化を組み合わせて最適な2値画像を作成します。

[自動]
最適な2値化を自動で行います。
汎用的なものですので、特定の画像に対しては最適な2値化法を手動で設定するほうが良い結果が得られる場合があります。

[判別自動]
判別方式の2値化を自動化したモードです。

[改良型判別分析]
多値のヒストグラムをベースに2値化を行います。画像全体で2値化のしきい値を決定するため、背景の濃度や文字の濃度に変化がある場合には不向きですが、背景の濃度が一定のシンプルな画像では良い結果が得られます。処理は最速です。

[分割判別分析]
画像全体を小さな領域に分割し同類の背景濃度を持つ領域を集め改良型判別分析を用いて個々のピクセル単位で2値化のしきい値を求めます。
ほとんどの画像に適応し、処理は中速です。

[文字輪郭]
文字の輪郭周辺の濃度変化から個々のピクセルの2値化のしきい値を求めます。
速度は画像の複雑度に依存します。

[文字分布]
文字の分布状態を基に個々のピクセルの2値化のしきい値を求めます。
背景と文字の濃度差がない原稿を唯一2値化可能ですが、絵や大きな文字が消えやすい欠点があります。速度は低速です。

[ニブラック]
個々のピクセルの周辺状態から2値化のしきい値を求めます。
雑音が発生しやすい欠点がありますが、汎用性が高いのが特徴です。速度は低速です。



「自動用紙方向補正」

[自動判別]
画像読込み時に用紙方向を自動で検出して回転補正を行います。
精度は極めて高いため常時オンでの使用をおすすめします。

[なし]
画像読込み時に回転補正を行いません。

[90度・180度・270度]
画像読込み時にそれぞれ時計回りに90度・180度・270度の回転補正を行います。



「自動傾き補正」

[なし]
画像読込み時に傾きの補正を行いません。


[全面]
画像読込み時に画像全体の傾きを検出して傾きを自動で補正します。
精度は極めて高いため常時オンでの使用をおすすめします。

「認識設定−レイアウト−文字方向」が[自動判別]の時は画像の文字方向を検出後傾きの補正を行います。[横書き」あるいは[主に横書き]の時は横書き用 の傾き補正を行います。[縦書き」あるいは[主に縦書き]の時は縦書き用の傾き補正を行います。
ほとんどの場合[自動判別]で傾き補正が失敗することはありません。
画像読込み時の傾きの補正は文字方向の設定に影響を受けるため、読込み時の文字方向は[自動判別]が一般的ですが、横書き原稿を処理する場合に[横書き」あるいは[主に横書き]に設定すると傾き補正の精度は上がります。
注意が必要なのは、横書き原稿を処理する場合に[縦書き」あるいは[主に縦書き]に設定すると傾き補正は正しく機能しません。

[見開き]
画像読込み時に画像が見開き原稿であると仮定して見開き原稿の中心線を自動で検出し左右それぞれを傾き補正します。自動用紙方向補正がオンの時は、見開き原稿をどのような方向でスキャンしても見開き傾き補正は正しく行われます。



「自動ノイズ除去」
原稿に含まれる認識に有害な雑音を効果的に削除します。従来のOCRのようにサイズで削除するのではなく、近くに文字があるかどうか、どの程度の密度で雑音が集まっているか等を考慮して、濁点など文字の一部を消さないように配慮しています。



「画像読込後の自動処理」
画像を読み込んだ際に、指定の処理を自動実行します。
「なし」の場合は何もしません。
「レイアウト解析」の場合は、画像読み込み後、レイアウト解析を自動実行します。
「認識」の場合は、画像読み込み後、認識処理を自動実行します。