スマートリーディング / SmartOCR 1.0 ヘルプ

 

 

画像補正



処理の参照


読み込み後の画像に対してよい認識結果が得られるようにさまざまな補正を行います。


「用紙方向回転」

用紙の方向が正しくないとレイアウト解析・文字認識は失敗します。
読み込み時に自動補正することをお勧めします。デフォルトで行われます。
用紙回転の自動補正の精度は非常に高いのですが文字数が少ない、絵の領域が多いときに失敗することがあります。その場合は手動で補正します。


「傾き補正」

用紙の傾きが大きいとレイアウト解析・文字認識は失敗します。
読み込み時に自動補正することをお勧めします。デフォルトで行われます。
用紙傾きの自動補正の精度は非常に高いのですが文字数が少ない、絵の領域が多いときに失敗することがあります。その場合は手動で補正します。


ゆがみ補正

デジカメで撮影した原稿は、撮影の位置によりゆがみが発生しやすくレイアウト解析や認識の失敗の原因になります。
文字部分がわからないような暗い画像ではゆがみの補正は非常に困難です。
コントラストのはっきりした手ぶれのない撮影画像では良い補正結果が得られます。
「自動ゆがみ補正」を行ってゆがみが補正されないときは「画像編集−元に戻す」で画像を復元してから「ゆがみ抽出」「ゆがみ補正」で補正します。
「ゆがみ抽出」はゆがみの形を表す「ゆがみフレーム」を自動で作成します。
「ゆがみフレーム」の形が実際のゆがみと一致していたらそのまま「ゆがみ補正」を実行します。「ゆがみフレーム」が実際のゆがみと異なる場合は「ゆがみフ レーム」を手動で修正します。4頂点をドラッグしてゆがみの形を作成します。修正後に「ゆがみ補正」を実行します。


「自動ノイズ除去」

ノイズはレイアウト解析や認識に悪い影響を与えます。
原稿に含まれる認識に有害な雑音を効果的に削除するのが「自動ノイズ除去」機能です。従来のOCRのようにサイズで削除するのではなく、近くに文字がある かどうか、どの程度の密度で雑音が集まっているか等を考慮して、濁点など文字の一部を消さないように配慮しています。



「ノイズ除去...」

このボタンをクリックすると「ノイズ除去・プレビュー」ウインドウが表示されます。
強度を変更すると表示画像にノイズ除去後の補正結果が表示されます。望む結果が得られたら「OK」をクリックしてください。画像ウインドウに補正画像が表示されます。
「キャンセル」をクリックすると補正は行われません。
強度の単位はミリメートルでノイズの縦と横を加えた値以下のノイズを除去します。


「全面白黒反転」

読み込まれた画像が白黒原稿のときに使用可能になり白と黒を反転します。
自動白黒反転認識の機能があるため使用する頻度は高くありません。


「自動画像拡大」

デジタルカメラでの撮影や、低い解像度でのスキャナー読込みでは、文字のサイズが小さくなり文字認識の精度は悪くなります。SmartOCR では、この問題の解決策として「スマート画像拡大」機能を用意しました。原稿全体の文字サイズや品質を考慮し認識率が高くなるように最適化された画像を作ります。
白黒原稿でも効果がありますが、主にカラー・多値原稿で威力を発揮します。
この機能によって 75% の認識率が 96% まで上がる原稿もあります。


「ガンマ補正...」

画像の濃淡レベル補正の一種でガンマ値が1以上で高コントラスト(明暗のある)の画像が、1以下では低コントラスト(明暗のない)の画像が得られます。
ガンマ値の範囲は 0.1 から 5.0 までです。



「コントラスト補正...」

明暗の差をコントラストと呼び、明暗の差を大きくしたり小さくしたりする処理をコントラスト補正といいます。背景と文字の濃度さが小さく文字が見にくいと認識も悪くなります。補正後には指定された2値化が行われます。
強度の範囲は 0.1 から 1.0 までです。値が大きくなると補正が弱くなります。


「トリミング」

指定した領域を切り出して1枚の原稿として処理します。
処理モードが「画像編集領域指定」で領域が指定されたときに有効になります。
指定された領域を切り出して元の画像と置き換えます。
トリミング以降の処理はすべてトリミング画像に対して行われます。