スマートリーディング / SmartOCR 1.0 ヘルプ

 

 

 

「認識」 タブ



「認識エンジン」
使用する認識エンジンを選択します。

[一般]
記号、数字、英字、日本語文字を認識するエンジンを使用します。

[英語専用]
記号、数字、英字を認識するエンジンを使用します。日本語文字は認識できません。


「認識対象文字」

[日英自動判別]
対象領域内の文字が日本語か英語かを自動で判別して認識エンジンを切替えます。
日本語と判定された場合は「日本語標準0」で認識します。

[指定]
認識する文字の種類を指定します。



「認識精度」

Liteではつかえません。


「日英混在認識」


[英字部分は英語認識エンジンを使用する]
チェックをはずすと、日本語の文章中に現れる英字の認識は日本語エンジンを使用します。
チェックを入れると、日本語の文章中に現れる英字部分の認識に英語エンジンを使用します。
チェックを入れると日英混在文章の認識率が上がりますが、処理時間もわずかですが長くなります。



「認識信頼度が低い行の処理」


[削除しない]
絵の中の意味がない部分を認識結果として出力したり、レイアウトを失敗して行の取得ができなかったときに文章として意味のない結果が出力される場合があります。
結果が悪くても認識してほしい場合に使用してください。
「スマートリーディングー認識による自動行削除オフ」と連動しています。

[削除する]
認識結果に文章として意味がなかったり画像の品質が悪く認識結果を出力しても修正の手間のほうが多いと判断した場合に、自動的に行を削除します。

[再認識する]
認識結果に文章として意味がなかったり画像の品質が悪く認識結果を出力しても修正の手間のほうが多いと判断した場合に、さまざまな方法でレイアウト・認識を再試行して良い結果を出力します。再試行が失敗した場合に自動的に行を削除します。
「スマートリーディングー認識による自動行削除オン」と連動しています。



「学習文字の後処理を有効にする」

認識の最後の処理としてある規則に従い文字列を操作したり文字のサイズを考慮して文字の認識結果を入れ替えたりします。このスイッチをオフにすると学習し た文字として認識された文字の後処理をスキップします。つまり学習文字にヒットした場合は学習結果がそのまま出力されます。例えば、「っ」を小文字の 「っ」として学習して、大文字の「つ」の認識が学習した「っ」に認識された場合、このスイッチがオンだと後処理が働いて「つ」に変換されますが、オフの場 合は「っ」のまま出力されることになります。



「自動白黒反転を行う」

設定する領域内の文字と背景が反転している部分を自動で識別して認識します。
反転領域が全くない、あるいは反転領域は認識する必要がない場合には、処理速度を高めるためにオフに設定してください。(オンでも問題はありません)
「認識設定ー出力ー色情報を出力する」がオンの時は文字色と背景色を正しく出力できます。
「認識設定ー認識ー認識信頼度が低い行の処理ー再認識する」あるいは「認識設定ースマートリーディングー認識による自動行削除」をオンにすると精度が高くなります。