スマートリーディング / SmartOCR 1.0 ヘルプ

 

 


認識結果の修正


エディタの表示モード


エディタには 3 種類の表示モードがあります。
再現モード、横書きモード、縦書きモードです。
エディタウインドウのツールバーの「表示モード」もしくは、表示メニューの「エディタ表示モード」で切り替えます。

再現モードは、元画像と同様のレイアウト配置を行って、認識結果でできる限り元画像を再現しようとするモードです。
表示倍率の変更、文字色の再現、絵領域、罫線の描画ができますが、文字種ブラウザは使用できません。

横書きモード縦書きモードは、通常のテキストエディタと同様の修正環境を提供するモードです。
行番号表示、ブロック番号表示、文字種ブラウザによる文字種別の色つけができます。

エディタの表示モードに関わらず、エディタ内の文字結果をクリックしてカーソルを合わせると、ステータスバーに文字の認識候補と現在のエディタ内の全文字数とカーソル位置の文字位置が表示されます。
また、画像ウインドウズームウインドウの該当文字位置に選択したことを示す文字枠が表示されます。


再現モード


再現モードでは、認識結果を画像上の位置と同等の位置に配置します。
この配置は、行単位で行われますので、実際の画像上の文字位置とは一致しない場合があります。

各ブロック内では通常のテキストエディタでの編集とほぼ同等の操作で編集を行えるようにしています。

再現モードでは表示倍率を変更することができます。
また、メインメニューの「表示」の「表示倍率の連動」をチェックすることにより、画像ウインドウの表示倍率と、表示倍率を連動して変更することができます。

文字色と背景色は、メインメニューの「表示」の「文字色の表示」で ON/OFF を切り替えることができます。

絵領域は、メインメニューの「表示」の「絵領域の表示」で表示を ON/OFF を切り替えることができます。


横書きモード、縦書きモード


横書きモード、縦書きモードは、通常のテキストエディタと同等にお使いいただけます。

横書きの場合は左から、縦書きの場合は上から、行番号、ブロック番号、本文です。
行番号はメインメニューの「表示」の「行番号の表示」で、ブロック番号はメインメニューの「表示」の「ブロック番号の表示」で表示を ON/OFF できます。
行末には矢印で改行が表示されてます。これもメインメニューの「表示」の「改行コードの表示」で表示を ON/OFF できます。


候補メニュー


エディタ上の文字をマウスで左クリックしてカーソルを合わせ、右クリックすると、候補メニューが表示されます。

一文字選択して候補メニューを開いた場合は、その文字の認識候補および、文字に対する操作として、文字の分割、削除、学習メニューが表示されます。

複数文字を選択してから右クリックすると、選択した文字が 5 文字以内ならば同じく候補メニューが表示されます。
この場合は、選択した文字を一つの文字と見なして再認識された認識候補と、文字に対する操作として、削除、学習メニューが表示されます。

認識候補をクリックした場合は、その候補が正しい認識結果として現在の認識結果と置き換えられます。
複数文字を選択した場合は、選択されている文字全てが、一文字の候補に置き換えられます。

削除を選択した場合は、選択された文字全てを削除します。

文字の分割、学習を選択した場合の動作は後述します。

メニュー以外の場所を左クリックすれば、メニューを閉じて編集に戻ります。


文字の分割


候補メニューで文字の分割を選択すると、「候補文字の分割」ダイアログが開きます。

文字が 1/1 サイズで表示されます。その上に表示されている青い線が分割線です。
文字画像上にマウスカーソルを合わせると、マウスカーソルに追従して分割線が移動しますので、分割したい位置に合わせて左クリックします。
分割線の座標ロックが行われ、分割した場合の認識結果が表示されます。これでよい場合は「OK」ボタンを押せば、分割を実行します。
分割位置の指定をやり直す場合は、再度左クリックすれば座標ロックが解除されます。

分割の方向は、文字が横書きの場合は左右、縦書きの場合は上下分割になりますが、分割方向を選択するか、マウスの右クリックで分割方向を変更することができます。


文字の学習


候補メニューで文字の学習を選択すると、「認識学習辞書の登録」ダイアログが開きます。

選択された文字が 1/1 サイズで表示されます。
「文字」の欄に、正しい文字を入力して、「登録」ボタンを押せば、学習が行われます。
「文字」欄は、最大 20 文字まで有効です。また、半角文字を入力した場合、全て全角文字に変換されて、学習が行われます。

「登録辞書」は、日本語認識エンジン用の日本語辞書、もしくは、英語認識エンジン用の英語辞書のいずれかに登録するかを選択します。
英語文書を認識していて、「認識設定」サブウインドウの「認識」タブで、「認識エンジン」を「英語専用」にして認識を行った場合は、英語辞書を選択してください。

学習した文字の一覧を見るには、メインメニューの「ツール」の「日本語学習辞書の選択と管理」、「英語学習辞書の選択と管理」から行うことができます。

なお、学習を行った場合でも、学習の結果が優先されず、他の認識結果になってしまう場合があります。ご了承ください。


文字種ブラウザの使用


エディタの表示モードが「横書き」と「縦書き」の場合は、サブウインドウの「文字種ブラウザ」を使用して、認識結果を文字種毎に色分け表示することができます。
これにより、数字の「1」とアルファベット小文字の「l」、ひらがなの「り」とカタカナの「リ」等の区別を行いやすくできます。
また、文字種ブラウザでは、認識結果の認識信頼度により色分けを行うことができます。

標準状態では、エディタの表示モードを「横書き」か「縦書き」にすると、文字に色が付いて表示されます。
これを変更するには、サブウインドウの「文字種ブラウザ」を表示してください。
その中で、「文字種」タブを選択すると、文字種毎に色づけが、「認識信頼度」タブを選択すると、認識文字の認識信頼度に応じて色づけが行われます。

「文字種」タブを選択している場合、「ひらがな」、「カタカナ」、「英数字」、「漢字・記号」についてそれぞれ色分けを行うことができます。
それぞれの項目で、左のチェックボックスがチェックされている場合はその文字に指定された色が付きます。
チェックされていない場合は黒になりますが、「ひらがな」、「カタカナ」の「濁音」、「半濁音」、「小文字」は、チェックされていなくても、それぞれ「ひらがな」、「カタカナ」にチェックがついていれば、その色で表示されます。
文字種右側に表示されている表示色のボタンを押すと、「色の設定」ダイアログが開き、表示色を変更することができます。

「濁音」は「ばびぶべぼ」など、「半濁音」は「ぱぴぷぺぽ」など、「小文字」は「ぁぃぅぇぉっゃゅょ」を指します。

「認識信頼度」を選択した場合、信頼度の指定を変更することで、その信頼度以下の文字に指定の色づけを行います。
文字をクリックした際、ステータスバーに表示される文字候補の右側に表示されているのが文字の認識信頼度です。
最大 100 から 0 までの範囲の値を取ります。数字が高いほど、認識結果の正しい可能性が高いことを表します。
エディタで新しく入力した文字の信頼度は 100 になります。

なお、認識信頼度は、実際に認識結果が正しいことを保証するものではありません。あくまで目安としてご利用ください。


エディタの表示フォントの変更


エディタの表示フォントは、日本語横書きフォント、日本語縦書きフォント、英語(半角文字)フォントの 3 種類を使い分けています。
これらは、メインメニューの「ツール」の「環境設定」の「フォント」タブで実際に使用するフォントを変更することができます。