スマートリーディング / SmartOCR 1.0 ヘルプ

 

 

 

「レイアウト」 タブ



「領域の内容」

設定する領域の種類を選択します

[自動判別]
設定する領域内を自動で文章、表、絵、罫線に分割してレイアウトします。
文章、表、絵、罫線が結果として出力されます。
設定する領域に複数の種類の領域が混在していても問題ありません。
見出しは自動的には検出できません。

[文章]
設定する領域内が文章であると仮定してレイアウトを行います。
文章が結果として出力され表や絵は出力されません。

[文章+絵]
設定する領域内が文章と絵であると仮定してレイアウトを行います。
文章と絵が結果として出力され表は出力されません。

[見出し]
設定する領域内が複雑な背景を含む見出しであると仮定してレイアウトを行います。
文字成分だけを認識して文章として出力されます。

[表]
設定する領域内が表であると仮定してレイアウトを行います。
表が結果として出力され文章や絵は出力されません。

[絵]
設定する領域内が絵であると仮定してレイアウトを行います。
絵が結果として出力され文章や絵は出力されません。
設定領域内の文字や罫線は削除されます。
設定領域と交差する絵は削除されます。



「文字方向」

設定する領域の行の文字方向を指定します。

[自動判別]
設定する領域内の文章と表の行の文字方向を自動で設定します。
設定領域内に縦書き横書きが混在してもかまいませんが、複雑なレイアウトでレイアウトが失敗するときは「横書き」「縦書き」を指定してください。

[横書き]
設定する領域内の文章と表の行の文字方向を横書きに設定します。

[縦書き]
設定する領域内の文章と表の行の文字方向を縦書きに設定します。

[主に横書き]
設定する領域内の文章と表で横書きの文字行が多い場合に設定するとより正確にレイアウトできます。

[主に縦書き]
設定する領域内の文章と表で縦書きの文字行が多い場合に設定するとより正確にレイアウトできます。



「段組数」

設定する領域の文章の段落数を指定します。

[自動判別]
自動で文章の段落数を設定します。

[指定]
文章の段落数を指定します。可能な限り指定した段落数となるように段落を作成しますが結果として指定した段落数とならないことがあります。段落数を1と指 定しても段落間の関係によって必ずしも1にはならない場合があります。ページ番号や離れすぎた行がある場合には異なった段落と見なします。段落を強制的に 結合したい場合は[強制結合]を行ってください。



「ブロックの結合/分割」

設定する領域の文章ブロックを結合したり分割する条件を指定します。

[強制結合]
設定する領域内の行を強制的に結合します。
文字方向が横の場合は横方向に重なる行は全て1行に結合されます。
文字方向が縦の場合は縦方向に重なる行は全て1行に結合されます。
離れている複数行を結合したり、段落に分かれてしまったブロックを結合するときに使用します。

[段落(字下げ)で分割]
字下げがある行で段落を分割します。これにより普通は多くの段落ができますが、行ごとに改行しない場合に字下げ行の前に改行を入れることが可能になります。
改行の指定は、ファイルメニューー認識結果の保存オプションー保存設定ーテキストで行ってください。自然改行を選択すると文章単位での改行の出力が可能です。

[タイトルで分割]
タイトル行で文章ブロックを分割します。



「下線を削除」

指定する領域内の文章中に現れる下線が文字と接触している場合はこのスイッチがオフであると文字は正しく認識されません。このスイッチがオンの時は文章中の下線と接触している文字が正しく認識されます。



「認識信頼度の低い行を削除する」
レイアウト処理中に文字数の少ない行を認識して結果の悪い行を削除します。
この処理は簡易的な処理で「認識ー認識信頼度が低い行の処理」と比較すると精度が高くありません。普通はオフにして使用してください。