スマートリーディング / SmartOCR 1.0 ヘルプ

 

 

認識結果の保存


認識結果の保存はテキスト形式、CSV 形式、HTML 形式、透明テキスト付き PDF 形式、Microsoft Word 形式、Microsoft Excel 形式、RTF 形式で行うことができます。
なお、Microsoft Word 形式、Microsoft Excel 形式での保存を行うためには、ご利用の PC に Microsoft Word 及び Microsoft Excel のそれぞれがインストールされている必要があります。

Microsoft Word 及び Microsoft Excel は、97、2000、2002、2003 の各バージョンで動作するように作ってありますが、すべての場合において正常に動作することは保障できません。
また、動作自体は正常に終了しても、内容出力が正しく行われない場合があります。ご了承ください。



保存の実行


認識結果を保存するには、メインウインドウの「結果保存」ボタンを押すか、メインメニューの「ファイル」から、「認識結果を保存」を選択します。
「認識結果を名前をつけて保存」ダイアログが出ますので、ファイル名、保存フォルダ、出力形式を選択してください。
ファイル名の拡張子は、選択した出力形式に従ったファイルに自動的に変更されます。

複数ファイルの認識結果をひとつのファイルに保存する場合は、ファイルブラウザで、認識が終了している画像ファイルで保存を行うファイルを選択し、ファイルブラウザの「保存」ボタンを押します。
同じく、「認識結果を名前をつけて保存」ダイアログが出ますので、ひとつのファイルを保存するときと同様に、ファイル名と出力形式を選択して下さい。



認識結果の保存設定


保存形式特有の設定を行うには、メインウインドウのツールバーの「保存設定」ボタンを押すか、メインメニューの「ファイル」から、「認識結果の保存設定」を選択します。
認識結果の保存設定ダイアログが開き、保存形式別の設定が行えます。
Microsoft Word 形式、RTF 形式では設定項目はありません。

テキスト形式
テキスト形式では、「改行出力」の設定が行えます。

なし 改行を出力しません。
行ごと 各行の終わりに改行コードを出力します。
ブロックごと ブロックの終了時に改行コードを出力します。
各行の終わりには出力しません。
自然改行 行頭に字下げが行われている行の前の行の最後に改行を出力します。
また、ブロックの終了時にも改行が出力されます。

CSV 形式
CSV 形式では、「表のみ出力する」チェックボックスで、表領域と認識された部分のみ出力するか、それ以外のすべての認識結果を出力するか選択することができます。

HTML 形式
HTML 形式では、「CSS を使用する」チェックボックスで、CSS level2 を使用するかどうか選択することができます。
出力解像度は、ページ全体のサイズを調整します。大きい数値を指定すると、出力サイズは大きくなります。
72 〜 600 dpi までの値を指定することができます。標準は 96dpi です。
単位は dpi ですが、出力のサイズが変わりますので、あくまで目安と考えてください。

PDF 形式
PDF 形式では、画像の出力解像度の設定を行うことができます。
大きい数値を指定すると、出力される画像のサイズが大きくなるため、画像の見た目はきれいになります。
72 〜 600 dpi までの値を指定することができます。標準は 144dpi です。

「文字サイズを基準にサイズ調整を行う」チェックボックスをチェックすると、画像に使用されている文字の平均文字サイズから見やすいサイズを計算して画像を拡大、縮小後、出力を行います。
チェックをはずすと、画像のサイズに従って拡大率、縮小率を計算します。

Excel 形式
Excel 形式では、「数字のみのセルは書式設定を数値として出力する」チェックボックスで、含まれる文字が数値のみのセルに対して、セルの書式設定を数値に設定するか、標準で出力するか設定することができます。
セルの書式設定を数値にすると、電話番号など、先頭が 0 で始まっている数値列は、0 の部分が省略されてしまいます。



ヘッダ項目の編集


「認識結果の保存設定」タブの「ヘッダ項目の編集」タブでは、HTML 形式、PDF 形式、Microsoft Word 形式、Microsoft Excel 形式、RTF 形式で保存される際のヘッダ項目を編集できます。

タイトル
使用される形式:HTML、PDF、Word、Excel、RTF
各形式での「タイトル」ヘッダに設定されます。
標準では、読み込んだ画像のフルパスが入ります。

題名
使用される形式:PDF、Word、Excel、RTF
各形式の「サブジェクト」ヘッダに設定されます。

作者名
使用される形式:PDF、Word、Excel、RTF
各形式の「作者」ヘッダに設定されます。
標準では、SmartOCR を使用している、コンピュータのユーザー名が入ります。

会社名
使用される形式:Word、Excel、RTF
各形式の「会社名」ヘッダに設定されます。

プロデューサー/マネージャー 使用される形式:Word、Excel、RTF
「マネージャー」欄に不可されます。

キーワード 使用される形式:PDF
「キーワード」ヘッダに設定されます。