OCR WORLDOCRワールドは、様々な文書の活用&管理ソリューションを
目的としたソフトウェアの総合情報サイトです。
EPSON
TOP製品情報体験版ダウンロード購入案内サポートユーザー登録

Document Solution〜日本語/英語活字OCRソフト〜 購入のご案内
製品紹介トップへ戻る

特長1 高精度OCR
特長2 情報活用支援特長3 業務効率UP
新機能のご紹介製品ラインナップ


機能一覧

動作環境

動作確認スキャナ

PDFカタログ

無料体験版

Special Contents
認識サンプル事例集
読んde!!ココが選ばれる理由
活用事例

EPSONのドキュメントソリューションとシームレスな連携を実現!!
お買い得パックが新登場!EPSONのファイル管理・検索ソフトとセットに!

EPSON製スキャナをお持ちの方
特長1-高精度OCR-/圧倒的な認識精度を誇る最新の「インテリジェントOCRエンジン」搭載

つぶれやかすれ文字にも強い「インテリジェントOCRエンジン」搭載

約24万6千語(日本語:約18万4千語 英語:約6万2千語)を収録した充実の言語解析辞書を搭載。さらに、知識辞書と形態素解析の2段階の言語処理(認識後の後処理)を行うことで、高い認識精度を実現しています。また、FAX原稿に多く見られる「つぶれ/かすれ文字」や新聞や雑誌に見られる「白抜き/網掛け文字(見出し文字)」専用のOCRエンジンも搭載することにより、認識精度を高めています。

認識例

英語文書や数値データで高い認識精度実現する「ABBYY社製英語OCRエンジン」搭載

英語文書だけでなく、日本語と英語が混在している文書や数値データにおいても高い認識精度を実現しています。

充実した辞書機能で認識処理をサポート

言語解析辞書と併用することで、認識精度をさらに高めることができる3種類の辞書機能(認識辞書/誤りパターン辞書/単語辞書)と、専門用語辞書<31分野22万語>※を搭載しています。原稿に合わせて使い分けることで、専門文献や低品質原稿における認識精度をさらに高めることができます。

※技術文献や法学文献などの専門分野のOCR処理にて威力を発揮します。


認識辞書

文字イメージと正しい文字とを結びつけるための辞書です。また、候補文字を利用して間違って認識された文字を修正すれば自動でユーザ認識辞書に登録する「インテリジェント辞書学習機能」も搭載しているので、辞書登録作業も効率的に行えます。

例 「眞」という文字イメージが「真」と認識される場合には「眞」という文字イメージを「眞」という正しい文字と結びつけて辞書に登録することで、正しく認識できるようにします。

誤りパターン辞書

特定の単語で常に一定のパターンで誤って認識される文字に対して正しい文字を結びつけるための辞書です。

例 「改革」と処理されるはずの文字が常に「改草」と処理され、誤って認識した「草」の候補文字に「革」がない場合に、「草」は「革」かもしれないということを誤りパターン辞書に登録しておくことで、単語処理によって、認識できるようにします。

単語辞書

認識処理によって正しく処理されない単語を単語辞書に登録されている単語と照合し、間違ったパターンの候補文字に単語辞書に登録された単語の文字がある場合に正しい単語に結びつけます。

例 「改革」が「改草」とよく間違える場合、間違えている文字「草」の候補文字に「革」がある場合、「改革」を単語として辞書に登録することで、言語処理によって、正しく認識できるようにします。

専門用語辞書

医学や法学といった31分野22万語の専門用語辞書を収録しています。技術文献や法学文献などの専門分野でのドキュメント認識に威力を発揮します。

専門用語辞書収録分野一覧

法学(約32,700語)
医学基礎(約15,000語)
外科・整形外科(約10,900語)
内科・小児科(約7,900語)
脳神経・薬理・生理学(約6,800語)
麻酔科・救急医療(約5,000語)
歯科(約5,500語)
薬学(約4,800語)
バイオテクノロジー(約7,000語)
化学基礎(約7,500語)
金属・セラミックス(約6,100語)
プラスチック(約6,600語)
物理学(約5,500語)
原子力(約5,000語)
電気工学(約6,500語)
電子・通信工学(約7,400語)
コンピュータ(約11,100語)
機械工学(約7,600語)
自動車(約10,100語)
造船工学(約7,000語)
航空・宇宙工学(約5,400語)
管理工学(約4,900語)
土木工学(約4,400語)
建築工学(約7,300語)
経済(約4,900語)
金融・証券(約7,400語)
商業・貿易(約6,100語)
特許(約3,800語)
環境(約2,600語)
福祉(約2,500語)
料理(約2,100語)

かすれが多い罫線の領域抽出精度を高める「新領域抽出モジュール」搭載

新領域抽出モジュール(かすれ領域抽出機能)を利用して、認識領域抽出時に画像にぼかし処理を行うことで、罫線のかすれなどを低減し、罫線が多い原稿におけるレイアウト解析精度を高めることができます。

※原稿によっては、効果に差が出る場合があります。

モジュール前
▲モジュール前
モジュール後
▲モジュール後

低品質原稿のレイアウト解析精度を高める「カラーメモ除去」機能

コピーやFAX原稿に多く見られるスキャン時のゴミ画像や、赤ペンなどで記入した手書きメモ部分を自動で取り除き、認識精度をより高めます。また、ノイズ除去機能(カラー原稿にも対応)においては、新アルゴリズムを搭載することで、必要な情報への影響を最小限に抑えています。

※原稿によっては、効果に差が出る場合があります。

「カラーメモ除去」機能使用前
▲「カラーメモ除去」機能使用前
「カラーメモ除去」機能使用後
▲「カラーメモ除去」機能使用後

表組原稿の認識精度を向上させる「表OCR機能」

表組の認識精度をさらに高める機能を搭載。セル位置、文字サイズ、罫線種も元原稿に近い形で再現できます。


セル単位での文字種/データ種別指定


AI Smart Scanパネル
▲文字種/データ種別設定画面
機能使用後表のセル単位で、認識する文字種およびデータ種別(住所、TEL/FAX、数値、金額)の指定を行うことができるため、表組原稿の認識精度を高めることができます。


表罫線編集機能

さらに、自動解析できないような複雑な表の場合でも、[表罫線編集機能]を利用して、罫線の設定(追加・削除)を行うことで、表レイアウトの再現性を高めることができます。

定型文書の認識精度を高める「認識枠の保存」機能

同一レイアウトの文書を大量にOCR処理を行う場合、あらかじめ認識枠の情報を保存しておき、OCR処理時に利用することで、認識精度を高めるほか、作業効率を向上させることができます。また、連続処理時に起こりやすい原稿のずれを低減する「認識領域補正機能」も搭載しています。


OCRに適した画像取り込みを行える専用スキャンユーティリティ搭載

AI Smart Scanパネル
▲AI Smart Scanパネル
取り込み専用スキャンユーティリティ「AI Smart Scanパネル」を利用すれば、画像諧調、解像度、原稿サイズはもちろん、雑誌や新聞などの原稿種別に応じた濃度設定も簡単に行え、認識精度をより高めることができます。また、一定間隔で連続してスキャンニングできる「間欠スキャン機能」も搭載しているので、大量原稿も効率的に取り込めます。
対応機種は動作確認済みスキャナ一覧を参照。その他スキャナは、各社TWAINドライバでの取り込みとなります。
このページのトップへ