C# と VB.NET の質問掲示板

わんくま同盟

ASP.NET、C++/CLI、Java 何でもどうぞ

C# と VB.NET の入門サイト


(過去ログ 87 を表示中)
■51637 / )  Re[5]: 画像の文字読み取りコンポーネントを探しています
□投稿者/ 魔界の仮面弁士 (1699回)-(2010/07/13(Tue) 10:04:23)
2010/07/13(Tue) 10:07:11 編集(投稿者)

No51627 (オショウ さん) に返信
> ※ フォントの大きさ的に言えば、20pointは必要(日本語の場合)
20pt を必要としたということは、恐らく、元画像が 72〜96dpi 程度だったのでは無いでしょうか。
充分な解像度があれば、ポイント数の小さい文字であっても判読できる可能性が高いです。

MODI に限らず一般的な日本語 OCR の場合、最低でも 300 dpi、できれば 400 dpi 以上の
解像度を用意すると認識率が安定すると思います。白黒(あるいはグレースケール)だとなお良し。
(元データが名刺ならば、長辺が 1000〜1500ドットぐらいになる解像度です)

加えて言えば、OCR ソフトによっては、画像そのもののピクセル数だけではなく、画像データ中の
DPI 設定(BMP なら bi{X/Y}PelsPerMeter)が重要になることもあります。

なお、画面ハードコピーからの日本語認識を主とする場合には、汎用OCRソフトだけでなく、
視覚障害者対応のソフトにも目を向けておくと良いかもしれません。
# モグタン星人さんの利用目的が分からないので、どのような製品が適切なのかは分かりませんが。


No51630 (モグタン星人 さん) に返信
> レイトバインドにしたい理由は、これのバージョンに依存せずに使いたいことと、
MODI の場合、Office XP でのサポートは限定的であるため、実質、
利用可能な環境が Office 2003 または 2007 に限られると思います。
Office 2010 には含まれていないので注意してください。
http://support.microsoft.com/kb/982760/ja

> Dim doc As Object = CreateObject("MODI.Document")
インスタンスを生成できるという事は、インストールは済んでいるようですね。

> doc.Create(画像ファイルのパス)
> doc.OCR(&H11, False, False) 'ここでOCR Running errorとなる
どのバージョンをお使いですか?

Office 2003 だとしたら、とりあえず miLANG_SYSDEFAULT を試してみてください。
というのも、Office 2007 版のヘルプには、
》「Microsoft Office Document Imaging の新機能」
》OCR には、次のサポートが追加されました。
》・東アジア言語のテキストが認識されます。
という表記があるためです。

2007 を利用しているのに使えない場合は、最新版の Service Pack を適用するか、
KB951165 の修正パッチを利用してみて下さい。
http://support.microsoft.com/kb/944244/ja
返信 編集キー/


管理者用

- Child Tree -