C# と VB.NET の質問掲示板

ASP.NET、C++/CLI、Java 何でもどうぞ

ログ内検索
  • キーワードを複数指定する場合は 半角スペース で区切ってください。
  • 検索条件は、(AND)=[A かつ B] (OR)=[A または B] となっています。
  • [返信]をクリックすると返信ページへ移動します。
キーワード/ 検索条件 /
検索範囲/ 強調表示/ ON (自動リンクOFF)
結果表示件数/ 記事No検索/ ON
大文字と小文字を区別する

No.29674 の関連記事表示

<< 0 >>
■29674  PDFファイルの文字列について
□投稿者/ Kei -(2008/12/12(Fri) 10:45:48)

    分類:[.NET 全般] 

    ただいま独学でVC++の勉強をしているのですが、どうしてもわからない事があるので質問させていただきました。
    PDFファイルから文字列データの内容を取得し表示するロジックを考えています。
    しかし、文字列データはFLATE形式の圧縮がかかっていて文字として認識できないため、文字化けしたデータが表示されるだけです。
    なんとか解凍したいのですが、そもそも文字列の圧縮を解凍するって可能なのでしょうか?
    FLATE形式について文献やネットで調べているのですが、これといっていいロジックが思いつきません。
    どなたが詳しい方いらっしゃいましたらご教授よろしくお願いします。
親記事 /過去ログ53より / 関連記事表示
削除チェック/

■29679  Re[1]: PDFファイルの文字列について
□投稿者/ やじゅ -(2008/12/12(Fri) 11:01:05)
>
    No29674 (Kei さん) に返信
    > なんとか解凍したいのですが、そもそも文字列の圧縮を解凍するって可能なのでしょうか?
    > FLATE形式について文献やネットで調べているのですが、これといっていいロジックが思いつきません。

    Flateアルゴリズムとは、 gzipやzipで使われているアルゴリズム

    PDF系のアプリは、zlibを使って解凍しているようですね。

    zlib アドビ PDF ファイルの Flate データをデコードできますか?
    http://dencha.ojaru.jp/programs/pg_filer_04_extra_03.html
記事No.29674 のレス /過去ログ53より / 関連記事表示
削除チェック/

■29685  Re[2]: PDFファイルの文字列について
□投稿者/ Kei -(2008/12/12(Fri) 11:19:21)
    No29679 (やじゅ さん) に返信

    お返事有難うございます!

    zlibという形式を勉強すればいいと言うことですね。
    これをうまいこと解析できれば自分でライブラリが作れるかもしれませんね…

    有難うございました。
記事No.29674 のレス /過去ログ53より / 関連記事表示
削除チェック/

■29678  Re[1]: PDFファイルの文字列について
□投稿者/ みきぬ -(2008/12/12(Fri) 10:57:43)
記事No.29674 のレス /過去ログ53より / 関連記事表示
削除チェック/

■29682  Re[2]: PDFファイルの文字列について
□投稿者/ Kei -(2008/12/12(Fri) 11:06:44)
    No29678 (みきぬ さん) に返信

    早速のお返事ありがとうございます!

    AdobeのSDKを使えばPDF操作の多くは簡単に実現できるんですよねぇ。
    ただ、それだとイマイチ勉強としてどうかなと(笑)
    今まで基本的にVBAの開発がほとんどで、DB操作とかはそれなりにやってきたんですが、バイナリを扱うとかメモリを扱うっていう視点がなかったんですよ。
    だから今回はVCを通じてそういう勉強もしたいから出来ればSDK以外の方法があればと思ってます。
    自分としてはAdobeのSDKは最終的な参考資料として、自分が作ったロジックと照らし合わせたいと思います。
記事No.29674 のレス /過去ログ53より / 関連記事表示
削除チェック/

■29680  Re[1]: PDFファイルの文字列について
□投稿者/ .SHO -(2008/12/12(Fri) 11:03:24)
    No29674 (Kei さん) に返信

    > そもそも文字列の圧縮を解凍するって可能なのでしょうか?

    可能か不可能かだけで答えるなら、もちろん可能です。
記事No.29674 のレス /過去ログ53より / 関連記事表示
削除チェック/

■29686  Re[2]: PDFファイルの文字列について
□投稿者/ Kei -(2008/12/12(Fri) 11:21:00)
    No29680 (.SHO さん) に返信

    なるほど(笑)
    可能である事はわかりましたので、やじゅさんからいただいたアドバイスを参考にもう少し調べてみたいと思います。

    有難うございました。
記事No.29674 のレス / END /過去ログ53より / 関連記事表示
削除チェック/



<< 0 >>

パスワード/

- Child Tree -