|
■No54541 (田中ソフィア さん) に返信 > ■環境 > ・ファイルのエンコーディング(ISO-8859-1) > ■ファイルの中身 > 日本語全角文字 まず前提条件がおかしい気がします。ISO-8859-1 には漢字やひらがなが含まれていないので、 仮名漢字テキストであるのなら、そのファイルのエンコードは ISO-8859-1 では無いハズですが…。
> ■出力結果(一部抜粋) > \\u30c7\\u30fc\\u30bf\\u306e\\u691c\\u7d22\\u306b この文字列は『データの検索に』でしょうか。
エンコードが不明なテキストファイルがあり、その内容が 4 バイトの 1c,69,22,7d だった場合、 UTF-16 と仮定してデコードすると『検,索』の漢字 2 文字 ISO-8859-1 と仮定してデコードすると『{FS},i,",}』の 制御文字1文字 + 英数3文字 ですね。デコードとエンコードが違っていれば、データは化けてしまいます。
> FileReader in = new FileReader(fileName); java.io.FileReader だと、読み込み時の文字コードを明示的に指定できないようなので、
InputStreamReader in = new InputStreamReader(new FileInputStream(fileName), charset );
を使ってみては如何でしょうか。
|